(от греч. hom?s – одинаковый и grapho – пишу) – слова одной или разных частей речи, совпадающие в написании всех или отдельных форм, но не совпадающие в звучании и имеющие разные значения.
Статья входит в цикл публикаций материалов по русской омофонии и омографии и посвящается синтаксической их разновидности (типа ПОМИЛОВАТЬ НЕЛЬЗЯ КАЗНИТЬ с разной пунктуацией). В статье систематизируются различные типы омофонических и омографических отношений русских предложений, приводится большой иллюстративный материал с теоретическими комментариями.
Например, can – мочь, модальный глагол английского языка, и can - консервная банка;
вторая группа – это омографы... Омографами называют слова, которые имеют одинаковое написание, но разное звучание.... Однако в некоторых случаях при письме омографы точно также могут доставить некоторые трудности.
Описана методика автоматического разрешения омографии в вопросительных предложениях на основе смысловой связи с ответом. Данная методика впервые рассматривает семантические связи слов за пределами одного предложения при разрешении омографии. В качестве входных данных использовались результаты анализа семантических классов слов семантико-синтаксического анализатора Semsin. На основе данной методики был разработан программный алгоритм, позволяющий автоматически маркировать омографы SSML-тегом, который меняет акустические характеристики синтезированной речи. На специальной тестовой выборке, состоящей из сверхфразовых единств, был проведен эксперимент по оценке качества работы алгоритма, давший положительные результаты. В ходе работы также были выявлены недочеты, которые связаны с ошибками анализа семантических классов слов семантико-синтаксического анализатора Semsin и невозможностью распознавания контекста в пределах одного предложения.
комплекс методов компьютерного преобразования письменного или устного текста, основанных на многоуровневом автоматическом анализе и синтезе речи; в узком смысле (в издательской практике) под этим понятием понимают автоматизированный набор, преобразование и верстку документа.