один из методов письменного перевода, заключающийся в делении исходного текста на сегменты, извлечение из каждого сегмента доминирующей информации, ее условном кодировании, создающем опорные смысловые пункты для оформления перевода.
Однако на самом деле дескриптивный метод имеет мало общего с описательным методом.... этапов анализа языкового материала:
первый этап – сегментация;
второй этап – идентификация;
третий этап... Первый этап называется сегментацией. Он заключается в выделении в тексте языковых единиц.... С его помощью выявляют идентичные сегменты текста.... Сегментациятекста (то есть выделение в нём слов, морфем или фонем) осуществляется, как правило, посредством
Работа посвящена проблеме автоматического извлечения знаний из естественно-языковых текстов ( text mining ). Одной из первоочередных задач в рамках данной проблемы является формирование тезауруса предметной области. Существуют достаточно апробированные статистические методы извлечения терминов для алфавитных языков, например, латентный семантический анализ. Применение данных методов для иероглифического письма сопряжено с проблемой, обусловленной отсутствием в таких языках пробелов между словами. Задача сегментации предложений на иероглифических языках обычно решается либо на основе словарей, либо статистическими методами, в частности, с использованием метода взаимной информации. Методы сегментации предложений, как и методы извлечения терминов по отдельности, не обладают 100%-ой точностью и полнотой, а их последовательное применение только увеличивает процент ошибок. Целью данной работы является повышение полноты и точности извлечения терминов предметной области из иероглифических т...
Этот метод может помочь выявить ключевые слова, используемые в рекламных текстах.... Анализ тональности: метод, основанный на определении эмоциональной окраски текста.... Этот метод может помочь выявить, какие темы и концепции используются в рекламных текстах.... Анализ синтаксиса: метод, основанный на анализе грамматической структуры текста рекламного бота.... С помощью этого метода можно выявить, какие концепции и темы связаны между собой в рекламных текстах.
В работе освещается проблема выделения рукописного текста на изображении для последующего распознавания. Приводится описание широко распространенных методов сегментации, позволяющих решить данную проблему: метод цветового анализа изображений, бинарная сегментация изображений методом фиксации уровня, а также метод выделения и анализа контуров. Предложен алгоритм сегментации текста, основанный на использовании маски исходного изображения, позволяющий существенно упростить сегментацию текста на изображениях с немонотонным фоном. Также производится сравнительный анализ методов.
безэквивалентность которых обусловлена неравномерным распространением достижений в области науки и техники, в социально-общественной сфере, в результате чего некоторое новшество, присутствующее в практическом опыте носителей, некоторое время бывает неизвестно носителям языке перевода; однако затем это неравенство нивелируется, и соответствующий термин (очень часто через транслитерацию) появляется и в языке перевода.
основан на сравнении соответствующих явлений в текстах разных языков независимо от их принадлежности к той или иной языковой семье, т.е. независимо от наличия или отсутствия между ними генетических связей.