Информационные технологии в лингвистике: основные аспекты изучения
Обусловленная научно-техническим прогрессом компьютеризация общества затронула также и гуманитарные дисциплины. Информационные технологии все шире применяются в прикладных областях лингвистических исследований, которые связаны со статистическим анализом и обработкой текстов, автоматической проверкой их грамотности, вопросами обучения языку и речи, а также проблемами машинного перевода и проч.
Информационные технологии в лингвистике представляют собой совокупность технических средств, включая оборудование и программы, которые используются для изучения и моделирования языковых и речевых процессов в лингвистической науке.
На сегодняшний день аспекты, связанные с применением информационных технологий в лингвистической науке, достаточно широки и включают ряд направлений:
- Автоматизация процессов анализа текстов. Особенно востребован так называемый машинный анализ текстовой структуры, оптимизирующий ее под нужды различных поисковых систем путем вычленения ключевых слов, количества повторов и иных показателей.
- Создание и использование автоматизированных систем словарей и языковых справочников.
- Практика машинного автоматического перевода, то есть компьютерной генерации перевода текста с одного языка на другой.
- Развитие и внедрение систем дистанционного и машинного обучения языку.
- Создание программного обеспечения, способного решить вопросы дешифровки сообщений, атрибуции спорных текстов, а также выявить их уникальность.
- Разработка различных программных единиц для нужд прикладной лингвистики (например, автоматизированных систем преобразования голосовых сообщений в текстовые).
Данные направления являются востребованными в современной практике, поскольку все больше языковых процессов вовлечено в сферу виртуальной коммуникации.
Применение компьютерных технологий в языкознании
Существуют различные сферы использования компьютерных ресурсов – программных и аппаратных – для решения различных прикладных задач.
Одной из востребованных задач офисной практики является автоматическое распознавание печатного текста при его сканировании. Происходит это путем специального перекодирования графического изображения (печатных символов) в текстовый электронный документ, который затем может обрабатываться с помощью любого редактора текста. В этой области существуют свои проблемы, связанные с точностью распознавания символов, особенно с носителей плохого качества. Однако развитие этого направление достигло такого прогресса, что текст среднего качества печати может быть распознан практически без ошибок за очень короткое время.
Важным направлением в сегодняшнем информационном потоке предстает автоматический процесс аннотирование и реферирования текстов, благодаря которому пользователь может познакомиться с их содержанием в сжатые сроки, не тратя время на второстепенные детали и сразу усваивая основную информацию. Для этого используются специальные программы, позволяющие создать автоматизированные аннотации и рефераты путем их статистического, позиционного и лексико-семантического анализа. Следует отметить, что подобные программы не могут заменить собой полноценного реферата как вида анализа и преобразования текстов, поскольку нацелены на выборку наиболее информативных предложений (фрагментов) в структуре текста.
Путем внедрения в прикладную лингвистику компьютерных технологий можно проводить автоматический анализ текстов на всех уровнях – графическом, семантическом, морфолого-синтаксическом. Это автоматизированные системы составления частоты употребления букв (слов), программы, предназначенные для анализа словоформ, вычленения их флексий и их значений, а также установления характера синтаксических связей между компонентами предложений.
Наиболее сложным аспектом в направлении автоматического анализа являются вопросы, связанные с семантическим анализом текста, так как они предполагают решение проблемы распознавания машиной смысла слов в контексте. Эти вопросы тесно связаны с работой по созданию искусственного интеллекта и алгоритмов установления обратной связи между человеком и машиной.
Еще одним перспективным направлением в применении информационных технологий в языкознании является компьютерная лексикография. Печатные словари уходят в прошлое. Современный пользователь нуждается в онлайн-словарях с автоматизированным поисковым запросом, который позволяет быстро и удобно искать слово сразу в нескольких словарях (например, орфографическом, орфоэпическом, толковом и проч.).
Информационные технологии в обучении различным языкам также становятся востребованными массовым пользователем. Современное компьютерное обучение оперирует различными возможностями – от простых до достаточно сложных и продвинутых:
- Применение тренажеров, позволяющих сформировать тот или иной речевой навык.
- Создание мультимедийных платформ для обучения, на которых представлен материал, относящийся к разным видам речевой деятельности: аудиофайлы, текстовые документы для чтения и анализа, тесты, словари, грамматические справочники и проч.
- Появление и развитие виртуальных форм коммуникации между преподавателем и студентом (учащимся): онлайн-обучение, веб-трансляции.
- Учебные игры, позволяющие в непринужденной и увлекательной форме осваивать те или иные языковые навыки.
В целом в лингвистике информационные технологии занимают достаточно большое место, обеспечивая нужды общественной практики и способствуя развитию прикладных областей исследования.