Лексикография и ее основные понятия
Лексикография – одна из наиболее древних прикладных областей языкознания, которая сосредоточена на выявлении, группировке и описании языковых единиц.
Продуктом лексикографического описания является словарь, в котором отражены лингвистические единицы, а также их характеристики. Основным объектом описания является словарная статья, которая в толковых тезаурусах включает несколько участков (зон):
- Входную зону (название).
- Зону с грамматическими сведениями.
- Участок толкования, где содержится информация о значении (значениях) единицы.
- Область с примерами употребления этой единицы в различных контекстах.
- Идиоматическую зону, включающую примеры устойчивых выражений с данной лексической единицей.
Современная лексикография активно использует инструменты автоматизации процессов создания, структурирования и использование словарей, в которые входят различные тематические группы лексем. Кроме этого, технологии, используемые в компьютерной лексикографии, применяются также и в библиографической работе для ведения каталогов, картотек и иных автоматизированных баз данных.
Компьютерная лексикография и составление словарей
Наиболее востребованной частью компьютерной лексикографии является программно-аппаратное обеспечение, которое позволяет оптимизировать труд лексикографов. Традиционный формат сбора лексикографической информации – каталожная карточка, в структуру которой входят сведения о слове, его значении, употреблении в речи, а также иная информация, необходимая для истолкования значения слова. Систематизация картотек, поиск контекстов использования слов – трудоемкий процесс, который может быть значительно упрощен при использовании автоматических систем поиска и генерации контекстов. Программное обеспечение позволяет создавать лексикографические базы данных, которые фиксируют варианты употребления слов в том или ином значении, а также формировать электронные лексикографические картотеки, которые в дальнейшем используются как материал для составления словарной статьи. Все это значительно ускоряет процессы создания словарей и появления новых тезаурусов, отвечающих потребностям современной языковой практики.
Кроме этого, наличие электронных лексикографических баз данных позволяет непрерывно пополнять их новыми сведениями, что позволяет оперативно вносить изменения в состав словников, а также включать в них новые лексические единицы.
Перспективным применением компьютерных технологий является и при создании конкордансов – словников, включающих примеры индивидуально-авторского употребления в текстах того или иного писателя. Вначале создается компьютерный корпус текстов автора, затем на его основе формируется электронный конкорданс, который дополняется словарными статьями и иными необходимыми сведениями.
Электронные словари и автоматизированные поисковые системы
Востребованной формой презентации словарных статей в наше время является так называемый электронный словарь с возможностью удаленного доступа и автоматического поиска слова. Такие словари подразделяются на два типа:
- Автоматизированные системы поиска и обработки текста, предназначенные для нужд машинного перевода, обработки текстов по заданным параметрам и проч.
- Автоматические словари с пользовательским интерфейсом, приближенным к традиционному (печатному) словарю. Это, как правило, электронные версии уже имеющихся в печатной версии лексикографических трудовых, дополненные технологией автоматического поиска, сортировки статей, а также иными инструментами.
Первый тип словарей не являются «словаря» в точном смысле слова, так как они не предназначены для нужд конкретного пользователя. Они представляют собой вспомогательные аппаратно-программные средства, позволяющие осуществлять иные пользовательские запросы. Например, при необходимости автоматического перевода текста пользователь обращается е к самому словарю, а к интерфейсу, в основе которого заложены принципы автоматического поиска соответствий между словами двух языков. При этом точность и адекватность перевода постоянно совершенствуется, поскольку в основу словников закладывается несколько параметров сопоставления: значение, сфера употребления, стилистика, использование в идиоматических выражениях, грамматическая форма и проч.
Вторые типы поисковых систем напоминают обычные словари с расширенным функционалом, облегчающим поиск нужных слов. Как правило, современные системы поиска объединяют данные о поиске в словарях разных видов: толковых, орфографических, фразеологических, синонимов, антонимов и проч. Это дает пользователю возможность получить практически все данные о слове.
Таким образом, компьютерная лексикография как прикладная область лингвистики является востребованной сферой применения в образовании и профессиональной деятельности.