Лингвистические средства библиотечных и информационных технологий
Естественные языки являются важнейшим средством профессиональной деятельности человека, выступая универсальным инструментом передачи информации. Однако не всегда средства естественного языка могут удовлетворить потребности информационно-библиотечной работы, которая нуждается в специализированных языковых инструментах анализа и обработки информации. Особенно актуальной проблема языка описания информационных ресурсов стала в эпоху автоматизации библиотечных процессов и внедрения программных систем поиска и анализа документов.
Для автоматизированной системы библиотечной деятельности применяются специальные лингвистические средства - так называемые информационно-поисковые языки.
Информационно-поисковые язык представляет собой формальную знаковую систему, созданную на базе естественного языка и функционирующую в качестве средства описания и формирования поискового запроса.
Как и естественный язык, информационно-поисковые лингвистические системы имеют свой тезаурус и синтаксис, то есть правила сочетания его единиц при формировании запроса или записи.
Необходимость разработки специальных лингвистических средств для информационного обеспечения библиотечной работы связано с существенными недостатками естественных языков, к которым можно отнести следующие:
- Избыточность средств его выражения.
- Наличие синонимов, функциональных и стилистических вариантов, дублетов.
- Многозначность и метафоричность некоторых языковых единиц.
Данные свойства естественного языка снижают качество поиска, поскольку компьютерные алгоритмы требуют, чтобы средства описания и формирования поисковых запросов отличались полнотой, экономичностью, однозначностью и единообразным пониманием смысла лингвистических единиц.
Типология языков и лингвистических средств, используемых в библиотечной работе
Вопросы классификации информационно-поисковых языковых, используемых в работе библиотек, являются актуальной научной проблемой, как включение в их состав тех или иных языковых средств.
В основе информационно-поисковых языков лежат языковые средства, используемые для реализации следующих функций:
- Предварительная подготовка данных, их библиографическое описание.
- Ввод и обработка сведений.
- Преобразование сведений в соответствии с нуждами практики.
На основании выделения языковых средств, применяемых в том или ином языке описания, выделяют несколько типов самих языков:
- Языки классификационного типа, основанные на принципе построения иерархических и неиерархических структур данных.
- Языки, используемые для библиографического описания.
- Языки-дескрипторы.
- Языки объектно-поисковых признаков.
Особняком стоят языки метаданных, которые обеспечивают функционирование системы. Они включают специальные программные коды, обеспечивающие функционирование системы. Кроме этого, можно говорить о языковых средствах, выражающих информацию о методике индексирования документов, составления записей, рубрикации и проч.
Единицы информационно-поисковых языков
Основной единицей лингвистических средств поиска является лексическая единица, представляющая собой понятие. В зависимости от назначения и сферы использования языка поиска его лексические единицы могут включать:
- Индексы - формализованные единицы описания.
- Рубрики - тематические аспекты описания и классификации.
- Дескрипторы - наборы определений.
В рамках одной библиотечной информационной системы могут использоваться разные языки, что обусловлено несовершенством каждого из них в отдельности, отсутствием универсальности и сложностью задач библиографического описания и классификации. Так, при обработке документов обычно применяется совокупность разных единиц описания: предметных рубрик, дескрипторов, ключевых слов, классификаций.
Наиболее часто встречающиеся в практике языки - системы формирования предметных рубрик. Они выступают как инструменты построения иерархических классификаций на основе алфавитного и тематического принципа.
Трудности, связанные с использованием языковых средств информационно-поисковых систем
Сложность использования языка предметной рубрикации связана с тем, что у него отсутствует единый словарь рубрик, что затрудняет построение классификаций.
Отдельной проблемой, связанной с использованием различных информационно-поисковых языков и лингвистических средств, является необходимость обучения пользователей работе с ними. Поскольку данные языки отличаются от естественных, пользователь должен знать алгоритмы формирования запроса, понимать принципы построения поискового описания, грамотно использовать ресурсы поискового языка для работы с системами автоматизированного поиска данных.