Справочник от Автор24
Поделись лекцией за скидку на Автор24

Индексирование документов как процесс аналитико–синтетической переработки информации

  • 👀 927 просмотров
  • 📌 846 загрузок
Выбери формат для чтения
Загружаем конспект в формате docx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Конспект лекции по дисциплине «Индексирование документов как процесс аналитико–синтетической переработки информации» docx
Тема. Индексирование документов как процесс аналитико–синтетической переработки информации Индексирование — это процесс перевода содержания документов, запросов, фактов с естественного на информационно-поисковый язык, в результате чего создаются поисковые образы документов (ПОД), поисковые образы запросов (ПОЗ), поисковые образы фактов (ПОФ). Индексирование, наряду с составлением библиографического описания, реферированием, аннотированием, составлением обзоров, является разновидностью аналитико-синтетической переработки (АСПИ) или свертывания информации. Индексирование является массовым технологическим процессом, который осуществляется многочисленными издательствами, книготорговыми и полиграфическими предприятиями, книжными палатами, библиотечными коллекторами, библиотеками, органами НТИ, редакциями журналов. Все эти организации, независимо от их организационно-правовой структуры, ведомственной принадлежности и формы собственности обязаны осуществлять индексирование документов, чтобы на его основе можно было упорядочивать, систематизировать документы и вести поиск информации. В зависимости от типа информационно-поискового языка (ИПЯ) (иерархическая классификация, алфавитно-предметная классификация, дескрипторный ИПЯ) индексирование может воплощаться в следующих процессах: – предметизация, т. е. индексирование на основе языка предметных рубрик, алфавитно-предметной классификации; – систематизация литературы, осуществляемая на базе классификационных иерархических ИПЯ; – координатное индексирование, реализуемое на основе дескрипторного ИПЯ или языка ключевых слов. Соответственно, в зависимости от используемого ИПЯ, результатом индексирования, т. е. ПОД или ПОЗ могут быть либо предметная рубрика, либо индекс классификации, либо перечень дескрипторов или ключевых слов. Индексирование является основным средством раскрытия содержания как отдельного документа, так и всего документального фонда библиотеки, службы информации, АИС. Следовательно, качество индексирования решающим образом определяет эффективность использования накопленных в библиотеках и службах информации документальных фондов. Предметизация документов как вид индексирования Предметизация представляет собой интеллектуальный или автоматический анализ содержательных и формальных признаков отдельного документа (его составной части или совокупности документов) с целью их синтеза и отражения в поисковой системе с помощью языка предметных рубрик (ЯПР). В качестве предметов понимаются как материальные и духовные явления действительности, получившие содержательное отражение в документах посредством знаков естественного языка, так и формальные характеристики документов, являющихся объектом предметизации. Методика предметизации документов Общая методика предметизации включает совокупность приёмов и правил, которые применяются в процессе предметизации документов всех типов и видов, независимо от их тематики. Предметизацию проводят путём непосредственного анализа документа на основе языка предметных рубрик, с учётом информационно–поискового массива, элементом которого становится предметизируемый документ, и характера ожидаемых информационных запросов. Технологический процесс предметизации включает следующие операции: – отбор документов – анализ содержания и формы документа с целью определения предмета, аспектов его рассмотрения и выявления связи между ними в тексте. – выбор смысловых компонентов (терминов) и формулировка из них рубрик, отражающих выявленные связи. – стандартизация формулировки рубрик – редактирование предметных рубрик – включение предметной рубрики в библиографическую запись. Отбор документов для предметизации проводят в соответствии с правилами принятыми в конкретной организации. При отборе учитывается актуальность и профильность тематики, хронологические и языковые ограничения, типы и виды изданий и другие признаки. Анализ документа проводят по всем его элементам, позволяющим выявить его содержание, позицию автора, форму и назначение. Этот процесс начинается с просмотра документа, включая титульный лист, оглавление, предисловие, текст документа, издательскую аннотацию и другие данные. На этапе анализа предметизатор решает, какие именно содержательные и формальные признаки документа подлежат включению в рубрики. Непосредственное обращение к этим элементам позволяет избежать грубых ошибок при определении и оценке основного содержания документа. Просмотр текста документа является необходимым условием для выделения смысловых компонентов, обозначающих основной предмет документа. Дополнительно фиксируются термины, обозначающие аспекты рассмотрения данного предмета. На основе выбранных смысловых компонентов формулируют предметные рубрики, отражающие выявленные связи с помощью лексических единиц языка предметных рубрик, наиболее точно соответствующих по смыслу данному предмету и его аспектам. В сложной предметной рубрике лексические единицы располагаются в соответствии с правилами синтаксиса языка предметных рубрик, т.е. правилами формулировки сложной предметной рубрики. Стандартизация формулировки рубрик осуществляется с помощью словарей предметных рубрик, авторитетных файлов предметных рубрик (при наличии таковых в базе данных электронного каталога) или тезаурусов для придания рубрике единообразной формы. При редактировании предметных рубрик, присвоенных документу, проверяют соответствие выбранных смысловых компонентов правилам формулировки рубрик и нормативным документам. При отсутствии предметной рубрики, которая соответствует содержанию и формальным признакам документа, принимают решение о включении в язык предметных рубрик новых лексических единиц. Одновременно должны быть внесены изменения и в нормативно–методические документы, фиксирующие данный информационно–поисковый язык. Для организации широких предметных комплексов предметные рубрики связывают с ссылочным аппаратом, а узкие комплексы могут быть сформированы при помощи инверсии. Включение предметных рубрик в библиографическую запись осуществляется на заключительном этапе в соответствии с правилами, принятыми в библиографирующей организации. Качество предметизации зависит от точности отражения содержания документов с помощью языка предметных рубрик. Язык предметных рубрик (ЯПР): общая характеристика и требования Язык предметных рубрик – это искусственный информационно–поисковый язык, предназначенный для аналитико–синтетической переработки информации, созданный на базе естественного языка, отвечающий требованию однозначности. Особенностью предметизации является генетическая взаимосвязь языка предметных рубрик (ЯПР) с естественным языком, заключающаяся в том, что ЯПР формируется на основе словарного фонда национального (русского, английского, немецкого и др.) языка. Структурной единицей языка предметных рубрик является предметная рубрика. Предметная рубрика служит для описания содержания и формальных признаков документов или запросов. По структуре предметные рубрики делятся на простые и сложные. Простые рубрики не имеют подзаголовков; сложные рубрики состоят из предметного заголовка и подзаголовков (одного или нескольких). По широте отражаемой тематики предметные рубрики могут быть адекватными и обобщающими. Адекватная рубрика – это рубрика, формулировка которой выражает объем понятия, наиболее точно соответствующего объему понятия о предмете документа; обобщающая рубрика – это рубрика, выражающая объем понятия, существенно более широкий, чем объем понятия о предмете документа. Требования к языку предметных рубрик: 1. Быть однозначным, то есть иметь точную и недвусмысленную семантику. Синонимия, полисемия и омонимия в языке предметных рубрик должны быть устранены. 2. Фиксировать парадигматические (логические и ассоциативные) отношения, в том числе с помощью ссылочно–справочного аппарата. 3. Грамматические формулировки лексических единиц и сложных рубрик должны быть просты и однозначны, не иметь исключений. 4. Полнота словаря должна быть достаточной для предметизации документов и запросов, но, при необходимости, словарь должен допускать возможность исправлений и дополнений, то есть обладать свойством «гостеприимности». 5. Возможность перефразирования в ИПЯ должна быть сведена до минимума, что ускоряет время проведения поиска. Однако это требование не может быть безоговорочно предъявлено к языку предметных рубрик, так как именно возможность перефразирования делает этот язык более гибким, более выразительным и, следовательно, увеличивает его поисковые возможности. Лексика ЯПР. Предметные заголовки и подзаголовки Под лексической единицей понимается смысловое единство, выраженное словом или сочетанием слов, ни одно из которых не может быть отброшено без изменения смысла этого единства. Множество лексических единиц, включенных в словарь, называется словарным фондом или лексикой языка предметных рубрик. В языке предметных рубрик лексические единицы называются предметными заголовками и подзаголовками. Предметный заголовок (заголовок предметной рубрики) – это слово или словосочетание, которое отражает основной предмет документа. Заголовками могут быть наименования предметов, материалов, процессов, свойств, лиц, географические понятия и т.д. Подзаголовки отражают тот или иной аспект рассмотрения предмета, выраженного заголовком предметной рубрики. Подзаголовки присоединяются к заголовку предметной рубрики при помощи тире, только хронологические подзаголовки – при помощи запятой. Лексика подзаголовков подразделяется на следующие виды: 1. Тематические подзаголовки: общие; типовые; специфические; 2. Подзаголовки среды; 3. Хронологические подзаголовки; 4. Формальные подзаголовки. Тематические подзаголовки отражают части, детали, свойства, процессы, оценку и другие стороны, аспекты предмета, например: Библиотеки научные – Абонемент Судовые двигатели – Детали Нефть – Вязкость Витрины – Оформление Постмодернизм – Критика Подзаголовки среды (географической и социальной) применяются для дополнительной характеристики предмета в территориальном, географическом аспекте и в аспекте социальной среды, влияющей на его развитие. Например: Автомобильные дороги – Великобритания Библиотечное дело – Россия Издательское дело – Зарубежные страны Лесная промышленность – Урал Народонаселение – Развивающиеся страны Хронологические подзаголовки характеризуют время существования предмета или явления: Великая Отечественная война, 1941–1945 Искусство – Средние века Санкт–Петербург, город – Архитектура, 18 в. Русская литература – История, 19–20 в. Формальные подзаголовки характеризуют не предмет, рассматриваемый в документе, а сам документ, его читательское и целевое назначение, форму изложения материала, тип и вид издания: – Альбомы – Воспоминания – Словари – Тезисы докладов – Учебники Однозначность лексики ЯПР Требование однозначности лексики ЯПР удовлетворяется следующим образом. При создании словаря предметных рубрик в него вводятся все синонимы и эквивалентные по смыслу выражения. Для разыскания синонимов применяются словари синонимов, толковые, терминологические, энциклопедические словари и другие справочники. В качестве лексической единицы выбирается лишь один из смысловых вариантов. Остальные исключаются с помощью отсылок, выражаемых пометой «см.» (смотри). Например, из трех синонимов «социальная философия», «историософия» и «философия истории» в качестве предметной рубрики используется термин «социальная философия», а от двух других делают отсылки. В методике предметизации действуют следующие критерии выбора одного из синонимов в качестве заголовка предметной рубрики. Предпочтение отдается терминам на том естественном языке, который используется в поисковой системе, несмотря на то, что в языке науки может употребляться иностранный эквивалент. Однако, если более удобным для словообразования является иностранный эквивалент, то допустимо использовать его в качестве предметной рубрики, например, Мониторинг, а не Слежение. Термин, выбранный в качестве предметной рубрики, должен быть стилистически нейтральным и иметь меньше смысловых оттенков. Предпочтение отдается новым терминам и более употребительным. Помимо лексических синонимов можно отметить еще несколько видов эквивалентности, которые необходимо устранять в языке предметных рубрик: а) сокращенная и полная форма термина: ИФЛА и Международная федерация библиотечных ассоциаций Джаз и Джазовая музыка б) инверсированная и прямая форма словосочетаний: Декорации театральные и Театральные декорации в) возможные варианты написания фамилий, названий, псевдонимов: Ибн Сина и Авиценна Государственная публичная библиотека им. М.Е. Салтыкова–Щедрина и Российская национальная библиотека Во всех этих случаях необходимо сделать отсылку от отвергнутой формулировки к термину, используемому в качестве предметной рубрики. Устранение омонимии, когда одинаковые по написанию или звучанию слова обозначают разные понятия, осуществляется с помощью пометы в круглых скобках: Нефрит (геолог.) Кошки (животные) Нефрит (мед.) Кошки (механизмы) В круглых скобках, как правило, приводится наименование отрасли в сокращенной форме. В некоторых случаях дается краткое определение понятия, выраженного заголовком предметной рубрики: Березка, хореографический ансамбль Феникс, страховая компания Полисемия – это явление многозначности, когда на основе сходства по форме, свойствам, функциям предметов происходит перенос названия с одного предмета на другой. Полисемия устраняется при помощи использования развернутой формулировки термина, исключающей неоднозначность истолкования: Банковские операции Олимпийские игры Электрические пробки Морфология ЯПР Язык предметных рубрик, используя в качестве лексических единиц слова и словосочетания естественного языка, заимствует у него такие грамматические средства, как морфология и синтаксис. Морфология – это средства и методы формирования лексических единиц языка предметных рубрик из лексики естественного языка. Важно подчеркнуть, что лексика ЯПР и лексика естественного языка совпадают лишь частично. Обратим внимание на основные различия между ними. 1. Отличие лексических единиц языка предметных рубрик заключается в том, что они могут быть выражены не только одним словом, но и словосочетанием. Чаще всего используются сочетания прилагательного (одного или нескольких) с существительным, а также сочетания существительного с существительным (предложные и бecпредложные). Словосочетания можно представить в виде моделей, в которых используются следующие обозначения: N – существительное; А – прилагательное. Цифры, стоящие рядом, обозначают падеж: 1 – именительный; 2 – родительный; 3 – дательный; 4 – винительный; 5 – творительный; 6 – пpeдложный. Типовые модели лексических единиц ЯПР представлены в таблице 1. Таблица 1 № п/п Модели ЛЕ Примеры ЛЕ 1. N1 Певцы; Музыка; Аннотирование; Изоиздания; Демократия; Театры; Дискография 2. A1 N1 Авторская песня; Библейские пророки; Детские театры; Избирательная система; Коррекционная педагогика; Электронные ресурсы; Массовое действо 3. N1 A1 Певцы камерные; Скульптура монументальная; Кинофильмы документальные; Иллюстрации книжные; Княжества русские; Программирование линейное 4. N1 N2 Анатомия человека; Доходы населения; Учреждения культуры; Методика преподавания; Библиотека Кадетского корпуса 1–я; Культура речи 5. N2 N1 Дирака уравнение; «Жестокости» театр; Научной информации теория; Игр теория; Операций исследование 6. N1 N6 Классицизм в искусстве; Героическое в литературе; Прессование в вакууме; – Применение в машиностроении; – Нагрев при склеивании 7. N1 и N1 Могильники и курганы; Конечное и бесконечное; Личность и культура; Культура и религия; Сады и парки; Мифология и литература; Молодежь и спорт; Музыка и слушатель (проблема) 8. N1 как N1 Дарение как источник комплектования; Методология как совокупность методов познания; Мимика как средство общения 2. Лексические единицы ЯПР формулируются, как правило, во множественном числе. Однако это правило не применяется для формулировки лексических единиц, отражающих абстрактные понятия, такие как свойства, процессы, явления и т.п., например, Вязкость, Резание, Нравственная культура и др. Названия конкретных наук, языков формулируются в единственном числе (Социология культуры, Русский язык), а название дисциплин, объединяющих группу родственных отраслей знания (или группу языков) – во множественном числе, например, Педагогические науки, Восточные языки. Единственное число используется для формулировки тех лексических единиц, которые во множественном числе обозначают другое понятие, например, Театр как вид искусства и Театры как вид учреждений культуры, Вишня (ягода) и Вишни (деревья), Сказка (вид литературы) и Сказки (тексты сказок). 3. Особое место в методике предметизации занимает правило выбора первого, ведущего слова заголовков и подзаголовков. Ведущее слово помогает подчеркнуть качественное своеобразие предмета и обладает комплексирующей и эвристической функциями. Продуманный выбор ведущего слова позволяет собрать в одном месте поисковой системы комплекс тематически близких рубрик и определяет местоположение предметной рубрики в списке рубрик (например, при выводе списка предметных рубрик на экран). Эвристическая функция обеспечивает быстрое разыскание искомой рубрики в алфавитном ряду. Ведущим словом может быть как прилагательное, так и существительное. Например: Автомобили Автомобили атомные Автомобили гоночные Автомобили грузовые Автомобили легковые ………… Вокальная музыка Вокальная музыка – Аранжировка Вокально–инструментальные ансамбли Вокальные ансамбли Вокальные ансамбли – Нотные издания Рациональный выбор ведущего слова важен не только для заголовков, но и подзаголовков, посредством которых в комплексе рубрик, начинающихся данным заголовком, группируются родственные аспекты, например: Легкие сплавы – Литье Легкие сплавы – Литье в кокиль Легкие сплавы – Литье непрерывное Легкие сплавы – Литье под давлением и т.д. 4. Методическим приемом, который помогает выбрать ведущее слово, является инверсия – изменение естественного порядка слов в словосочетании, являющемся лексической единицей (заголовком или подзаголовком). Инверсия применяется в словосочетаниях существительного в именительном падеже с зависимым существительным в родительном падеже (модель N1N2) и прилагательного с существительным в именительном падеже. (модель А1N1). По поводу инверсии в словосочетаниях, состоящих из существительных, в отечественной методике предметизации разногласий нет. Если в словосочетании есть имя собственное в родительном падеже, то оно выбирается в качестве ведущего слова, а главное слово – существительное в именительном падеже – инверсируется: Гюйгенса–Френеля принцип Монте–Карло метод Если зависимое существительное в родительном падеже – имя нарицательное, то инверсия существительного в именительном падеже производится, если оно имеет универсальный характер и поэтому не может выполнять функцию ведущего слова. К таким существительным относятся слова теория, метод, принципы, способ и др.: Ошибок теория Неопределённых коэффициентов метод Сохранения заряда закон В отечественной методике предметизации отсутствуют общепринятые решения по вопросу применения инверсии прилагательного. Существуют три точки зрения: 1) Абсолютизация инверсии: прилагательное следует всегда инвертировать, оставляя ведущим словом существительное. К положительным сторонам этого решения относятся единообразие в формулировках предметных рубрик и сокращение числа ссылок и отсылок. Недостатком является разрушение структуры устойчивых словосочетаний и отсутствие возможности комплексирования с помощью прилагательного, что затрудняет поиск информации. 2) Абсолютизация прямого порядка слов приводит к созданию разнородных комплексов рубрик (и документов), не нужных потребителю, и к неоправданному увеличению ссылочного аппарата, например: Деревянная скульптура Деревянные дома Деревянные ложки Деревянные мосты 3) Дифференцированное использование инверсии: инверсия оправдана в тех случаях, когда она помогает в комплексировании рубрик или облегчает читателю процесс поиска. С этой точки зрения рекомендуется не подвергать инверсии устойчивые словосочетания, являющиеся фразеологическим единством, например, Архитектурные памятники, Вредные привычки, Органическая химия, а также словосочетания, в которых прилагательное выполняет модифицирующую функцию, т.е. изменяет значение понятия, выраженное существительным: Бронзовый век, Железные дороги, Живое созерцание, и функцию назначения – Детские театры, Часовое стекло и т.д. Нежелательно выдвигать ведущим словом омонимичные или полисемичные термины и существительные, имеющие широкий объем, которым именно прилагательные придают однозначность, например Валютные операции, Самостоятельная работа, Электронные ресурсы. Целесообразно не инверсировать также словосочетания, которые могут употребляться в полной и сокращенной форме: Пластические массы (пластмассы), Заработная плата (зарплата) и имена собственные: Российская библиотечная ассоциация. Если же прилагательное выполняет видообразующую функцию, т.е. функцию выделения нового понятия, подчиненного понятию, выраженному существительным, то оно инверсируется. В данном случае существительное становится ведущим словом, что особенно важно, когда оно является специфичным для данной области знания (т.е. обозначает предметы, свойства и отношения, характерные для области знания, включающей этот термин), например: Библиотеки научные Библиотеки общедоступные (но: Электронные библиотеки) Кинокомедии музыкальные Скульптура монументальная Синтаксис ЯПР (правила формулировки сложных предметных рубрик) Синтаксис языка предметных рубрик — это правила формулировки сложных предметных рубрик, то есть правила сочетания заголовка и подзаголовков для получения осмысленного выражения, которое называется сложной предметной рубрикой. В методике предметизации существуют два разных подхода к построению сложных предметных рубрик. Условно их можно назвать эмпирическим и теоретическим. Эмпирический подход характерен стремлением крайне ограниченно использовать подзаголовки, а при их использовании предметные рубрики формулируются по аналогии с рубриками, уже имеющимися в предметных каталогах. Эмпирический подход является причиной непоследовательности предметизации, которая наблюдается даже в крупных библиотеках. Непоследовательность предметизации заключается в том, что разные предметизаторы или даже один предметизатор, но в разное время составляют поисковые образы одного и того же документа, с различной степенью глубины и детальности раскрывая его содержание, используя во многих случаях разные предметные рубрики. При интеллектуальной предметизации явление непоследовательности, по–видимому, нельзя устранить. Однако необходимо выработать такие правила, которые свели бы к минимуму субъективизм предметизатора. Задача разработки такого рода правил решается в рамках теоретического подхода к построению сложных предметных рубрик, где существуют два направления: логико–лингвистическое и категориальное. Логико–лингвистическое направление исходит из теоретических начал логики и лингвистики, осмысленных применительно к специфике синтаксиса ЯПР. Основоположником этого направления в предметизации является Р.Ф. Гринина, которая в 1970–х годах разработала правила построения сложных предметных рубрик, заслуживающие особого внимания. 1. В сложной предметной рубрике, т.е. в синтагматическом ряду (синтагме1) не могут находиться лексические единицы, связанные логическими отношениями подчинения, перекрещивания, соподчинения, противоположности, противоречия и ассоциативными отношениями: «Наука – объект ее изучения» и «Наука (теория) – выдающиеся представители». С точки зрения этого правила неверно сформулирована рубрика Злаковые растения – Пшеница – Россия потому что лексические единицы «Злаковые растения» и «Пшеница» находятся в отношении подчинения (род – вид). 2. В синтагматическом ряду располагаются лексические единицы, связанные между собой ассоциативными отношениями: Целое – часть — Библиотеки научные – Абонемент; Предмет – свойство — Личность – Психические свойства; Предмет – процесс — Библиотечные фонды – Формирование; Предмет (материал) и его применение — Древесина – Применение в машиностроении; Реклама – Использование в книжной торговле. Различные отношения могут сочетаться в одной предметной рубрике: Предмет – Процесс – Оборудование: Древесина – Сушка – Оборудование Предмет – Свойство – Процесс: Морская вода – Плотность – Определение Предмет – Часть – Процесс Нева, река – Устье – Заселение, 17 в. 3. В сложной предметной рубрике необходимо так располагать элементы, чтобы сохранялась точность смысла текста, выражаемого предметной рубрикой. Правильность формулировки предметных рубрик может быть проверена путём их перевода на естественный язык. Перевод рубрики начинается с последнего подзаголовка (за исключением географического и хронологического, которые присоединяются позже); каждая предшествующая лексическая единица присоединяется в родительном или предложном падеже. Например, рубрика Читатели – Изучение – Социологические методы – Россия переводится на естественный язык фразой «Социологические методы изучения читателей в России»; рубрика Бумага – Влажность – Измерение – Аппаратура переводится фразой «Аппаратура для измерения влажности бумаги», а рубрика Машиностроение – Технологические процессы – Моделирование переводится фразой «Моделирование технологических процессов (родительный падеж) в машиностроении (предложный падеж)». Это правило названо его автором «правилом реверсивной проверки»2. 4. В сложной предметной рубрике ограничение объема понятия, выраженного заголовком, происходит с помощью подзаголовков, каждый из которых ограничивает объем предшествующего понятия (подзаголовка), а все вместе – объем понятия, входящего в заголовок. 5. Географическое понятие должно входить или в заголовок рубрики (это происходит в тех случаях, когда рассматривается история страны, география, ее внешняя или внутренняя политика, экономика), например: Германия – Внешняя политика, 1917–1939, или располагаться в конце рубрики в качестве географического подзаголовка: Земельные реформы – История – Россия 6. Хронологический подзаголовок должен стоять непосредственно после той лексической единицы, которую он характеризует: Великая Отечественная война, 1941–1945 – Помощь тыла фронту; Армения – История, 8–15 в. В сложной предметной рубрике тематические, географические и формальные подзаголовки присоединяются с помощью тире, а хронологические подзаголовки с помощью запятой. Заголовки и подзаголовки приводятся с прописной буквы. Ссылочно–справочный аппарат ЯПР Ссылочно–справочный аппарат – необходимая составная часть языка предметных рубрик, представляющая собой совокупность ссылок, отсылок и справочных пояснений, с помощью которых выражаются парадигматические отношения между рубриками. Напомним, что парадигматические отношения отражают полезные для информационного поиска логические (иерархические, родовидовые) отношения и психологические ассоциации (ассоциативные) между значениями лексических единиц ИПЯ. Отсылки, обозначаемые пометкой «см.» (смотри), используются для указания того термина, который служит в качестве предметной рубрики, если имеется несколько синонимов, выражающих одно понятие. Посредством отсылок отражаются отношения эквивалентности между лексическими единицами в языке предметных рубрик. Ссылки, обозначаемые пометой «см. также», служат основным средством для фиксирования парадигматических отношений между рубриками. Различаются связующие ссылки, выражающие иерархические логические связи между понятиями (отношения подчинения, отношения общее – частное) и перекрестные ссылки, соответствующие остальным логическим и ассоциативным отношениям. Различие между этими ссылками заключается в том, что связующие ссылки являются однонаправленными (от общего к частному), перекрестные же – симметричными (взаимными): они находятся у обеих рубрик. Пример связующей ссылки: Индексирование см. также Координатное индексирование Предметизация Систематизация Пример перекрестной ссылки: Предметизация см. также Систематизация Систематизация см. также Предметизация Разновидностями связующих ссылок являются исчерпывающая ссылка, которая устанавливает связь между предметными рубриками путем полного их перечисления, и сводная ссылка – ссылка, не перечисляющая все частные рубрики, а указывающая, как их разыскать. Например: Строительные машины см. также под названием отдельных машин Отсылки также могут быть исчерпывающими и сводными, сближаясь по содержанию со справками. Справки ориентируют пользователя в структуре языка предметных рубрик, в содержании рубрик и в тематическом размежевании между ними. Иногда в текст справок включаются фактографические данные: Например, Рубрика «Рублевое общество», 1867–1868 Справка: В рубрике собирается литература о революционной организации в России, существовавшей в 1867–1868 гг. и явившейся одной из предшественниц «хождения в народ». Названа по величине ежемесячного членского взноса. Словари предметных рубрик (авторитетные/нормативные файлы предметных рубрик) Язык предметных рубрик оформляется в виде словарей, на основе которых происходит предметизация документов и формирование ссылочно–справочного аппарата предметных каталогов и вспомогательных указателей. Словарь предметных рубрик – это алфавитная последовательность простых и сложных рубрик с установленными между ними парадигматическими отношениями, выраженными ссылочным аппаратом. В зависимости от тематического охвата различают универсальные, многоотраслевые, отраслевые и тематические или проблемные словари. Словарь предметных рубрик используется в следующих целях: 1. Для перевода терминов или предложений естественного языка, выбранных в процессе предметизации документа и выражающих его смысл, на язык предметных рубрик; 2. Для организации ссылочного аппарата, устанавливающего связи между имеющимися рубриками; 3. Для перевода запроса, сформулированного на естественном языке, на язык предметных рубрик 4. Для варьирования формулировок запросов при поиске информации Почти все словари предметных рубрик включают предисловие и список рубрик. В предисловии рассматривается тематика списка, принципы отбора понятий, включенных в словарь, принципы формулировки лексических единиц и сложных рубрик, дается характеристика аппарата парадигматики и видов пометок в словарной статье, излагается методика предметизации документов. Список предметных рубрик представляет собой единый перечень синонимов и предметных рубрик, расположенных в алфавитном порядке, который обеспечивает быстрое нахождение терминов. Синонимы сопровождаются отсылкой (пометка «см.») к соответствующей предметной рубрике. В словарях предметных рубрик принято пословное алфавитное расположение рубрик. Рубрики располагаются в алфавите заголовков, в пределах заголовка учитывается алфавит каждого слова. Подзаголовки располагаются за заголовком в алфавитном порядке. Этот порядок предпочтительнее побуквенного, так как позволяет лучше группировать в одном месте комплекс родственных рубрик. Предметные рубрики оформляются в виде словарной статьи, в которой приводятся все рубрики, связанные с данной парадигматическими отношениями. В словарных статьях приводятся не только ссылки, выраженные пометкой «см. также», но и связи рубрик в обратном направлении, которые необходимы для внесения изменений в язык предметных рубрик при редактировании. Эти обратные связи фиксируются пометками «сс. от» (ссылка от) и «отс. от» (отсылка от). Например: Театральная музыка отс. от Музыка в театре сс. от Музыкальные формы и жанры см. также Балет Музыкальная драма Опера Оперетта Словари предметных рубрик включают структурные единицы, которые называются предметными комплексами или комплексами предметных рубрик. Предметный комплекс – это совокупность рубрик, тематически связанных между собой. Различают узкий и широкий предметные комплексы. Узкий предметный комплекс – это совокупность предметных рубрик, расположенных в одном месте словаря. Узкий предметный комплекс может быть образован: а) заголовком предметной рубрики: Плотины земляные – Дренаж – Основания – Проектирование – Строительство – Оборудование б) ведущим словом заголовка, в качестве которого могут быть как прилагательное, так и существительное: Стены Стены бетонные Стены деревянные Стены жeлезообразные и т.д. Широкий предметный комплекс – это комплекс тематически близких рубрик, связанных парадигматическими отношениями и находящихся в разных местах словаря предметных рубрик. Комплексирование в этом случае осуществляется с помощью ссылок: Кондитерское производство см. также Карамельное производство Шоколадное производство Словари предметных рубрик являются физической формой существования языка предметных рубрик. Они могут быть в бумажной форме — в виде картотеки или книжного издания и в электронной (машиночитаемой) форме. Словари предметных рубрик в электронной форме называют авторитетными файлами предметных рубрик. (АФ ПР) Вопросы для самоконтроля: 1. Охарактеризуйте язык предметных рубрик как ИПЯ 2. Что такое лексика языка предметных рубрик и лексическая единица языка предметных рубрик 3. Перечислите виды подзаголовков сложных предметных рубрик 4. В каких случаях применяется инверсия и каковы границы ее применения 5. По каким правилам следует формулировать сложные предметные рубрики
«Индексирование документов как процесс аналитико–синтетической переработки информации» 👇
Готовые курсовые работы и рефераты
Купить от 250 ₽
Решение задач от ИИ за 2 минуты
Решить задачу
Помощь с рефератом от нейросети
Написать ИИ
Получи помощь с рефератом от ИИ-шки
ИИ ответит за 2 минуты

Тебе могут подойти лекции

Смотреть все 58 лекций
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot