Разместить заказ
Вы будете перенаправлены на Автор24

Банки информации

8-800-775-03-30 support@author24.ru

Банки данных

Наиболее характерным примером информационной системы является банк данных (БнД), предназначенный для хранения достаточно универсальной, необходимой для решения разнообразных прикладных задач, информации об определенной предметной области в специальном виде, который зачастую предполагает хранение и обработку с помощью компьютерной техники. Банк данных вместе с базой данных, в которой хранятся сами данные, содержит систему управления базой данных (СУБД) – программное средство обработки данных и реализации запросов.

Замечание 1

В основном банки данных относятся к системам коллективного пользования. К информации, которая в них хранится, зачастую получение доступа происходит через телекоммуникационные сети.

Сегодня в мире существует огромное количество банков данных, в которых хранится информация коммерческого характера, библиотечные данные, информация по системам здравоохранения, транспорта и т.д. Быстро развиваются банки, которые содержат сведения о национальных и региональных системах образования, называемых в России банками педагогической информации. Основой банка данных является база данных.

Классификация банков информации

Рассмотрим некоторые классификации банков информации.

По назначению банки информации делятся на:

  • информационно-справочные системы (общего назначения и специализированные);
  • БнД в автоматизированных системах управления (предприятий и организаций, технологическими процессами и т.д.);
  • БнД в системах автоматизации научных исследований.
Замечание 2

По режиму функционирования рассматривают банки информации пакетного, диалогового и смешанного типов. В связи с развитием и внедрением практически во все области жизнедеятельности человека персональных компьютеров, локальных и глобальных сетей стали широко распространяться диалоговые системы.

Разделяют также банки информации по архитектуре вычислительной среды на централизованные и распределенные БнД.

На сегодня сложилось 3 основных типа банков информации: банки документов, банки данных и банки знаний.

Банки документов

Банки документов (или документальные информационно-поисковые системы) были первым типом банков информации. Банки документов широкое развитие получили в 1960-е гг., использовались как справочный инструмент пользователей научно-технической информации, в информационном обслуживании управленческих работников, специалистов и др. С развитием глобальной информационной сети Internet гипертекстовые серверы (WWW, Gopher и т.д.) вместе с поисковыми системами можно отнести к распределенным банкам документов.

Определение 1

Объект хранения в таких системах – документ (статья, монография, письмо, приказ и т.д.) или факты, которые извлечены из документов.

Для эффективного поиска и обеспечения доступа к документам нужна их предварительная индексация. Индексация до сих пор является неавтоматизированной процедурой и выполняется специалистами, которые индексируют документы и запросы.

В банке документов содержатся следующие компоненты:

  • набор документов или фактов, которые являются объектами хранения и поиска;
  • информационно-поисковый язык (ИПЯ), который предназначен для отображения содержания документов, выполнения операций с ними, например, выполнения запросов для их поиска;
  • правила, алгоритмы, методы индексирования и поиска документов, которые позволяют описывать документы и операции над ними на ИПЯ;
  • набор программных и аппаратных средств для реализации процессов накопления, хранения и поиска документов;
  • обслуживающий персонал – администратор банка документов, системные аналитики, программисты и индексаторы.

Обычно банки документов работают в двух режимах:

  1. Режим избирательного распределения информации, который обеспечивает регулярное текущее информирование пользователей банка о новых поступлениях документов.
  2. Режим ретроспективного поиска информации по разовым запросам во всем массиве документов.

Индексирование документа является важнейшим этапом обработки нового документа, который поступил в хранилище банка документов. Индексирование состоит в:

  1. выявлении основного смыслового содержания документа (с учетом точки зрения автора документа и информационных потребностей пользователя системы);
  2. описании смыслового содержания документа на ИПЯ и получении соответствующего поискового образа документа (ПОД).

При ретроспективном поиске:

  1. выявляется смысловое содержание запроса;
  2. получают поисковый обзор запроса (ПОЗ) на ИПЯ системы.

В результате индексирования документов и запросов получают их поисковые образы (ПОД и ПОЗ). При поиске документов по запросу сопоставляются ПОД и ПОЗ.

Различают следующие виды критериев для обеспечения качества поиска:

  • теоретико-множественные критерии, которые основаны на оценке степени совпадения лексических единиц ИПЯ (слов), которые используются в ПОД и ПОЗ;
  • критерии, которые учитывают с помощью определенных коэффициентов относительную информационную значимость отдельных лексических единиц ПОЗ;
  • логические критерии, которые основаны на использовании логических операций (отрицание, дизъюнкция, конъюнкция, импликация и др.).

В настоящее время информационно-поисковые языки, которые используют в банках документов, разделяют на 3 группы:

  • классификационные языки;
  • дескрипторные языки;
  • комбинированные языки.

Классификационные системы. В иерархических классификационных системах лексические единицы находятся между собой в отношении включения, т.е. располагаются в порядке перехода от общего к более частному.

Пример иерархической классификационной системы – универсальная десятичная классификация (УДК), которая широко используется в библиотечном деле и банках документов. Шифры УДК указываются на обороте титульного листа каждой книги, перед заголовками статей в журналах и сборниках.

Шифрам УДК уже более ста лет. Первое сводное издание таблиц десятичной классификации вышло в 1905 г., создано на основе таблиц десятичной классификации Мельвиля Дьюи, которые были изданы впервые в 1876 г.

Каждый класс УДК содержит группу, состоящую из близких наук. Например, в класс 5 входит математика и естественные науки, в класс 6 –прикладные науки: техника, в том числе информатика, сельское хозяйство, медицина. Каждая последующая цифра уточняет предыдущие и обозначает более частное понятие. Пример УДК: 61.5.13.

Дескрипторные ИПЯ. Дескрипторные ИПЯ основаны на методе координатного индексирования, при котором смысловое содержание документа с достаточной точностью и полнотой выражается списком ключевых слов, которые содержатся в тексте.

Замечание 3

Ключевым словом выступает лексическая единица ИПЯ, которая является частью речи (существительное, прилагательное, глагол, наречие, числительное или местоимение) или словосочетанием. Основным критерием отбора ключевых слов из текста является степень их полезности для индексирования документа или запроса.

При координатном индексировании к ключевым словам применяются логические операции конъюнкции и дизъюнкции.

Целесообразность применения определенного ИПЯ зависит в основном от назначения информационной системы и степени ее автоматизации. В библиотеках, общих и технических архивах документы описываются обычно с помощью классификационных языков. В автоматизированных информационно-поисковых системах чаще всего используются дескрипторные языки.

Статья предоставлена специалистами сервиса Автор24
Автор24 - это сообщество учителей и преподавателей, к которым можно обратиться за помощью с выполнением учебных работ.
как работает сервис