Базы данных в документационном обеспечении управления
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Базы данных
в документационном
обеспечении управления
Елена Валентиновна Федоркевич
Основные понятия
База данных (БД) в широком смысле – это
совокупность сведений о конкретных объектах
реального мира в какой-либо предметной
области.
Под
предметной областью принято понимать
некоторую
часть
реально
существующей
системы, функционирующую как самостоятельная
единица. Т.о. это часть реального мира,
подлежащая изучению в целях организации
управления и, в конечном счете, автоматизации.
Примеры предметных областей: предприятие,
фирма, вуз и т.д.
Данные
Данные (в концепции БД) – это набор конкретных
значений, параметров, характеризующих объект,
условие, ситуацию или любые другие факторы.
Примеры данных: Ястребов Сергей Михайлович,
24 марта 1976 г., паспорт АК №567382, €30.
Данные сами по себе не обладают структурой.
Примеры неструктурированных данных: документы
свободных форматов, тексты на естественном
языке.
Пример
Структурированные данные
Структуру данным задает пользователь,
осознает их смысловое содержание.
когда
Структурирование данных – это расположение
данных в определенном порядке или по
определенной схеме с учётом соглашений о
способах представления данных.
Способы структурирования:
упорядочение в хронологическом порядке;
расположение каждого блока данных в разных
разделах в зависимости от содержания, которое
описывает данный блок;
классификация и др.
Пример
Терминология БД
В
общеотраслевых руководящих материалах по
созданию банков данных Государственного
комитета по науке и технике (ГКНТ), изданных в
1982 г., приводятся следующие определения:
База данных (БД, DataBase) – поименованная
совокупность
структурированных
данных,
отражающая состояние объектов и их отношений
в рассматриваемой предметной области.
Отличительной чертой БД является совместное
хранение данных с их описанием.
СУБД
Система управления базами данных
–
совокупность
языковых
и
(СУБД)
программных средств, предназначенных для
создания,
ведения
и
совместного
использования БД многими пользователями.
Т.о. это средства, необходимые для создания
БД, поддержания их в актуальном состоянии
и организации поиска в них необходимой
информации.
Приложение БД
Программы, с помощью которых пользователи
работают с БД, называются приложениями БД.
В общем случае с одной БД может работать
множество различных приложений.
При этом предполагается, что приложения могут
работать параллельно и независимо друг от
друга, и именно СУБД призвана обеспечить
работу множества приложений с единой БД таким
образом, чтобы каждое из них выполнялось
корректно, но учитывало все изменения в БД,
вносимые другими приложениями.
Банк данных
Банк данных (БнД) – это система специальным
образом организованных данных – БД,
программных,
технических,
языковых,
организационно-методических
средств,
предназначенных
для
обеспечения
централизованного накопления и коллективного многоцелевого использования
данных.
Классификация баз данных
По характеру хранимых данных
документальные
фактографические
По используемой модели данных
теоретико-графовые:
иерархические,
сетевые
теоретико-множественные:
реляционные
постреляционные
многомерные
объектно-ориентированные:
объектные
Документальные БД
Документальная БД представляет собой совокупность
документов произвольной структуры и свободных
форматов.
Служат для хранения документов на естественном языке
(монографий, публикаций в периодике, сообщений
пресс-агенств, текстов законодательных актов и т.д.),
т.е. ориентированы на хранение слабоструктурированных данных.
В ответ на запросы пользователя такие БД выдают
документ или ссылку на документ, содержащий
требуемую информацию.
Используются в информационно-справочных системах
(ИПС).
Способы описания документов в ИПС
Языки разметки документов
SGML (Standart Generalised Markup Language),
HTML (HyperText Markup Language),
XML (Extensible Markup Language)
Дескрипторы
Дескриптор – слово, словосочетание или целое
высказывание, которые отражают содержание
перелагаемого текста в наиболее сжатом виде.
Тезаурусы
Тезаурус – это словарь с дополнительной
информацией о связях терминов, таких как
синонимы, омонимы, родовидовые отношения,
часть/целое.
Фактографические БД
Фактографическая БД содержит множество сведений,
удовлетворяющих
фиксированной
совокупности
форматов.
В ответ на запросы пользователя такие БД выдают
непосредственно требуемое фактическое данное.
Фактографические БД используются не только для
реализации справочных функций, но и для решения
задач обработки данных.
Под обработкой данных понимается специальный
класс решаемых на ЭВМ задач, связанных с вводом,
хранением, сортировкой, отбором и группировкой
записей данных однородной структуры.
Модели данных
Фактографические БД можно классифицировать по
используемой модели данных.
Модель данных – это логическая структура данных
(данные + описание взаимосвязи между блоками
данных).
Модели данных по способу представления объектов и
отношений между объектами делятся на:
теоретико-графовые
теоретико-множественные
объектно-ориентированные
Пример
Реляционная модель данных
основная модель в классе теоретикомножественных моделей,
разработана Эдгаром Франком Коддом в
начале 70-х годов 20 века,
реляционные СУБД являются промышленным
стандартом «де-факто»,
теоретической основой модели является теория
отношений (реляционная алгебра), основу
которой заложили Чарльз Содерс Пирс (1839–
1914) и Эрнст Шредер (1841–1902).
Отношение
Отношение является основной структурой данных в модели,
именно поэтому она получила название реляционной
модели (от англ. relation – отношение).
N-арным отношением R называют подмножество декартова
произведения D1×D2× … ×Dn множеств D1, D2, …, Dn
(n>1), необязательно различных:
R ⊆ D1 × D2 × … × Dn
Исходные множества D1, D2, …, Dn называют в модели
доменами (domain).
Полное декартово произведение – это набор всевозможных
сочетаний из n элементов каждое, где каждый элемент
берется из своего домена.
Пример
Представление отношения в виде
таблицы
Отношение имеет простую графическую интерпретацию,
оно может быть представлено в виде таблицы.
таблица состоит из столбцов и строк и имеет имя;
имя столбца должно быть уникальным в таблице;
любая таблица должна иметь хотя бы один столбец;
столбцы таблицы соответствуют вхождениям
доменов в отношение, а строки – наборам из n
значений, взятых из исходных доменов, которые
расположены в строго определенном порядке в
соответствии с заголовком столбца.
Пример
Таблицы
Вхождение домена в отношение принято называть
атрибутом. Т.о., строка таблицы – набор значений
атрибутов отношения. Значения конкретного атрибута
выбираются из домена – множества всевозможных
значений атрибута.
Количество
атрибутов
в
отношении
степенью, или рангом, отношения.
называется
Строки не имеют имен. Порядок их следования в таблице
не определен, а количество логически не ограничено.
Т.о., невозможно выбрать строку из таблицы по её
позиции – среди них не существует «первой» или
«последней».
Свойства таблиц
Итак, каждая таблица реляционной БД обладает рядом
специфических свойств:
в таблице нет двух одинаковых строк;
таблица имеет столбцы, соответствующие атрибутам
отношения;
каждый атрибут в отношении имеет уникальное имя;
порядок строк в таблице произвольный.
В
соответствии со свойствами отношений два
отношения, отличающиеся только порядком строк
или порядком столбцов, будут интерпретироваться в
рамках реляционной модели как одинаковые
(свойство 4).
Пример
Первичный ключ отношения
Любая таблица имеет один или несколько столбцов,
значения которых однозначно идентифицируют
каждую её строку. Такой столбец (или комбинация
столбцов) называется первичным ключом отношения
(primary key, PK).
Пример
Пример 1. Неструктурированные данные
Сведения о работниках
Личное дело № 16493, Сергеев Петр Михайлович,
дата рождения 1 января 1976; личное дело № 16593,
Петрова Анна Владимировна, дата рождения
15.03.75; личное дело № 16693, Анохин Андрей
Борисович, дата рождения 14/04/1976.
Пример 2. Структурированные данные
Сведения о работниках
Классификация моделей данных
Пример построения полного декартова
произведения
Пусть имеется три домена:
D1 содержит три фамилии студентов,
D2 – набор из названий двух учебных дисциплин,
D3 – набор из трех оценок.
Допустим, содержимое доменов следующее:
D1 = {Иванов, Крылов, Степанов};
D2 = {Программирование, Базы данных};
D3 = {3, 4, 5}
Пример построения полного декартова
произведения (продолжение)
Тогда полное декартово произведение содержит набор из
18 кортежей (упорядоченных наборов из всевозможных
сочетаний элементов трех множеств):
{<Иванов, Программирование, 3>;
<Иванов, Программирование, 4>;
<Иванов, Программирование, 5> ;
<Иванов, Базы данных, 3>;
<Иванов, Базы данных, 4>;
<Иванов, Базы данных, 5>;
<Крылов, Программирование, 3>;
<Крылов, Программирование, 4>;
<Крылов, Программирование, 5>;
<Крылов, Базы данных, 3>;
<Крылов, Базы данных, 4>;
<Крылов, Базы данных, 5>; <Степанов,
Программирование, 3>;
<Степанов, Программирование, 4>;
<Степанов, Программирование, 5>;
<Степанов, Базы данных, 3>;
<Степанов, Базы данных, 4>; <Степанов, Базы данных, 5>}
Интерпретация отношения R
Отношение R моделирует реальную ситуацию, является
подмножеством декартова произведения и может
содержать, например, только 5 строк, которые
соответствуют результатам сессии (Крылов экзамен по
«Базам данных» еще не сдавал):
R
= {<Иванов, Программирование, 4>;
<Крылов, Программирование, 5>;
<Степанов, Программирование, 5>;
<Иванов, Базы данных, 3>;
<Степанов, Базы данных, 4>}
Представление отношения в виде
таблицы
Атрибуты
Кортежи
Свойства отношений
R ≅ R1
Пример первичного ключа
Первичный ключ