Основные понятия, система управления базами данных
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
БАЗЫ ДАННЫХ
Лекция № 1
1.1. Основные понятия и определения
1.2. Система управления базами данных
1.3. Поддержка языков БД
1.4. Классификация баз данных
1.5. Классификация СУБД
1.6. Классификация банков данных
1
1.1. Основные
определения
• Информационные системы (ИС) –
совокупность аппаратно - программных
средств, предназначенных для решения
некоторой прикладной задачи (учет кадров,
расчет зарплаты и т.п.).
• ИС создают для облегчения обработки информации.
• По области применения ИС можно разделить на
системы, используемые в производстве,
образовании, здравоохранении и т.д.
2
1.1. Основные
определения
Банк данных (БнД) - разновидность ИС, в которой
реализованы функции централизованного хранения,
накопления, обработки информации, организованной
в одну или несколько баз данных.
Компоненты БнД :
• информационная база,
• лингвистические средства,
• программные средства,
• технические средства,
• организационно-административные подсистемы и
3
• нормативно-методическое обеспечение.
1.1. Основные
определения
База данных (БД) — именованная
совокупность данных, отражающая
состояние объектов и их отношений в
рассматриваемой предметной области
(ПрО).
4
На начальном развитии БД представляли собой
традиционные файловые системы (файл записей).
Файловые системы – это набор программ, которые
выполняют для пользователя некоторые операции .
Каждая программа имеет свои собственные данные и
управляет ими.
Примеры:
• программа расчета зарплаты имеет записи со
структурой (ФИО, должность, ставка, доплаты);
• программа кадры – (ФИО, должность стаж, ставки и
др.)
5
При такой организации данных наблюдаются следующие
недостатки:
• разделение и изоляция данных;
• дублирование данных;
• зависимость от данных;
• фиксированные запросы.
Недостатки являются следствием 2-х факторов:
• данные хранятся внутри приложения (в записях),
• нет доступа к данным, кроме как из приложения.
6
В системах с БД этих недостатков нет.
БД – это совместно используемый набор
логически связанных данных и описание этих
данных, предназначенный для удовлетворения
информационных потребностей организации.
Здесь все данные собраны с минимальной
избыточностью.
7
Выводы
БД хранят данные и описания данных.
Описание данных называется системным
каталогом или словарем данных.
Сами элементы описания принято называть
метаданными (данные о данных).
Наличие самоописания данных в БД
обеспечивает независимость между программами
и данными, т.е. при изменении структуры данных
(например, добавляя поле), само приложение не
меняется.
8
Термин «логически связанных данных» в
определении БД означает следующее:
при анализе информации следует выделять
сущности, атрибуты и связи между
сущностями, характеризующие данную
предметную область.
9
1.2. Система управления базами данных
Система управления базами данных (СУБД) –
это программное обеспечение, с помощью
которого пользователи могут определять,
создавать и поддерживать БД, а также
осуществлять к ней контролируемый доступ.
10
СУБД – это программное обеспечение, которое
взаимодействует с прикладными программами БД и
обладает следующими возможностями:
• позволяет определять БД с помощью языка
определения данных DDL – Data Definition Language –
средства указания типа данных, их структуру, задания
ограничений для информации, хранимой в БД,
• позволяет вставлять, удалять и извлекать информацию
из БД с помощью языка управления данных DML –
Data Manipulation Language – языка запросов.
11
Основные функции СУБД
• непосредственное управление данными
во внешней памяти,
• управление буферами оперативной
памяти,
• управление транзакциями,
• протоколирование (журнализация),
• поддержка языков баз данных.
12
Управление данными во внешней
памяти –
обеспечение необходимых структур
внешней памяти (винчестера) как для
хранения данных, входящих в БД, так и
для служебных целей (для ускорения
доступа к данным, обычно для этого
используются ключи).
Буферизация
Объем информации, с которой работает СУБД,
обычно очень велик и практически всегда
превышает объем оперативной памяти.
Время доступа к оперативной памяти
значительно меньше времени доступа к
внешней памяти,
поэтому с целью увеличения скорости обмена
данными используют буферизацию.
14
Транзакция
Транзакцией называется
последовательность операций над базой
данных, рассматриваемых СУБД как
единое целое.
Если все операции успешно выполнены,
то транзакция тоже считается успешно
выполненной и СУБД фиксирует все
изменения данных, производимые этой
транзакцией.
15
Если же хоть одна из операций
транзакции заканчивается неудачей, то
транзакция считается невыполненной и
производится откат, отмена всех
изменений данных.
Управление транзакциями необходимо
для поддержания логической
целостности базы данных.
16
Журнализация
Основными требованиями к СУБД являются:
• надежность хранения данных во внешней
памяти;
• восстановление последнего согласованного
состояния БД после любого аппаратного и
программного сбоя.
Для восстановления информации в БД
необходимо иметь дополнительную
информацию, которая должна храниться особо
надежно.
17
Наиболее распространенным методом
является ведение журнала изменений
базы данных:
запись об изменении любого объекта БД
должна быть занесена в журнал до того,
как будет выполнено и зафиксировано
изменение этого объекта.
18
Поддержка языков баз данных
Для работы с информацией используются
специальные языки, носящие общее название
языков баз данных. Чаще выделяют два
языка:
• язык определения схем данных (DDL) служит для определения логической
структуры базы данных,
• язык манипулирования данными (DML) содержит набор операторов манипулирования
данными, т.е. операторов, позволяющих
вносить данные, изменять, удалять, выбирать.
19
1.3. Поддержка языков БД
Стандартным языком наиболее
распространенных сейчас СУБД
является язык SQL (Structured Query
Lanquaqe).
20
Программы, с помощью которых пользователи
работают с БД, называются приложениями.
В общем случае с одной базой данных могут работать
множество различных приложений
( предполагается, что они могут работать
параллельно и независимо друг от друга).
СУБД призвана обеспечить работу множества
приложений с единой базой данных таким образом,
чтобы каждое из них выполнялось корректно, и
учитывало все изменения в БД, вносимые другими
21
приложениями.
КЛАССИФИКАЦИЯ БАНКОВ
ДАННЫХ
БнД являются сложными системами (БД,
СУБД и другие компоненты) и их
классификация может быть произведена
как для всего банка данных в целом, так и
для каждой его компоненты отдельно.
Классификация для каждой компоненты
может быть произведена по множеству
разных признаков.
22
Классификация баз данных
1. По форме представления информации:
- визуальные системы,
- аудиосистемы,
- мультимедиа .
2. По характеру организации данных (для
информации представленной только в
символьном виде ):
- неструктурированные,
- частично структурированные ,
- структурированные.
23
К неструктурированным БД могут быть
отнесены базы, организованные в виде
семантических сетей
24
Частично структурированными можно
считать БД в виде обычного текста или
гипертекстовые системы.
25
Структурированные БД требуют предварительного
проектирования и описания структуры БД и только
после этого они могут быть заполненными.
Структурированные БД по типу используемой
модели делятся на:
• иерархические,
• сетевые,
• реляционные,
• объектно-ориентированные.
Классификация по типу модели распространяется не
только на базы данных, но и на СУБД.
26
3. По типу хранимой информации
различают БД:
- документальные,
- фактографические,
- лексикографические .
4. По характеру организации хранения
данных и обращения к ним различают:
- локальные (персональные),
- общие (интегрированные,
централизованные),
35
- распределенные базы данных.
27
документальные БД
3.1. В документальных БД единицей
хранения является какой-либо документ
(например, текст закона или статьи), и
пользователю в ответ на его запрос
выдается либо ссылка на документ,
либо сам документ.
Различают библиографические,
реферативные и полнотекстовые БД.
28
Фактографические БД
3.2. В системах фактографического типа в БД
хранится информация об интересующих пользователя
объектах предметной области в виде «фактов»
(например, биографические данные о сотрудниках,
данные о выпуске продукции производителями и др.);
В ответ на запрос пользователя выдается требуемая
ему информация об интересующем его объекте /
объектах или сообщение о том, что искомая
информация отсутствует в БД.
Хранится структурированная (!) информация.
29
Как мы уже говорили, по типу
используемой модели (организации
данных) фактографические БД делятся
на иерархические, сетевые,
реляционные, объектноориентированные.
назад
30
Лексикографические БД
3.3. К лексикографическим базам
данных относятся различные словари
(классификаторы, многоязычные
словари, словари основ слов и т. п.).
31
4.
4.1. Персональная база данных - это
база данных, предназначенная для
локального использования одним
пользователем.
Локальные БД могут создаваться
каждым пользователем
самостоятельно, а могут извлекаться
из общей БД.
32
4
4.2. Интегрированные и распределенные БД
предполагают возможность
одновременного обращения нескольких
пользователей к одной и той же
информации (многопользовательский,
параллельный режим доступа).
Это привносит специфические проблемы при
их проектировании и в процессе
эксплуатации БнД.
33
4.3. Распределенные БД имеют
характерные особенности:
- физически разные части БД могут
быть расположены на разных ЭВМ,
- логически, с точки зрения
пользователя, они представляют собой
единое целое.
34
1.5. Классификация СУБД
1. По языкам общения СУБД делятся на
открытые, замкнутые и смешанные.
Открытые системы - это системы, в
которых для обращения к БД
используются универсальные языки
программирования.
Замкнутые системы имеют собственные
языки общения с пользователями
35
2. По числу уровней в архитектуре
2. Различают одноуровневые, двухуровневые,
трехуровневые системы.
В принципе возможно выделение и большего
числа уровней.
Под архитектурным уровнем СУБД
понимают функциональный компонент,
механизмы которого служат для поддержки
некоторого уровня абстракции данных
(логический и физический уровень, а также
«взгляд» пользователя – внешний уровень).
36
3. По выполняемым функциям СУБД делятся на
информационные и операционные.
Информационные СУБД позволяют организовать
хранение информации и доступ к ней.
Операционные СУБД выполняют достаточно
сложную обработку,
например, автоматически позволяют получать
агрегированные показатели, не хранящиеся
непосредственно в базе данных,
могут изменять алгоритмы обработки и т.д.
37
4. По сфере возможного применения :
универсальные и специализированные.
38
5. По «мощности» СУБД делятся на «настольные» и
«корпоративные». Характерными чертами настольных
СУБД являются сравнительно невысокие требования к
техническим средствам, ориентация на конечного
пользователя, низкая стоимость.
Корпоративные СУБД обеспечивают работу в распределенной
среде, высокую производительность, поддержку
коллективной работы при проектировании систем, имеют
развитые средства администрирования и более широкие
возможности поддержания целостности.
Наиболее известными из корпоративных СУБД являются
Oracle, Informix, Sybase, MS SQL Server, Progress и другие.
39
6. По ориентации на преобладающую категорию
пользователей можно выделить СУБД для
разработчиков и для конечных пользователей.
Системы для разработчиков имеют:
• качественные компиляторы,
• позволяют создавать «отчуждаемые» программные
продукты,
• обладают развитыми средствами отладки,
• включают средства документирования проекта
• и обладают другими возможностями,
позволяющими создавать эффективные сложные 40
системы.
Основными требованиями, предъявляемыми к
системам, ориентированным на конечного
пользователя, являются:
• удобство интерфейса,
• высокий уровень языковых средств,
• наличие интеллектуальных модулей
подсказок,
• повышенная защита от непреднамеренных
ошибок («защита от дурака») и т.п.
41
1.6. Классификация БнД
1. По условиям предоставления услуг различают:
бесплатные и платные банки данных.
Платные БнД в свою очередь делятся на
бесприбыльные и коммерческие.
Бесприбыльные БнД функционируют на принципе
самоокупаемости и не ставят своей целью
получение прибыли.
Это обычно БнД социально значимой информации,
научной, библиотечной информации.
Основной целью создания коммерческих банков
данных является получение прибыли от
информационной деятельности.
42
2. По характеру преобладающей обработки
информации.
В одних в основном реализуется большое число
достаточно простых запросов.
Такие системы получили название OLTP (On-Line
Transaction Processing) – системы оперативной
обработки транзакций.
В других требуется сложная аналитическая
обработка данных.
Для такого класса систем стал использоваться термин
OLAP (On-line Analytical Processing).
43
3. По степени доступности БнД делятся на
общедоступные и с ограниченным кругом
пользователей.
4. По охвату БнД:
• территориальный (всемирный, страна,
город),
• временной;
• ведомственный;
• проблемный (тематический).
44
5. По характеру взаимодействия с пользователями
(кто инициализирует действия) БнД делятся на:
– активные БнД;
– пассивные БнД.
В пассивных БнД ведущая роль принадлежит
пользователю.
В активных - система может самостоятельно менять
поведение.
В последнее время термин «активная база данных»
стал часто использоваться для систем,
использующих триггеры.
45
6. По форме собственности БнД делятся на
• государственные;
• негосударственные (частные; групповые;
личные).
46