Справочник от Автор24
Найди эксперта для помощи в учебе
Найти эксперта
+2

Информационные хранилища

Определение 1

Информационные хранилища — это интегрированные предметно-ориентированные информационные базы данных, предназначенные для создания, хранения, пополнения и обслуживания архивов.

Введение

Стремительный прогресс в сфере информационных технологий в течение последних десятилетий привёл к тому, что существенная часть информации, которая относится к разным сторонам функционирования компаний или других организаций, сегодня переведена в электронный формат в системах хранения данных. Практически данные превратились в самый важный актив каждой компании, который обеспечивает успешность ее деятельности, а также возможность оперативного принятия оптимальных решений. По этой причине непрерывно возрастает актуальность разумного применения современных технологий сохранения данных, которые обеспечивают оперативность доступа к необходимой информации и её надежное хранение.

Основой концепции информационного хранилища являются следующие главные идеи:

  • Объединение разъединенных детализированных информационных данных, которые описывают какие-либо конкретные факты, свойства, события и так далее, в единое хранилище.
  • Подразделение совокупности данных и приложений, которые используются для обработки и анализа.

Информационные хранилища

Для реализации информационного хранилища организации в общем случае следует исполнить следующий набор действий:

  1. Выполнить анализ имеющейся информации во всех источниках данных для возможности инвентаризации из семантики и содержания.
  2. Создать проект информационного хранилища данных (схему базы данных) с учетом информации, которая доступна во всех существующих в организации источниках, и данных, необходимых для программных приложений, то есть запросов, генерируемых этими приложениями.
  3. Осуществить извлечение необходимой информации, преобразование этих информационных данных согласно проекту хранилища данных и загрузку преобразованных данных в хранилище.
«Информационные хранилища» 👇
Помощь эксперта по теме работы
Найти эксперта
Решение задач от ИИ за 2 минуты
Решить задачу
Помощь с рефератом от нейросети
Написать ИИ

Концептуально модель информационного хранилища может быть представлена в виде схемы, изображенной на рисунке ниже.

Модель информационного хранилища. Автор24 — интернет-биржа студенческих работ

Рисунок 1. Модель информационного хранилища. Автор24 — интернет-биржа студенческих работ

Данные из разных источников пересылаются в хранилище, а их набор описаний помещается в репозиторий метаданных. Конечный пользователь может с помощью различных инструментов, таких как, средства визуализации, построения отчетов, статистической обработки и так далее, и содержимого репозитория, осуществлять анализ данных, расположенных в хранилище. Итоговым результатом станет информация в формате готовых отчетов, обнаруженных определённых скрытых закономерностей, каких-то прогнозов.

Поскольку средства работы конечного пользователя с информационным хранилищем могут быть самыми разными, то с точки зрения теории их выбор не влияет на структурную организацию хранилища и функции его поддержания в работоспособном состоянии. Физическое воплощение данной концептуальной схемы может быть самым разным.

Виртуальным информационным хранилищем является система, которая предоставляет интерфейсы и методы доступа к регистрирующей системе, эмулирующие работу с данными в этой системе, как с хранилищем данных. Виртуальное информационное хранилище может быть организовано путём создания ряда «представлений» (view) в базе данных или использованием специальных средств доступа, к примеру, продуктов класса Desktop OLAP, к которым относятся, в частности, Business Objects, Brio Enterprise и некоторые другие. Основными преимуществами данного подхода считаются простота и малая стоимость реализации, единая платформа с информационным источником, отсутствие сетевых соединений между источником информации и информационным хранилищем.

Но, следует отметить, что у этого подхода имеется и ряд недостатков. При формировании виртуального информационного хранилища реализуется не хранилище как таковое, а иллюзия его наличия. Структура хранения и само хранение не подвергаются никаким изменениям, и присутствует следующий набор проблем:

  1. Низкая производительность.
  2. Проблема трансформации данных.
  3. Проблема интеграции данных с другими источниками.
  4. Проблема отсутствия истории.
  5. Проблема чистоты данных.
  6. Проблема зависимости от доступности и структуры основной базы данных.

Двухуровневая архитектура информационного хранилища предполагает формирование витрин данных (data mart) без построения центрального хранилища, при этом информация передаётся из регистрирующих систем и ограничена конкретной предметной сферой. При создании витрин применяются базовые принципы формирования информационных хранилищ, поэтому они могут считаться хранилищами данных в миниатюре.

К достоинствам такой системы следует отнести:

  1. Простоту и малую стоимость реализации.
  2. Высокую производительность за счет физического подразделения регистрирующих и аналитических систем, отделения загрузки и трансформации информации в отдельные процессы, а также наличия оптимизированной под анализ структурой хранения данных.
  3. Наличие поддержки истории.
  4. Наличие возможности добавления метаданных.

Формирование полноценного корпоративного информационного хранилища, как правило, осуществляется по трехуровневой архитектуре. На первом уровне располагаются различные информационные источники, такие как, внутренние регистрирующие системы, справочные системы, внешние источники, например, данные информационных агентств, макроэкономические показатели.

На втором уровне расположено центральное хранилище, куда направляются информационные данные от всех источников с первого уровня, и, возможно, оперативный склад информации, не содержащий исторических данных. Наличие оперативного склада информационных данных является необходимостью при разном регламенте поступления информации из источников.

Третий уровень является набором предметно-ориентированных витрин данных, информационным источником для которых выступает центральное хранилище данных. Как раз витрины данных и используют большинство конечных пользователей.

Дата написания статьи: 06.10.2021
Найди решение своей задачи среди 1 000 000 ответов
Крупнейшая русскоязычная библиотека студенческих решенных задач
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot