Виртуальные данные — это симуляция реальных данных в информационной сфере.
Виртуальные данные: сущность понятия
Процесс виртуализации в компьютерной области начинался с оперативной памяти, следующими стали системы сохранения, потом серверные и системы коммуникаций, и, наконец, подошёл черёд информационных данных. Информационные технологии сейчас перестали в качестве ориентира принимать аппаратные блоки и технологические процессы, что было их основным направлением в течение последних примерно шестидесяти лет.
Сегодня на передовой линии прогресса уже стоит не физика операций с приборами, машинами, устройствами, а логика обработки данных. Такое смещение направления развития отражается во всех применениях виртуальных технологий (память, система хранения информации, каналы связи, серверные системы) и все они указывают на переход от аппаратных блоков к главенству информационных данных. Виртуальные данные стали появляться при реализации разных сценариев, служивших для применения архитектурных сервисов в виде новых направлений в технологии, типа «информация как сервис» и «информация по запросу». Оба сервиса скорее концепции использования, нежели собственно технологические структуры. Смысл их в общем то ясен, для появления возможности у сервисов выполнить задуманные функции, они должны быть обеспечены необходимой информационной поддержкой.
Поскольку такие сервисы универсальны по своей природе, то и их обеспечение тоже должно быть универсальным. К примеру, это может быть промежуточное программное обеспечение, работающее между массивами данных и сервисом. Следует также заметить, что одно время была модная тенденция заменять слово данные на слово информация, но сегодня идёт снова возврат к данным и специалисты более часто стали говорить именно о виртуальных данных. В этой формулировке уже нет неопределённости и всё становится понятным с точки зрения логики.
Процесс виртуализации данных
Смысл формирования виртуальных данных (их виртуализации) можно свести к простой формулировке: это абстрагирование данных от физического, конкретного формата их сохранения. А именно это и есть одно из главных сегодняшних направлений развития, переход от приоритета аппаратуры к приоритету данных, с конкретных форматов на общие, которое касается всех сфер информационных технологий, от смартфонов до общественных хранилищ данных.
Любой процесс формирования виртуальных данных — это их накопление в общем пуле и затем их перераспределение между пользователями. То есть разрозненные данные, места хранения которых остаются неизменными, соединяются в виртуальное хранилище, а потом пересылаются в различные приложения, аналитические системы и так далее.
Подводя итог, можно сказать, что под виртуализацией данных понимается операция открытия доступа к данным удалённым пользователям через интерфейс, который скрывает всю техническую реализацию сохранения и обработки данных (методика хранения, расположение, архитектура, используемые языки). Мостом виртуализации данных является некий добавочный процесс, который изолирует конкретные места хранения данных от использующих их программ. Эти программы не располагают информацией о конкретном местоположении баз данных и серверов. Для этого применяются разнообразные способы:
- Сервер федерации, который формирует набор данных из различных источников как единообразное огромное их хранилище.
- Процесс виртуализации выполняется сервисной шиной организации, которая выполняет операции абстрагирования и предоставляет необходимые данные программам в формате сервисных приложений.
- Использование облачных технологий для хранения данных, при этом потребителям так же недоступно истинное расположение хранилищ.
- Создание виртуальных баз данных в области памяти, которые подпитываются из конкретных систем управления базами данных.
- Возможна индивидуальная методика для какого-либо предприятия.
Федерализация данных является одним из доступных форматов представления данных в разнородных хранилищах, которая предусматривает одинаковый процесс обращения к ним. Иными словами, представление данных в виртуальной форме не всегда сопряжено с федерацией, но итогом федерализации всегда будет виртуальная форма. Существует ещё термин «интеграция информации организации», который по сути является периодом эмбриона при виртуальном процессе и используется, как правило, для данных в формате таблиц.
На таком уровне не было возможности обеспечить необходимую универсальность, при интеграции данных для двух программ не гарантировалась доступность этих данных ещё одной программе. К тому же такая методика не позволяет работать с большими массивами данных и практически не масштабируется. Во времена облачных хранилищ и «больших данных» такие методы не имеют перспективы и поэтому возникает необходимость в виртуальном представлении данных, что может быть реализовано с различными уровнями автоматизаций. Эти уровни делятся на:
- Наиболее простой или базовый (основной) уровень.
- Уровень средней продвинутости (или продвинутый).
- Самый высокий или интеллектуальный уровень.
Методы основного уровня являются по сути перемещением данных из одного места хранения на другое и их объединению, а применяемые при этом технологические приёмы предполагают работу со специалистами, которые занимаются администрированием данных. Взаимодействие между местами хранения данных представляются в форме таблиц, что требует знаний специалистов высокой квалификации, поскольку эти работы очень сложные и трудоёмкие. Поэтому, данный уровень характеризуется большой ценой такого виртуального решения, а также высокой стоимостью его эксплуатационных работ, так как трудно выполнить вторичное применение уже отработанных задач. Каждую новую проблему по интеграции необходимо разрешать снова.
Продвинутый уровень характерен применением метаданных, которые хранятся в определённых подкаталогах. Применение же интеллектуального уровня приводит к полной гармонии использования данных, выполняется синхронизация по данным большого числа программ.