Системы и сети хранения данных — это совокупность специализированных технических устройств и программного обеспечения, которая предназначена для хранения и трансляции значительных информационных массивов.
Введение
Системой хранения данных является совокупность аппаратного и программного обеспечения, которая предназначена для хранения и оперативной обработки больших информационных объемов. Информацией являются файлы, включая и медиа файлы, структурированные, например, в системах управления базами данных (СУБД), и неструктурированные данные (big data), совокупность резервных копий, архивные данные. В качестве информационных носителей могут использоваться жесткие диски, главным образом SSD (системы All Flash Array), а также набор гибридных решений, которые могут сочетать в себе SSD- и HDD-накопители в одной системе хранения данных.
От обычного жесткого диска пользователя система хранения данных отличается сложной архитектурной организацией, возможностью объединения хранилищ в сеть трансляции данных, наличием специального программного обеспечения для обслуживания системы хранения, продвинутыми технологиями, предназначенными для резервного копирования, сжатия и виртуализации.
Системы и сети хранения данных
Системы хранения данных могут иметь отличия по определенному набору параметров, выбор которых может влиять на использование системы хранения данных. Уровни хранения в системах хранения данных подразделяются на следующие типы:
- тип блочного хранилища;
- тип файлового хранилища;
- тип объектного хранилища;
- тип сетевого доступа.
Блочное хранилище в системе хранения данных является, по сути, обычным диском, который может быть отформатирован. На него можно установить операционную систему, формировать на нем логические диски. Весь набор данных хранится не в виде файлов, а в виде блоков, что способно ускорить процедуры ввода и вывода информации. Наиболее часто блочные хранилища применяются в сетях типа SAN (Storage Attached Network). Они могут подойти для организации высокопроизводительных вычислительных процессов, СУБД, для хранения больших информационных объемов, а также могут использоваться как среда разработки (Dev/Test). К недостаткам этого типа следует отнести:
- Высокий уровень сложности настройки и обслуживания, требующие соответствующего уровня квалификации.
- Достаточно высокая стоимость.
В файловом хранилище данные сохраняются в виде файлов, размещенных в отдельных каталогах. Подобная система хранения данных может использоваться для сохранения «холодной» информации, не требующейся для операционных вычислений. На основе файловых хранилищ обычно формируются NAS (Network Attached Storage). К недостаткам файлового хранилища следует отнести следующие моменты:
- При постоянном возрастании информационных объемов становится более сложной иерархия папок, и скорость работы системы хранения данных постепенно уменьшается.
- Файловое хранилище не предназначено для нагрузок, требующих повышенной скорости отклика.
Объектным хранилищем является тип системы хранения данных, ориентированный на обработку больших объемов неструктурированных данных, которые могут достигать петабайтов. Информация сохраняется не в виде файлов, а в виде «объектов», имеющих уникальные идентификаторы и метаданные. По этой причине объектное хранилище аналогично по структурной организации базе данных. Объектное хранилище может использоваться в аналитике, big data, машинном обучении, для сохранения «тяжелых» медиа-файлов и резервных копий, формирования и эксплуатации программных приложений в облаке, хостинга веб-сайтов. По скоростным параметрам данный тип уступает блочному типу хранилища в задачах, которые связаны с транзакционными нагрузками.
Сетевой доступ NAS (network-attached storage) представляет собой файловый сервер, включенный в локальную сеть. Организация доступа к дисковому хранилищу может осуществляться через протоколы NFS (в UNIX/Linux-системах) или CIFS (Windows). NAS может использоваться для обработки данных файлового типа, которые требуют коллективного одновременного доступа, к примеру, к общей документации Word и Excel. NAS способен работать «поверх» имеющейся локальной сети, при помощи общих коммутаторов и маршрутизаторов.
Сетевой доступ SAN (storage area network) является сетью, которая предназначена для использования хранилищ разного типа (диски, оптические приводы, ленточные массивы), но которые могут восприниматься операционной системой в качестве единого логического хранилища данных, или в качестве сетевого логического диска. Здесь могут быть использованы протоколы iSCSI (IP-SAN) и FibreChannel (FC). Для того чтобы подключить компьютерное оборудование следует использовать адаптеры HBA (Host Bus Adapter). В системе SAN используется, главным образом, блочный тип хранения данных. Подразделение SAN/NAS уже не является таким строгим, как это было в начале двадцать первого века, так как с разработкой протокола iSCSI производители начали выпуск гибридных решений.
Для того чтобы оценить способность системы хранения данных восстанавливаться после сбоев, то есть ее отказоустойчивость, можно использовать определенные показатели, а именно, RPO и RTO. Показатель RPO (recovery point objective) определяет период, за который могут быть утеряны данные. То есть, это период между моментом аварии и временем, когда создавалась последняя резервная копия.
Когда RPO равняется двенадцати часам, то при отказе системы управления хранилищем вероятна утеря информации, которая была накоплена за это время. RPO может влиять на выбор технологии аварийного восстановления и определяется стоимостью потери конкретных объемов данных.
Показатель RTO (recovery time objective) является временем, за которое восстанавливается доступ к системе хранения данных.