Кластерные системы — это системы, объединяющие ряд однородных компонентов.
Введение
На рисунке ниже приведена общая структурная организация кластерных систем.
Рисунок 1. Общая структурная организация кластерных систем. Автор24 — интернет-биржа студенческих работ
Здесь использованы следующие обозначения:
- LAN (Local Area Network), то есть, локальная сеть,
- SAN (Storage Area Network), то есть, сеть сохранения данных
Первой в классификацию вычислительных систем термин «кластер» ввела корпорация Digital Equipment Corporation (DEC). Согласно определению, предложенному DEC, кластером является совокупность вычислительных машин, связанных между собою и работающих как единый узел информационной обработки.
Кластер используется как одна система, то есть, с точки зрения пользователей или прикладных задач весь набор вычислительного оборудования представляется в виде одного компьютера. Именно это обстоятельство и может считаться наиболее важным при формировании кластерной системы.
Кластерные системы
Первые образцы кластерных систем фирмы Digital были сформированы на компьютерах VAX. Они уже не выпускаются, но, тем не менее, их все еще эксплуатируют на площадках, на которых эти машины установили много лет тому назад. И, вероятно, самым важным является тот факт, что общие принципы, которые были заложены при их создании, являются базой при формировании кластерных систем и по сей день. Общими требованиями, которые предъявляются к кластерным системам, являются следующие аспекты:
- наличие высокого уровня готовности,
- наличие высокого быстродействия,
- наличие масштабирования,
- наличие общего доступа к ресурсам,
- возможность удобного обслуживания.
Конечно, при каждой конкретной реализации одни из требований могут считаться определяющими, а остальные должны отойти на второй план. Так, к примеру, при создании кластера, для которого наиболее важным параметром выступает быстродействие, то для того чтобы сэкономить ресурсы меньшее внимание может уделяться высокому уровню готовности.
В общем варианте кластер работает в качестве мультипроцессорной системы, поэтому очень важным считается понимание классификации подобных систем в границах распределения программных и аппаратных ресурсов. Такие системы подразделяются на следующие типы:
- Тесно связанные мультипроцессорные системы.
- Умеренно связанные мультипроцессорные системы.
- Слабо связанные мультипроцессорные системы.
Как правило, на платформах, выполненных на основе персональных компьютеров, применяются реализации кластерных систем тесно связанной и умеренно связанной мультипроцессорных архитектур.
С позиций функциональной классификации, кластеры подразделяются на:
- Высокоскоростные системы (High Performance, HP).
- Системы Высокой Готовности (High Availability, HA).
- Кластеры, которые являются смешанными системами.
Высокоскоростные кластеры могут использоваться для задач, требующих существенных вычислительных мощностей. Типичными сферами, в которых применяются такие системы, являются:
- сфера обработки изображений, то есть, рендеринг, распознавание образов,
- сфера научных исследований, а именно, в физике, биоинформатике, биохимии, биофизике,
- сфера промышленности, а именно, геоинформационные задачи, задачи математического моделирования, а также многие другие.
Кластеры, относящиеся к типу систем с высокой готовностью, применяются везде, где стоимость вероятного простоя оборудования будет выше стоимости затрат, требуемых для формирования кластерной системы, в частности это:
- системы, предназначенные для биллинга,
- системы, предназначенные для выполнения банковских операций,
- системы, предназначенные для электронной коммерции,
- системы, предназначенные для управления организацией и тому подобное.
Смешанные системы способны объединить в себе параметры обеих, рассмотренных выше систем. Необходимо все заметить, что кластер, который имеет параметры как High Performance, так и High Availability, в любом случае будет проигрывать в быстродействии системе, предназначенной для высокоскоростных вычислений, а в вероятном времени простоя будет уступать системе, предназначенной для работы в режиме повышенной готовности.
Практически во всех, ориентированных на параллельное вычисление задач, нельзя избежать необходимости передачи данных от одной подзадачи к другой. Это означает, что быстродействие High Performance кластерной системы должно определяться быстродействием отдельных модулей и связей между ними. При этом, влияние скоростных характеристик данных связей на общий уровень производительности системы определяется характером решаемой задачи. Когда задача предполагает частый обмен данными с ее подзадачами, то тогда быстродействию коммуникационного интерфейса должно быть уделено максимальное внимание.
Понятно, что чем меньше взаимодействие частей параллельной задачи между собою, тем меньшее количество времени будет нужно для ее исполнения. Что накладывает соответствующие требования также и на программирование параллельных задач. Главные проблемы при необходимости обмена данными между подзадачами могут возникнуть по той причине, что быстродействие передачи данных между центральным процессором и оперативной памятью модуля может существенно превышать скоростные параметры систем межкомпьютерного информационного обмена. Помимо этого, может оказывать сильное влияние на изменении параметров работы кластерной системы, в сравнении с обычными системами, разница в быстродействии кэш памяти процессоров и меж узловых коммуникационных связей.
Характеристики быстродействия интерфейсов могут быть охарактеризованы следующими параметрами:
- пропускная способность непрерывного потока данных,
- максимальное количество наиболее мелких пакетов, которые могут передаваться за единицу времени.
Сегодня в мире получили распространение достаточно много типов систем высокой готовности и высокого быстродействия.