Теория оптимального управления — это теория, которая направлена на проектирование систем, обеспечивающих для заданных объектов управления управляющую последовательность воздействий, которые позволяют достичь максимума или минимума заданного набора критериев качества системы.
Введение
Существует пара понятий, которые неразрывно связаны с управлением. Первым из них является цель, которая может быть указана в явном формате или заложена в конструкцию устройства управления. Вторым понятием является управляемый динамический объект. Если перефразировать известный философский тезис, то можно утверждать, что без объекта не существует и управления, хотя управляющее устройство может представлять собой отдельный предмет. Термин «динамический» определяет свойство объекта обладать реакцией на управляющее воздействие постепенно (свойство инерционности) или лишь через определённый временной интервал (свойство запаздывания).
Важнейшей характеристикой управления, которая отличает его от взаимодействия, считается несоразмерность масштабов деятельности объекта и управляющих воздействий. Как и любое количественное отличие, которое представлено малым масштабом деятельности управления по сравнению с объектом, является в некоторой степени условным. К примеру, несомненно, что один или два пастуха способны управлять передвижением стада овец. Но если число пастухов соизмеримо с числом овец, то это уже становится аналогом взаимодействие двух популяций. Подобные примеры могут бы найдены и в технической сфере.
Последствием указанного отличия в масштабах считается фактическое отсутствие обратного воздействия управляемого объекта на управляющее устройство. В отдельных человеко-машинных системах проектировщики вынуждены искусственно создавать подобное влияние.
Теория оптимального управления
Ниже приведена структурно-функциональная схема процесса управления.
Рисунок 1. Структурно-функциональная схема процесса управления. Автор24 — интернет-биржа студенческих работ
Здесь:
- X (t) является желаемой траекторией управляемого объекта.
- U(t) является управляющим сигналом или стратегией управления, обеспечивающим необходимое передвижение объекта.
- y(t) является доступной непосредственному наблюдению
- выходной величиной объекта.
- x(t) является оценкой текущего состояния объекта, которая позволяет сравнить её с требуемым состоянием.
- u(t) является дополнительным корректирующим воздействием при отклонении текущего состояния от требуемого.
На основании цели управления и сведений о характеристиках управляемого объекта (обозначено как Модель управляемого объекта), может быть сформировано представление о его требуемом поведении X (t) на определённом интервале времени, а также о том, какими средствами управления U (t) это поведение можно достигнуть. Формирование этих вектор-функций выполняется в блоке Вычисление траектории и управления. Управляющие сигналы направляются в исполнительные устройства Управляемого динамического объекта. Реакцией на управляющие воздействия, станет изменение объектом своего состояния.
Достаточно часто непосредственно будет наблюдаться не изменение состояния объекта, а изменение некоторых выходных величин, которые зависят от состояния объекта, а также от управляющих и возмущающих воздействий. Эти выходные величины определяются вектор-функцией y(t). Поэтому должна быть поставлена задача восстановления состояния объекта, которая выполняется в блоке Измерение состояния объекта. Оценка текущего состояния объекта x(t) затем должна вычитаться из его требуемого состояния, и сигналы рассогласования передаются в блок Коррекции отклонений фактического поведения от требуемого. В данном модуле формируется дополнительный сигнал управление u(t), предназначенный для возвращения объекта на требуемую траекторию.
Следует отметить, что управление по рассогласованию между требуемым и фактическим состоянием объекта называется замкнутым или управлением, использующем принцип отрицательной обратной связи. Когда замкнутого контура нет, то такое управление называется разомкнутым или программным управлением.
Основным недостатком разомкнутого управления считается в отсутствии реакции на непредвиденные возмущающие воздействия. Как следует из приведённой выше схемы, возмущения подразделяются на измеряемые и не измеряемые. Учёт измеряемых возмущений в дополнительном управлении способен исключить их воздействие на поведение управляемого объекта. Причём системы с обратной связью способны существенно уменьшить и влияние не измеряемых возмущений.
Необходимо обратить также внимание на тот факт, что процессы управления подразделяется на следующие этапы:
- Этап предварительного формирования траектории и управляющих воздействий.
- Этап реализации траектории и управления.
Причём на первом этапе требуется выстроить траекторию, которая самым лучшим образом соответствует цели. На втором этапе также желательно самым лучшим образом вернуть объект на требуемую траекторию. Наилучшие в данном смысле траектории и управляющие воздействия именуются оптимальными.
В набор задач проектировщика систем управления входят следующие проблемы:
- Расчёт оптимальной траектории и оптимальной стратегии управления.
- Формирование замкнутой системы управления, способной поддерживать объект на оптимальной траектории.
- Формирование и уточнение модели управляемого объекта.
- Проектирование устройств, предназначенных для измерения состояния объекта, а также возмущающих воздействий.
Теория оптимального управления появилась в середине двадцатого века как методика разрешения практических задач управления техническими, экономическими, организационными и, вообще, динамическими системами различной природы. Теория оптимального управления считается прямой наследницей стандартных дисциплин математики, а именно:
- Методики оптимизации (экстремум в конечномерных пространствах).
- Вариационное исчисление (экстремум в пространствах непрерывных кусочно-гладких функций).