Принцип максимума Понтрягина
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
МФТИ
МФТИ
Методы обработки
информации и принятия
решений в системах
управления
Кварацхелия Нина Георгиевна
Кандидат технических наук, доцент
Тел: +7-916-392-68-20
Эл.почта: ngkvara@gmail.com
Московский физико-технический институт
МФТИ
Программа курса, часть 2
• Методы принятия решений в системах
управления
• Оптимальное управление. Вариационные
методы
• Метод множителей Лагранжа
• Метод Эйлера-Лагранжа
• Принцип максимума Понтрягина
•
•
•
•
04.05.2021
Теорема разделения
Линейный регулятор
Игровые задачи управления
Методы выбора (принятия решений)
Методы обработки информации и принятия решений в системах управления. Лекция 15.
2
МФТИ
Принцип максимума Понтрягина
Задача динамической оптимизации с нефиксированным
концом
U(t)
F
Х(t)
𝒙(𝒕) - параметры состояния объекта управления
𝒖(𝒕) - управление (управляющие воздействия)
𝑭 𝒙, 𝒙, 𝒖, 𝒕 = 𝟎 – модель поведения системы
𝒙 𝒕𝟎 = 𝒙𝟎 – начальные условия
𝜽 𝒙∗, 𝒕∗ = 𝟎 – целевое (конечное) состояние системы
Момент достижения цели 𝒕∗ не известен
Критерий оптимизации
𝑱𝟏 =
𝒕∗
𝝋
𝒕𝟎
𝒙, 𝒙, 𝒖, 𝒕 𝒅𝒕 → 𝒎𝒊𝒏
𝒖* - оптимальное управление
Необходимо найти (𝒙∗, 𝒕∗, 𝒖*)
04.05.2021
Методы обработки информации и принятия решений в системах управления. Лекция 15.
3
МФТИ
Принцип максимума Понтрягина
Модель системы:
𝑭 𝒙, 𝒙, 𝒖, 𝒕 = 𝟎 или 𝒙 = 𝒇(𝒙, 𝒖, 𝒕)
Критерий оптимизации в форме Больца
𝑱 = 𝜽 𝒙, 𝒕 +
𝒕∗
𝝋
𝒕𝟎
𝒙, 𝒙, 𝒖, 𝒕 𝒅𝒕 → 𝒎𝒊𝒏
Гамильтониан:
𝑯 = 𝝋 + 𝝀𝑻𝒇
Уравнения Понтрягина:
𝝏𝑯
𝝏𝝀
𝝏𝑯
𝝏𝒙
𝝏𝑯
𝝏𝒖
=𝒙
𝒙 = 𝒇(𝒙, 𝒖, 𝒕)
= -𝝀
𝝏𝝋
𝝏𝒙
𝝏𝝋
𝝏𝒖
+
𝝏𝒇
𝝀
𝝏𝒙
𝝏𝒇
𝝀
𝝏𝒖
= -𝝀
=𝟎
+
=0
𝒙 𝒕𝟎 = 𝒙𝟎 – начальные условия
𝝀(𝒕∗) =
04.05.2021
𝝏𝜽
𝝏𝒙
t=t* - условия трансверсальности
Методы обработки информации и принятия решений в системах управления. Лекция 15.
4
МФТИ
Линейный регулятор
𝒖
B
𝒙
1/S
𝒙
A
Модель объекта:
𝒙 = 𝑨𝒙 + 𝑩𝒖
Начальные условия:
𝒙 𝒕𝟎 = 𝒙𝟎
Целевое состояние системы:
𝒙𝑻𝑺𝒙 → 𝒎𝒊𝒏
Критерий оптимальности:
𝒕
𝑱 = 𝒙𝑻𝑺𝒙 + 𝒕 ( 𝒙𝑻𝑸𝒙 + 𝒖𝑻𝑹𝒖)𝒅𝒕 → 𝒎𝒊𝒏 – минимизация ресурсов
𝟎
Найти оптимальное управление 𝒖* , конечное состояние 𝒙* и
момент времени 𝒕∗
04.05.2021
Методы обработки информации и принятия решений в системах управления. Лекция 15.
5
МФТИ
Линейный регулятор
Гамильтониан:
𝑯 = 𝝋 + 𝝀𝑻𝒇 = 𝒙𝑻𝑸𝒙 + 𝒖𝑻𝑹𝒖 +𝝀𝑻(𝑨𝒙 + 𝑩𝒖)
Уравнения Понтрягина:
𝝏𝑯
𝝏𝒙
𝝏𝑯
𝝏𝒖
=−𝝀
(𝑸𝑻 + 𝑸)𝒙 +𝑨𝑻𝝀 = − 𝝀 (1)
=𝟎
𝑹𝑻 + 𝑹 𝒖 +𝑩𝑻𝝀 = 0
(2)
Из уравнения (2) получаем:
𝒖 = − 𝑹𝑻 + 𝑹
-1𝑩𝑻𝝀
Из условия трансверсальности:
∗
𝝀(𝒕 ) =
𝝏𝜽
𝝏𝒙
t=t*
следует, что 𝝀(𝒕 ∗) = (𝑺𝑻 + 𝑺)𝒙(𝒕 ∗)
04.05.2021
Методы обработки информации и принятия решений в системах управления. Лекция 15.
6
МФТИ
Линейный регулятор
Введем 𝝀 𝒕 = 𝑷(𝒕)𝒙(𝒕)
Если 𝝀 = 𝑷𝒙 то 𝝀 = 𝑷𝒙 + 𝑷𝒙
Из уравнения Понтрягина (1)
(𝑸𝑻 + 𝑸)𝒙 +𝑨𝑻𝝀 = − 𝝀
Получаем:
− 𝑷𝒙 − 𝑷𝒙 = (𝑸𝑻 + 𝑸)𝒙 +𝑨𝑻𝑷𝒙
(3)
Далее
𝒙 = 𝑨𝒙 + 𝑩𝒖 = 𝑨𝒙 − 𝑩 𝑹𝑻 + 𝑹
−1𝑩𝑻𝑷𝒙
(4)
Подставим в (3)
− 𝑷𝒙 − 𝑷𝑨𝒙 + 𝑷𝑩 𝑹𝑻 + 𝑹
−1𝑩𝑻𝑷𝒙
= (𝑸𝑻 + 𝑸)𝒙 +𝑨𝑻𝑷𝒙
Отсюда получаем уравнение Рикатти:
𝑷 =− 𝑷𝑨 − 𝑨𝑻𝑷 + 𝑷𝑩 𝑹𝑻 + 𝑹
−1𝑩𝑻𝑷
− (𝑸𝑻 + 𝑸) (5)
Оптимальное управление:
𝒖 ∗= − 𝑹𝑻 + 𝑹
𝒖 ∗= −𝑲𝒙
04.05.2021
-1𝑩𝑻𝑷𝒙
= −𝑲𝒙
Методы обработки информации и принятия решений в системах управления. Лекция 15.
7
МФТИ
Линейный регулятор
𝒖*
𝒙
B
1/S
𝒙
A
-K
∗
𝒖 = −𝑲𝒙 - оптимальное управление
𝑲 = 𝑹𝑻 + 𝑹 -1𝑩𝑻𝑷 – коэффициент усиления
𝑷 =− 𝑷𝑨 − 𝑨𝑻𝑷 + 𝑷𝑩 𝑹𝑻 + 𝑹
уравнение Рикатти
04.05.2021
−1𝑩𝑻𝑷
− (𝑸𝑻 + 𝑸) –
Методы обработки информации и принятия решений в системах управления. Лекция 15.
8