Методы принятия решений в системах управления
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
МФТИ
МФТИ
Методы обработки
информации и принятия
решений в системах
управления
Кварацхелия Нина Георгиевна
Кандидат технических наук, доцент
Тел: +7-916-392-68-20
Эл.почта: [email protected]
Московский физико-технический институт
МФТИ
Программа курса, часть 2
• Методы принятия решений в системах
управления
• Оптимальное управление. Вариационные
методы
• Метод множителей Лагранжа
• Метод Эйлера-Лагранжа
• Принцип максимума Понтрягина
•
•
•
•
04.05.2021
Теорема разделения
Линейный регулятор
Игровые задачи управления
Методы выбора (принятия решений)
Методы обработки информации и принятия решений в системах управления. Лекция 13.
2
МФТИ
Поиск оптимального управления
Y
U
F
Х
X, Y, F – известны
Xц – цель управления задана
J – критерий оптимизации задан
Нужно найти оптимальное управление U*
04.05.2021
Методы обработки информации и принятия решений в системах управления. Лекция 13.
3
МФТИ
Метод Эйлера-Лагранжа
Задача динамической оптимизации с
фиксированными концами
U(t)
F
Х(t)
𝒙(𝒕) - параметры состояния объекта управления
𝒖(𝒕) - управление (управляющие воздействия)
𝑭 𝒙, 𝒙, 𝒖, 𝒕 = 𝟎 – модель системы
𝑱=
𝒕𝒌
𝝋
𝒕𝟎
𝒙, 𝒙, 𝒖, 𝒕 𝒅𝒕 → 𝒎𝒊𝒏 - критерий оптимизации
𝒙 𝒕𝟎 = 𝒙𝟎 , 𝒙 𝒕𝒌 = 𝒙𝒌 – граничные условия
𝒖* - оптимальное управление
04.05.2021
Методы обработки информации и принятия решений в системах управления. Лекция 13.
4
МФТИ
Метод Эйлера-Лагранжа
Вводится лагранжиан
𝑳 = 𝝋 𝒙, 𝒙, 𝒖, 𝒕 + 𝝀т𝑭(𝒙, 𝒙, 𝒖, 𝒕)
Дополняется критерий
∗
𝒕𝒌
𝑱 =
𝒕𝒌
𝑳𝒅𝒕 =
𝒕𝟎
{𝝋 𝒙, 𝒙, 𝒖, 𝒕 + 𝝀т𝑭 𝒙, 𝒙, 𝒖, 𝒕 } 𝒅𝒕 → 𝒎𝒊𝒏
𝒕𝟎
Условие экстремума (из уравнений Эйлера):
𝝏𝑳(𝒙,𝒙,𝒖,𝒕) 𝒅 𝝏𝑳(𝒙,𝒙,𝒖,𝒕)
𝝏𝒙
𝒅𝒕
𝝏𝒙
=0
При решении уравнений Эйлера используются
граничные условия
𝒙 𝒕𝟎 = 𝒙𝟎 , 𝒙 𝒕𝒌 = 𝒙𝒌
04.05.2021
Методы обработки информации и принятия решений в системах управления. Лекция 13.
5
МФТИ
Посадка на планету
Пример 1: Посадка на планету
Модель движения:
𝒙 𝒕 =𝒗
𝒗 𝒕 =𝒂
𝒖 = 𝒎𝒂 – сила тяги
х
Граничные условия:
𝒙 𝟎 = 𝒙𝟎 𝒗 𝟎 = 𝒗𝟎
𝒙 𝒕𝒌 = 𝟎, 𝒗 𝒕𝒌 = 𝟎
Критерий оптимизации:
𝒕𝒌
J= 𝟎 𝒌𝒖𝟐𝒅𝒕 → 𝒎𝒊𝒏 – расход топлива
Найти оптимальное управление 𝒖*(𝒕)
04.05.2021
Методы обработки информации и принятия решений в системах управления. Лекция 12.
6
МФТИ
Посадка на планету
Модель движения:
𝒙 − 𝒗 = 𝟎, 𝒗 − 𝒂 = 𝟎
Запишем в векторной форме
𝑭 = 𝑨𝑿 + 𝑩𝑿=0
𝒙
𝟎 −𝟏 𝟎
𝑿 = 𝒗 𝑨 = 𝟎 𝟎 −𝟏
𝒂
𝟎 𝟎
𝟎
𝟏 𝟎 𝟎
𝑩= 𝟎 𝟏 𝟎
𝟎 𝟎 𝟎
𝝋 = 𝒌𝒖𝟐 = 𝒌𝒎𝟐𝒂𝟐 - функция критерия
𝝀= 𝝀𝟏 𝝀𝟐 𝝀𝟑 - множители Лагранжа
𝑳=𝒌𝒎𝟐𝒂𝟐+ 𝝀т(𝑨𝑿 + 𝑩𝑿) - лагранжиан
𝑳=𝒌𝒎𝟐𝒂𝟐+ 𝝀𝟏(𝒙 − 𝒗)+ 𝝀𝟐(𝒗 − 𝒂)+ 𝝀𝟑*0
04.05.2021
Методы обработки информации и принятия решений в системах управления. Лекция 13.
7
МФТИ
Посадка на планету
𝑳=𝒌𝒎𝟐𝒂𝟐+ 𝝀𝟏(𝒙 − 𝒗)+ 𝝀𝟐(𝒗 − 𝒂)
Уравнения Эйлера
𝝏𝑳 𝒅 𝝏𝑳
𝝏𝒙 𝒅𝒕 𝝏𝒙
𝝏𝑳 𝒅 𝝏𝑳
𝝏𝒗 𝒅𝒕 𝝏𝒗
𝝏𝑳 𝒅 𝝏𝑳
𝝏𝒂 𝒅𝒕 𝝏𝒂
𝒅
= 0 → - 𝝀𝟏=0 → -𝝀𝟏=0 → 𝝀𝟏=c1
𝒅𝒕
𝒅
= 0→-𝝀𝟏- 𝝀𝟐=0→ 𝝀𝟐= -𝝀𝟏 → 𝝀𝟐=c2-c1t
𝒅𝒕
=0
→2𝒌𝒎𝟐𝒂-
𝝀𝟐=0 →
𝝀𝟐
c2−c1t
𝒂=
𝟐=
2𝒌𝒎 2𝒌𝒎𝟐
𝒖 = 𝒎𝒂
c2−c1t
𝒖=
2𝒌𝒎
04.05.2021
Методы обработки информации и принятия решений в системах управления. Лекция 13.
8
МФТИ
Посадка на планету
Используем модель объекта для 𝒗 𝒕 и граничные условия
𝒗 𝒕 = 𝒗𝟎 +
𝒗 𝒕 = 𝒗𝟎 +
𝒕
𝒂(t)𝒅𝒕=𝒗𝟎
𝟎
+
𝒕−
𝒕𝟐
c2
c1
𝒕 c2−c1t
(
)𝒅𝒕
𝟎 2𝒌𝒎𝟐
2𝒌𝒎
4𝒌𝒎
c2
c1
𝟐=0
𝒗 𝒕𝒌 = 𝒗𝟎 +
𝒕
−
𝒕
2𝒌𝒎𝟐 𝒌 4𝒌𝒎𝟐 𝒌
𝟏
c1 𝒕𝒌 − c2= 2𝒌𝒎2𝒗𝟎/𝒕𝒌
𝟐
𝟐
𝟐
𝟏
c 𝒕
𝟐 1 𝒌
− 2𝒌𝒎2𝒗𝟎/𝒕𝒌
𝒗 𝒕 = 𝒗𝟎 +
−
𝟐 𝒕𝒌𝒕−𝒗𝟎
c2=
04.05.2021
c1
4𝒌𝒎
𝒕
𝒕𝒌
c1
𝟐=𝒗
𝒕
𝟐
𝟎
4𝒌𝒎
𝒕𝒌−𝒕
𝒕𝒌
+
c1
4𝒌𝒎
𝟐
𝒕(𝒕𝒌 − 𝒕)
Методы обработки информации и принятия решений в системах управления. Лекция 13.
9
МФТИ
Посадка на планету
Используем модель объекта для 𝒙 𝒕 и граничные условия
𝒕
𝒙 𝒕 = 𝒙𝟎 +
𝒙 𝒕 = 𝒙𝟎 +
𝒙 𝒕𝒌 =0
c1= − (𝒙𝟎 +
c2=
04.05.2021
𝟎
𝒕
𝒕𝒌−𝒕
(𝒗
𝟎 𝟎 𝒕𝒌
𝒙 𝒕 = 𝒙𝟎 +
𝟏
c1 𝒕𝒌
𝟐
𝒗(t)𝒅𝒕
+
c1
4𝒌𝒎
𝟏𝟐𝒌𝒎𝟐
𝒗𝟎𝒕𝒌) 3
𝒕𝒌
−
=−
𝟎
𝒕𝒌
𝒕(𝒕𝒌 − 𝒕)) 𝒅𝒕
c1
2
𝒕+
(𝟑𝒕
−
𝟐𝒕)𝒕
𝒌
12𝒌𝒎𝟐
𝟐𝒕𝒌−𝒕
𝒗𝟎
𝒕𝒌
2𝒌𝒎2𝒗
𝟐
𝟔𝒌𝒎𝟐
𝒙𝟎 2
𝒕𝒌
−
𝟖𝒌𝒎𝟐
𝒗𝟎
𝒕𝒌
Методы обработки информации и принятия решений в системах управления. Лекция 13.
10
МФТИ
Посадка на планету
c2−c1t
𝒖 𝒕 =
2𝒌𝒎
Подставляем c1 и c2
𝒖 𝒕 =−
𝟑𝒎
𝒙𝟎 2
𝒕𝒌
−
𝟒𝒎
𝒗𝟎
−(𝒙𝟎
𝒕𝒌
+
𝟔𝒎
𝒗𝟎𝒕𝒌) 2 𝒕
𝒕𝒌
Оптимальное управление
𝒖
∗
04.05.2021
𝒕 =−
𝟑𝒎
𝒙𝟎 3 (𝒕𝒌
𝒕𝒌
+ 𝟐𝒕)−
𝟐𝒎
𝒗𝟎 2 (𝟐𝒕𝒌
𝒕𝒌
+𝟑𝒕)
Методы обработки информации и принятия решений в системах управления. Лекция 13.
11
МФТИ
Оптимальная траектория
Пример 2: Оптимальная траектория
Модель движения:
𝒙𝟏 = 𝒙𝟐 − 𝟐
𝒙𝟐 = 𝒖
Граничные условия:
𝒙𝟏 𝟎 = 𝟎 𝒙𝟐 𝟎 = 𝟎
𝒙𝟏 𝟏 = −𝟏, 𝒙𝟐 𝟏 = 𝟎
Критерий оптимизации:
𝟏 𝟐
J= 𝟎 𝒖 𝒅𝒕 → 𝒎𝒊𝒏 – расход топлива
Найти оптимальное управление 𝒖*(𝒕)
04.05.2021
Методы обработки информации и принятия решений в системах управления. Лекция 12.
12
МФТИ
Оптимальная траектория
𝑳=𝒖𝟐+ 𝝀𝟏(𝒙𝟏 − 𝒙𝟐+2)+ 𝝀𝟐(𝒙𝟐 − 𝒖)
Уравнения Эйлера
𝝏𝑳 𝒅 𝝏𝑳
𝝏𝒙 𝒅𝒕 𝝏𝒙
𝝏𝑳 𝒅 𝝏𝑳
𝝏𝒗 𝒅𝒕 𝝏𝒗
𝒅
= 0 → - 𝝀𝟏=0 → -𝝀𝟏=0 → 𝝀𝟏=c1
𝒅𝒕
𝒅
= 0→-𝝀𝟏- 𝝀𝟐=0→ 𝝀𝟐= -𝝀𝟏 → 𝝀𝟐=c2-c1t
𝒅𝒕
c2−c1t
= 0 →2𝒖- 𝝀𝟐=0 → 𝒖= =
2
2
c2−c1t
𝒖=
2
𝝏𝑳 𝒅 𝝏𝑳
𝝏𝒂 𝒅𝒕 𝝏𝒂
04.05.2021
𝝀𝟐
Методы обработки информации и принятия решений в системах управления. Лекция 13.
13
МФТИ
Оптимальная траектория
Используем модель объекта для 𝒙𝟐 𝒕 и граничные
условия
𝒙𝟐 𝒕 =
𝒕
𝒕 c2−c1t
𝒖(t)𝒅𝒕= 𝟎 (
)𝒅𝒕
𝟎
2
c2
c1 𝟐
𝒙𝟐 𝒕 = 𝒕 − 𝒕
2
4
c2 c1
𝒙𝟐 𝟏 = − =0
2 4
c2=
𝟏
c1
𝟐
c1 c1 𝟐 c1
𝒙𝟐 𝒕 = 𝒕− 𝒕 = (𝒕 − 𝒕𝟐)
4
4
4
04.05.2021
Методы обработки информации и принятия решений в системах управления. Лекция 13.
14
МФТИ
Оптимальная траектория
Используем модель объекта для 𝒙𝟏 𝒕 и граничные условия
𝒕
𝒙𝟏 𝒕 =
𝒙𝟏 𝒕 =
𝟎
(𝒙𝟐(t) − 𝟐)𝒅𝒕
𝒕 c1
( (𝒕
𝟎 4
c1
𝒙𝟏 𝒕 =
4
𝒙 𝟏 =-1
− 𝒕𝟐)−2) 𝒅𝒕
𝟏 𝟐
𝒕
𝟐
𝟏 𝟑
− 𝒕
𝟑
c1 𝟏 𝟏
−
4 𝟐 𝟑
− 𝟐𝒕
− 𝟐=-1
c1= 𝟐𝟒
c2= 𝟏𝟐
∗
𝒖 =6-1𝟐𝒕
𝒙𝟏 𝒕 =-2𝒕𝟑 +3𝒕𝟐 𝒙𝟐 𝒕 =-6𝒕𝟐+6𝒕
04.05.2021
Методы обработки информации и принятия решений в системах управления. Лекция 13.
15
МФТИ
04.05.2021
Оптимальная траектория
Методы обработки информации и принятия решений в системах управления. Лекция 13.
16
МФТИ
04.05.2021
Оптимальная траектория
Методы обработки информации и принятия решений в системах управления. Лекция 13.
17
МФТИ
04.05.2021
Оптимальная траектория
Методы обработки информации и принятия решений в системах управления. Лекция 13.
18