Оптимальные системы
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
2. ОПТИМАЛЬНЫЕ СИСТЕМЫ
2.1. Введение
Оптимальные системы – это системы, в которых заданное качество работы
достигается за счет максимального использования возможностей объекта, иными
словами это системы, в которых объект работает на пределе своих возможностей.
Рассмотрим апериодическое звено первого порядка
K
W (p) = ——― ,
Tp+1
(2.1)
│u│≤ A,
(2.2)
для которого необходимо обеспечить минимальное время перехода у из начального
состояния y(0) в конечное yK. Переходная функция такой системы при K=1 выглядит
следующим образом
y
yk
t
Рис. 2.1. Переходная функция системы при U= const.
Рассмотрим ситуацию, когда на вход объекта подаем максимально возможное
управляющее воздействие.
y
A
yk
t1
t
Рис. 2.2. Переходная функция системы при U=A= const.
t1 - минимально возможное время перехода y из нулевого состояния в конечное
для данного объекта.
Для получения такого перехода существует два закона управления:
- программное управление
A, t < t1
y=
(2.3)
yk, t ≥ t1;
- закон управления типа обратной связи
A,
y=
yk,
y < yk
(2.4)
y ≥ yk;
Второй закон более предпочтителен и позволяет обеспечить управление при
помехах.
yk
u
─
K
——―
Tp+1
Рис. 2.3. Структурная схема системы с законом управления типа обратной связи.
2.2. Постановка задачи синтеза оптимальных систем.
2.2.1. Математическая модель объекта.
Объект описан переменными состояния
•
x = f(x,u)
x∈Rn , u∈Rm, m ≤ n,
(2.5)
где функция f(x,u) непрерывна, дифференцируема по всем аргументам и удовлетворяет
условию существования и единственности решения дифференциального уравнения. Эта
функция является нелинейной, но стационарной.
В качестве частных случаев объект может иметь вид нелинейной системы с
аддитивным управлением
•
x = f(x) + B(x)u,
(2.6)
либо линейной системой
•
x = Ax + Bu,
(2.7)
Объект должен быть представлен в одной из трех форм, представленных выше.
2.2.2. Множество начальных и конечных состояний.
Задача оптимального перехода из начального состояния в конечное представляет
собой краевую задачу, где начальные и конечные точки могут быть заданы одним из
четырех способов, представленных на рис. 2.4.
xn
а)
xn
б)
x(T)
x(0)
x(0)
Ωx(T)
x1
x1
в)
xn
г)
xn
x(T)
Ωx(T)
Ωx(0)
Ωx(0)
x1
x1
Рис.2.4. Фазовые портреты перехода системы из начального состояния в
конечное для различных задач:
а) задача с фиксированными концами,
б) задача с фиксированным первым концом (фиксированная начальная точка
и множество конечных значений),
в) задача с фиксированным правым концом,
г) задача с подвижными концами.
Для объекта множество начальных состояний может в общем случае совпадать с о
всем множеством состояний либо с рабочей областью, а множество конечных состояний
является подпространством множества состояний или рабочей области.
Пример 2.1.
В любую ли точку пространства состояний можно перевести объект, описываемый
системой уравнений ?
x = 2x1 – x2 + u ;
x = - x1 – x2 + 2u;
Запишем уравнения статики для данного объекта
2x10 – x20 + u = 0;
- x10 – x20 + 2u = 0;
Подставив во второе уравнение значение U из первого уравнения u = x20 – 2x10, получим
-5x10 + x20 = 0;
Получили множество конечных состояний, описываемое уравнением
x20 = 5x10;
Таким образом, множество конечных состояний, задаваемое для объекта (системы), должно
быть реализуемым.
2.2.3. Ограничения на состояния и управление
x2
Ωx
x1
Рис. 2.5. Общий вид рабочей области пространства состояний.
Выделяется рабочая область пространства состояний, которая оговаривается. Как
правило, эта область описывается ее границами с помощью модульных соглашений.
xi≤ xi,
i = 1, n
u2
Ωu(T)
u1
Рис.2.6. Вид рабочей области пространства состояний,
заданной модульными соглашениями.
Также задается ΩU – область допустимых значений управляющего воздействия. На
практике область ΩU задается также с помощью модульных соотношений.
Ui ≤ Ūi,
i=1,n
Задача синтеза оптимального регулятора решается при условии ограничений на
управление и ограниченном ресурсе.
2.2.4. Критерий оптимальности.
На этом этапе оговариваются требования, предъявляемые к качеству работы
замкнутой системы. Требования задаются в обобщенном виде, а именно в виде
интегрального функционала, который носит название критерия оптимальности.
Общий вид критерия оптимальности:
T
J = min ∫ f 0(x,u)dt ,
U∈ΩU
(2.8)
Частные виды критерия оптимальности:
1) критерий оптимальности, обеспечивающий минимум времени переходного процесса
(решается задача оптимального быстродействия)
T
J = min
U ∈ΩU
∫ dt
;
(2.9)
2) критерий оптимальности, обеспечивающий минимум затрат энергии:
- по одной из компонент
T
J = min
∫x
2
i
dt ;
(2.10)
J = min ∫ x T Pxdt ;
(2.11)
U ∈ΩU
- по всем переменным состояниям
T
U ∈ΩU
- по одному управляющему воздействию
T
J = min
U ∈ ΩU
∫u
2
i
(t)dt ;
(2.12)
Qudt ;
(2.13)
- по всем управляющим воздействиям
T
J = min
U ∈ ΩU
∫u
T
- по всем компонентам (в самом общем случае)
T
J = min ∫ (xT Px + u T Qu)dt.
U∈ΩU
(2.14)
2.2.5. Форма результата
Необходимо оговорить в каком виде будем искать управляющее воздействие.
Возможны два варианта оптимального управления U0:
- u0 = u0(t) – используется при отсутствии возмущения,
- u0 = u0(x) – оптимальное управление в виде обратной связи (замкнутое управление).
Формулировка задачи синтеза оптимальной системы в общем виде:
Для объекта, описанного переменными состояниями с заданными ограничениями и
множеством начальных и конечных состояний, необходимо найти управляющее
воздействие, обеспечивающее качество процессов в замкнутой системе,
соответствующее критерию оптимальности.
2.3. Метод динамического программирования
2.3.1. Принцип оптимальности
Исходные данные:
•
x = f(x,u) ,
ui ≤ Ūi,
x∈Rn , u∈Rm, m ≤ n,
x(0), x(T) ,
T
J = min ∫ f 0 (x,u)dt
U ∈ΩU
Необходимо найти u0
xn
x(T)
x(0)
x1
Рис. 2.7. Фазовый портрет перехода системы из начальной точки в конечную
в пространстве состояний
Траектория перехода из начальной точки в конечную будет оптимальной и
единственной.
Формулировка принципа:
Конечный участок оптимальной траектории есть также оптимальная траектория.
Если бы переход из промежуточной точки в конечную не осуществлялся бы по
оптимальной траектории, то для него можно было бы найти свою оптимальную
траекторию. Но в этом случае переход из начальной точки в конечную проходил бы по
другой траектории, которая должна была бы быть оптимальной, а это невозможно, так
как оптимальная траектория единственная.
2.3.2. Основное уравнение Беллмана.
Рассмотрим объект управления произвольного вида
•
x = f(x,u) ,
x∈Rn , u∈Rm,
m ≤ n,
Необходимо обеспечить переход из начальной точки в конечную с критерием
оптимальности
T
J = min ∫ f 0(x,u)dt .
U ∈ΩU
(2.16)
Рассмотрим переход в пространстве состояний
xn
x(T)
x(t)
x(t+∆t)
x1
Рис. 2.8. Фазовый портрет перехода системы из начальной точки в конечную
x(t) – текущая (начальная) точка, x(t+∆t) – промежуточная точка.
Выберем промежуточную точку и рассмотрим поэтапный переход
J = J + J = min
1
2 u∈Ω
t + ∆t
T
∫ f 0(x,u)dτ + min
∫ f (x,u)dτ
u ∈ Ω t + ∆t 0
t
u
u
(2.17)
Преобразуем выражение
J = min {
t + ∆t
∫
u∈Ω u
T
f 0 (x,u)d τ +
∫f
(x,u)d τ }
(2.18)
t + ∆t
t
Заменим второй интеграл на V(x(t+∆t))
J = min {
u∈Ωu
t + ∆t
∫ f (x,u)dτ + V(x(t + ∆t)}
(2.19)
t
При малом значении ∆t βведем допущения:
t + ∆t
1)
∫
f 0 (x,u)d τ ≈ f 0 (x,u) ∆x
(2.20)
t
2) Разложим вспомогательную функцию
V(x(t + ∆t)) = V(x(t)) +
∂V
∆x + R ,
∂x T
J = min {f 0 (x,u) ∆x + V(x(t)) +
u∈Ω u
∂V
∆x}
∂x T
Выполняя дальнейшие преобразования, получим
∂V
J = min {f 0 (x,u)∆x + T ∆x} + min V(x(t)) ,
u∈Ωu
u∈Ωu
∂x
где min V(x(t)) и есть критерий оптимальности J
В результате получили
∂V
min {f 0 (x,u)∆x + T ∆x} = 0 .
u ∈Ωu
∂x
Разделим обе части выражения на ∆t и устраним ∆t к нулю.
(2.21)
(2.22)
(2.23)
(2.24)
min {f 0 (x,u) +
u∈Ωu
∂V •
x }= 0,
∂x T
(2.25)
•
где x = f(x,u)
Получим основное уравнение Беллмана
∂V
min {f 0 (x,u) + T f(x,u)} = 0
U ∈ΩU
∂x
(2.26)
2.2.3. Расчетные соотношения метода динамического программирования
V∈R1
Основное уравнение Белмана содержит (m+1) - неизвестных величин, т.к. U0∈Rm ,
∂V
f(x,u 0 ) = 0
T
∂x
∂V ∂f
+ T
0 = 0
∂x ∂u u =u
f 0 (x,u 0 ) +
∂f 0
∂u
u =u 0
(2.27)
Продифференцировав m раз, получим систему из (m+1) уравнений.
Для ограниченного круга объектов решение полученной системы уравнений дает
точное оптимальное управление. Такая задача носит название задачи АКОР
(аналитического конструирования оптимальных регуляторов).
Объекты, для которых рассматривается задача АКОР, должны удовлетворять
следующим требованиям:
•
1) x = Ax + Bu
2) T → ∞ ,
3) Критерий оптимальности должен быть квадратичным
J = min
u ∈ Ωu
∞
∫ (x
T
Px + u T Qu)dt .
Пример 2.2
Для объекта, описываемого уравнением
•
x = −2x + u ,
необходимо обеспечить переход из x(0) в x(T) по критерию оптимальности
∞
J = min ∫ (5x 2 + u 2 )dt ,
u∈Ω u
5x 2 + U 02 +
2U 0 +
∂V
(−2x + U 0 ) = 0
∂x
∂V
=0
∂x
U1= 5x,
U2= -6x
Проанализировав объект на устойчивость, получим
U0 = U2 = -6x.
2.4. Принцип максимума Понтрягина
min {f 0 (x,u ) +
u∈ Ω u
или
max {-f 0 (x,u)u∈Ωu
∂V
f(x,u)} = 0
∂x T
(2.28)
∂V
f(x,u)} = 0
∂x T
(2.29)
•
x = f(x,u)
T
J = min ∫ f 0(x,u)dt
u∈Ωu
Введем расширенный вектор состояний, который расширяем за счет нулевой
компоненты, в качестве которой выбираем критерий оптимальности. z∈Rn+1
T
x 0 ∫ f 0 (x,U)d τ
x 0
x1
z = 1 =
M
.
M
xn
xn
(2.30)
Также введем расширенный вектор правых частей, который расширяем за счет функции,
стоящей под интегралом в критерии оптимальности.
f 0 (x,u)
f (x,u)
ϕ = 1
M
f n (x, u)
(2.31)
Введем Ψ – вектор сопряженных координат
∂V
Ψ = [Ψ 0 Ψ 1 K Ψ n ] = − 1 ∂x1
K -
∂V
∂x n
(2.32)
Сформируем Гамильтониан, представляющий собой скалярное произведение Ψ и φ(z,u)
H(Ψ,z,u) = Ψ•φ(z,u),
(2.33)
max H (Ψ, z , u ) = 0
(2.34)
u∈Ω u
Уравнение (2.34) называется основным уравнением принципа максимума Понтрягина,
основанное на уравнении динамического программирования
Оптимальным является управление, которое на заданном интервале времени
доставляет максимум Гамильтониана. Если бы ресурс управления не был бы ограничен,
то для определения оптимального управления можно было бы воспользоваться
необходимыми и достаточными условиями экстремума. В реальной ситуации для
отыскания
оптимального
управления
необходимо
анализировать
величину
Гамильтониана при предельном значении уровня. В этом случае U будет функцией
расширенного вектора состояний и вектора сопряженных координат
u0 = u0(z, Ψ)
Для отыскания сопряженных координат необходимо решить систему уравнений
•
Ψ = −
∂H
.
∂z T
2.4.1. Процедура расчета системы по принципу максимума Понтрягина.
1. Уравнения объекта должны быть приведены к виду, стандартному для синтеза
оптимальных систем.
•
x∈Rn, u∈Rm, m≤n
Необходимо оговорить также начальные и конечные состояния и записать
критерий оптимальности
x = f(x,u) ,
T
J = min ∫ f 0 (x,u)dt .
u∈Ωu
(2.35)
2. Вводятся расширенный вектор состояний
x0
x
z = 1 ,
M
xn
расширенный вектор правых частей
f 0 (x,u)
f (x,u)
ϕ= 1
M
f
(x,u)
n
(2.36)
(2.37)
и вектор сопряженных координат
Ψ = [Ψ 0 Ψ 1 K Ψ n ] .
(2.38)
3. Записываем Гамильтониан как скалярное произведение
H(Ψ,z,u) = Ψ•φ(z,u),
(2.39)
4. Находим максимум Гамильтониана по u
max H ( Ψ , z , u ) = 0 ,
(2.40)
u∈Ω u
по которому определяем оптимальное управление u0(Ψ,z).
5. Записываем дифференциальные уравнения для вектора сопряженных координат
•
∂H
Ψ =− T .
(2.41)
∂z
Находим сопряженные координаты как функцию времени
Ψ= Ψ(t).
(2.42)
6. Определяем окончательный оптимальный закон управления
u0= u0(t) .
(2.43)
Как правило, этот способ позволяет получить программный закон управления.
Пример 2.3.
Для объекта, представленного на рис. 2. 9. необходимо обеспечить переход из начальной точки
y(t) в конечную y(t) за T= 1c с качеством процесса
T
J = min ∫ u 2 Qud τ
u∈Ω u
U
1
p
1
p
Рис. 2.9. Модель объекта
1. W(p)=y/U = 1/p2
•
x 1 = x 2
•
x 2 = u
x1(0)=0
x1(T)=1
x2(0)=0
x2(T)=0
2.
x0
z = x1 ,
x 2
u 2
ϕ = x2 ,
u
Ψ = [Ψ 0 Ψ 1 Ψ 2 ] .
3.
H(Ψ,Z,U) = Ψ0u2 + Ψ1x2 + Ψ3u.
4.
max H :
U∈Ω u
∂H
= 2Ψ 0 u + Ψ 2 ,
∂u
u0= - Ψ2/2 Ψ0.
5.
y
•
∂H
∂H
== 0,
∂x 0
∂z 1
Ψ 0 = C 0 = const;
•
∂H
∂H
== 0,
∂z 2
∂x 1
Ψ 1 = C 1 = const;
•
∂H
∂H
== − Ψ 1 = -C1 ,
∂z 3
∂x 2
Ψ 2 = C1 t + C 2 .
Ψ0 = Ψ1 = Ψ2 = 6.
− C1 + C 2
Ψ2
=−
= b1 t + b 2
2Ψ 0
2C 0
Для определения констант b1 и b2 нужно решить краевую задачу.
u0 = −
Запишем уравнение замкнутой системы
•
x 1 = x 2
•
x 2 = b 1 t + b 2
Проинтегрируем
t
x 2 (t) = x 2 (0) + ∫ (b 1 τ + b 2 )dτ =
1
b 1 t 2 + b 2 t,
2
t
1
1
1
x 1 (t) = x 1 (0) + ∫ ( b 1 τ 2 + b 2 τ)dτ = b 1 t 3 + b 2 t 2 .
2
6
2
Рассмотрим конечную точку t=T=1с.
x1(T)=1
x2(T)=0
1= 1/6 b1 + 1/2 b2
0= 1/2b1 + b2
Получили систему уравнений, из которой находим b2 = 6, b1 = -12.
Запишем закон управления u0= -12t + 6.
2.4.2. Задача оптимального управления
•
x = f(x,u) ,
x∈Rn, u∈Rm, m≤n
Для объекта общего вида необходимо обеспечить переход из начальной точки в
конечную за минимальное время при ограниченном законе управления.
T
J = min
u ∈Ω u
∫ dτ ,
u ≤u.
(2.44)
Особенности задачи оптимального быстродействия
1. Гамильтониан быстродействия.
H = Ψ▪φ = Ψ0▪1 + Ψ1▪f1(x,u) +…+ Ψn▪fn(x,u),
(2.45)
Ψ0=-1.
(2.46)
H = -1 + Ψ1▪f1(x,u) +…+ Ψn▪fn(x,u),
(2.47)
~
Hб = Ψ1▪f1(x,u) +…+ Ψn▪fn(x,u) = Ψ ▪f(x,u)
(2.48)
~
Ψ =[Ψ1,…, Ψn]
(2.49)
max H б = +1 .
u∈Ω
(2.50)
u
2. Релейность управления.
Эта особенность имеет место для релейных объектов.
•
x = f(x,u) , x∈Rn,
u ≤u
u∈Rm, m≤n,
~
Hб = Ψ ▪(Ax+Bu);
max H б :
u∈Ωu
~
u 0 = u i ⋅ sign( Ψ Bi )
3. Теорема о числе переключений управляющего воздействия.
Эта теорема справедлива для линейных моделей с вещественными корнями
характеристического уравнения.
det(pI-A)=0
(2.51)
Λ(A) – вектор вещественных собственных чисел.
Формулировка теоремы:
В задаче оптимального быстродействия с вещественными корнями
характеристического уравнения число переключений не может быть больше, чем (n-1),
где n – порядок объекта, следовательно, число интервалов постоянства управления не
будет больше, чем (n-1).
+ū
t1
t2
t
-ū
Рис. 2.10. Вид управляющего воздействия при n=3.
Пример2.4
.
Рассмотрим пример решения задачи оптимального быстродействия:
T0 &y& + 2dT 0 y& + y = u ,
y(0) = 0 y(T)
,
⇒
y& (0) = 0 y& (T)
1.
u ≤u,
T
J = min ∫ dτ,
U∈Ω U
T0=1
•
x 1 = x 2
•
1
2d
1 .
x 2 = − 2 x 1 − x 2 + 2 u
T0
T0
T0
2. Ψ=[Ψ1, Ψ2].
3. Hб= Ψ1x2+ Ψ2( -2dx2 –x1+u).
4.
max H б :
U∈Ω u
u 0 = u ⋅ signΨ 2
5.
∂H
&
Ψ 1 = − ∂x = Ψ 2
1
,
∂
H
Ψ
& =−
= 2dΨ 2 − Ψ 1
2
∂x 2
& 0
Ψ
1 Ψ1
1
& =
⋅ ,
Ψ 2 − 1 2d Ψ 2
−1
p
det(pI - A) =
= p 2 + 2dp + 1 .
1 p − 2d
При d ≥ 1 - корни вещественные
d ≥ 1 ⇒ Ψ1(t ) = c1 ⋅ e λ1 ⋅t + c2 ⋅ e λ2 ⋅t
Ψ2 (t ) = Ψ&1(t )
Сумма двух экспонент представляет собой:
Ψ
U
+U
⇒
t
t
−U
Если 0 < d < 1 , то корни комплексно-сопряженные и решение будет представлять собой
периодическую функцию. В реальной системе, переключений не более 5 - 6.
2.4.3. Метод поверхности переключений
Данный метод позволяет найти управление функций переменной состояния для случая когда оптимальное
управление носит релейный характер
U = U ( x) .
Таким образом этот метод можно применять при решении задач оптимального быстродействия, для объекта с
аддитивным управлением
x& = f ( x ) + B( x ) ⋅ U ,
U 0 = U ⋅ sign(Ψ ⋅ Bi ) .
Суть метода заключается в том, чтобы во всём пространстве состояний выделить точки, где происходит
смена знака управления и объединить их в общую поверхность переключений.
U 0 = U ⋅ signS ( x ) ,
S ( x ) = 0 - поверхность переключений
S ( x ) = 0 ⇒ xn = F ( x1 ,..., xn −1 ) .
Закон управления будет иметь следующий вид
(
)
U 0 = U ⋅ sign − xn − F ( x1 ,..., xn −1 ) .
Для формирования поверхности переключений удобнее рассматривать переход из произвольной начальной точки в
начало координат
x( 0) → x(T ) = 0 .
Если конечная точка не совпадает с началом координат, то необходимо выбрать новые переменные, для которых это
условие будет справедливо.
Имеем объект вида
x& = f ( x ) + B( x ) ⋅ U .
Рассматриваем переход
x( 0) → x(T ) = 0 , с критерием оптимальности
T
J = min ∫ f 0 ( x ,U ) ⋅ dτ .
Этот критерий позволяет найти закон управления такого вида
U 0 = U ⋅ sign(Ψ ⋅ Bi ) ,
с неизвестным Ψ ( 0) , начальные условия Ψ ( 0) нам также неизвестны.
Рассматриваем переход:
Метод обратного времени
(метод попятного движения)
Этот метод позволяет определить поверхности переключений.
Суть метода заключается в том, что начальная и конечная точки меняются местами, при этом вместо двух
совокупностей начальных условий остаётся одна для Ψ ( 0) .
Каждая из этих траекторий будет оптимальна. Сначала находим точки, где управление меняет знак и
объединяем их в поверхность, а затем направление движения меняем на противоположное.
Пример
Передаточная функция объекта имеет вид
W ( p) =
y
1
= 2.
U
p
Критерий оптимальности быстродействия
T
J = min ∫ dτ
U
Ограничение на управление U ≤ A .
Рассмотрим переход
y( 0) y( T ) = 0
.
→
y& ( 0) y& ( T ) = 0
1)
x&1 = x2
,
x&2 = U
2)
x1( 0) x1(T ) = 0
.
→
x2 ( 0) x2 ( T ) = 0
3)
T
J = min ∫ dτ
U
оптимальное управление будет иметь релейный характер
U 0 = A ⋅ signΨ2 (t ) .
4) Перейдём в обратное время (т.е. − t ). В обратном времени задача будет иметь такой вид
x&1 = − x2
.
x&2 = −U
5) Рассмотрим два случая:
1. U = + A
Получим уравнения замкнутой системы
x&1 = − x2
.
x&2 = − A
Воспользуемся методом непосредственного интегрирования, получим зависимость x1( t ) от x2 (t )
и поскольку A - const , то имеем
x2 ( t ) = x2 (0) − A ⋅ t ,
т.к. начальные и конечные точки поменяли местами, то x1( 0) = 0 , x2 ( 0) = 0 получим
t=
x2
,
−A
(*)
аналогично
t2
x1( t ) = x1(0) − A ⋅
2
x1 = A ⋅
t2
2
подставив (*), получим
x2 2
x1 =
2⋅ A ,
отсюда
x2 = 2 ⋅ A ⋅ x1 .
Построим получившееся и по методу фазовой плоскости определим направление
2. U = − A
x&1 = − x 2
x& 2 = A
Применив метод непосредственного интегрирования, получим:
x1( t ) = −
A ⋅ t2
2
⇒
t=
x2
,
A
x2 2
x2 ( t ) = A ⋅ t ⇒ x1 = −
,
2⋅ A
x2 = − 2 ⋅ A ⋅ x1 .
Функция будет иметь вид:
Изменив направление
точка смены знака
(точка переключения)
Общее аналитическое выражение:
x2 = − 2 ⋅ A ⋅ x1 ⋅ signx1 .
Уравнение поверхности:
S ( x ) = − x2 − 2 ⋅ A ⋅ x1 ⋅ signx1 = 0 .
Оптимальный закон управления:
U 0 = A ⋅ signS ( x ) ,
подставив уравнение поверхности, получим:
[
]
U 0 = A ⋅ sign − x2 − 2 ⋅ A ⋅ x1 ⋅ signx1 .
2.5. Субоптимальные системы
Субоптимальные системы - это системы близкие по свойствам к оптимальным
J 0 - характеризуется критерием оптимальности.
J1 > J 0
∆ = J 1 − J 0 - абсолютная погрешность.
δ=
J1 − J 0
J
⋅ 100% - относительная погрешность.
Субоптимальным называют процесс близкий к оптимальному с заданной точностью.
Субоптимальная система - система где есть хоть один субоптимальный процесс.
Субоптимальные системы получаются в следующих случаях:
1. при аппроксимации поверхности переключений (с помощью кусочно-линейной аппроксимации, аппроксимация
с помощью сплайнов);
U p = A ⋅ sign S p ( x )
при
x 2 в субоптимальной системе будет возникать оптимальный процесс.
2. ограничение рабочей области пространства состояний;
T 2 &&y + 2dTy + y = U
x2
x1
S ( x) = 0
3.АДАПТИВНЫЕ СИСТЕМЫ
3.1.Основные понятия
Адаптивными системами называют такие системы, в которых параметры регулятора меняются вслед за изменением
параметров объекта, таким образом, чтобы поведение системы в целом оставалось неизменным и соответствовало
желаемому:
x& = A( t ) ⋅ x + B( t ) ⋅ U ,
x& = f ( t , x , U ) .
Существует два направления в теории адаптивных систем:
1. адаптивные системы с эталонной моделью (АСЭМ);
2. адаптивные системы с идентификатором (АСИ).
3.2. Адаптивные системы с идентификатором
Идентификатор - устройство оценки параметров объекта (оценка параметров должна осуществляться в реальном
времени).
АР
.
ОУ
U
АР - адаптивный регулятор
ОУ - объект управления
U - идентификатор
.
Часть, которая выделена пунктиром, может быть
реализована в цифровом виде.
Рис1. Функциональная схема
АСИ
V, U, X - могут быть векторы. Объект может быть
многоканальным.
Рассмотрим работу системы.
В случае неизменных параметров объекта, структура и параметры адаптивного регулятора не
меняются, действует главная обратная связь, система представляет собой систему стабилизации.
Если параметры объекта меняются, то они оцениваются идентификатором в реальном времени и
происходит изменение структуры и параметров адаптивного регулятора так, чтобы поведение системы
оставалось неизменным.
Основные требования предъявляются к идентификатору (быстродействие и т.д.) и к самому алгоритму
идентификации.
Такой класс систем используют для управления объектами с медленными нестационарностями.
Если мы имеем нестационарный объект общего вида:
x& = A( t ) ⋅ x + B( t ) ⋅ U ,
x ∈R n , y ∈R m .
Простейший адаптивный вид будет следующий:
U = − k ( t ) ⋅ x + k ( t ) ⋅ V = k ( t ) ⋅ [V − x] .
Требования, которые предъявляются к системе:
x& = A * ⋅ x + B * ⋅ V ,
V ∈R m ,
где
(*)
A * и B * - матрицы постоянных коэффициентов.
Реально мы имеем:
x& = A( t ) ⋅ x + B( t ) ⋅ k ( t ) ⋅ V − B( t ) ⋅ k ( t ) ⋅ x
или
x& = [ A(t ) − B(t ) ⋅ k (t )] ⋅ x + B(t ) ⋅ k (t ) ⋅ V
(**)
Если приравнять (*) и (**), то получим соотношение для определения параметров регулятора
A( t ) − B( t ) ⋅ k ( t ) = A *
⇒ k (t)
*
B( t ) ⋅ k ( t ) = B
3.3.Адаптивные системы с эталонной моделью
В таких системах существует эталонная модель (ЭМ), которая ставится параллельно объекту.
БА - блок адаптации.
V
.
АР
U
.
ОУ
БА
ЭМ
y
∆
( )
Рис2.
Функциональная схема АСЭМ
Рассмотрим
системы.
ym
работу
В том случае, когда параметры объекта не меняются или процессы на выходе соответствуют
эталонным, ошибка
∆ = y − ym = 0,
не работает блок адаптации и не перестраивается адаптивный
регулятор, в системе действует плавная обратная связь.
Если поведение отлично от эталонного, это происходит при изменении параметров объекта, в этом
случае появляется ошибка
∆ = y − ym ≠ 0 ,
включается блок адаптации, перестраивается структура
адаптивного регулятора, таким образом чтобы свести к эталонной модели объекта.
Блок адаптации должен сводить ошибку к нулю (
∆( t ) → 0 ).
Алгоритм, закладываемый в блок адаптации, формируется различными способами, например, с
использованием второго метода Ляпунова:
V ( ∆ ) > 0, V (0) = 0
&
& (0) = 0 .
V
∆
<
,
V
(
)
Если это будет выполняться, то система будет асимптотически устойчива и
∆( t ) → 0 .