Справочник Автор24
Лекторий Автор24
Лекционные и методические материалы по высшей математике
Проекционные методы исследования операций. Теория матриц и проекционные операторы

Проекционные методы исследования операций. Теория матриц и проекционные операторы

⌛ 2020 год
👀 285 просмотров
📌 262 загрузки
🏢️ Санкт-Петербургский политехнический университет

Выбери формат для чтения

Конспект лекции по дисциплине «Проекционные методы исследования операций. Теория матриц и проекционные операторы», pdf

Загружаем конспект в формате pdf

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Проекционные методы исследования операций. Теория матриц и проекционные операторы», Word формат

Санкт-Петербургский политехнический университет Петра Великого ------------------------------------------------------------------------Институт компьютерных наук и технологий Высшая школа «Киберфизические системы и управление» В.Н. КОЗЛОВ, А.А. ЕФРЕМОВ ПРОЕКЦИОННЫЕ МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ Санкт-Петербург 2020 ВВЕДЕНИЕ. ТЕОРИЯ МАТРИЦ И ПРОЕКЦИОННЫЕ ОПЕРАТОРЫ A1. Свойства следов матриц Если соответствующие пары матриц согласованы, то следы матриц обладают следующими свойствами 1. tr  A + B  = tr A + trB. 2. tr  AC  = tr CA. Доказательства этих результатов получаются непосредственной проверкой. Если A − симметричная невырожденная квадратная матрица i ( i = 1,2,..., n ) − ее собственные числа, то размера n  n и 3. tr A = n   , 4. i =1 i n tr  A  =  is , 5. tr  A−1  =  i=1 i−1. n s i =1 Доказательство. Поскольку матрица A симметрична, то существует такая вещественная ортогональная матрица T , что T AT = diag ( 1 , 2 ,..., n ) =  . Поэтому  i = tr  = tr T AT  = tr  ATT  = tr A . Тогда свойство (4) следует из соотношения  = (T AT )  (T AT )  ...  (T AT ) = T A T , а (5) s следует из соотношения  −1 s = (T AT ) = T  A−1T . Свойство (3) выполнено −1 для любой квадратной матрицы, в чем можно убедиться, рассматривая коэффициент для значения  n−1 в уравнении  I n − A = 0 . 2. Ранги матриц 1. Если матрицы A и B согласованы, то rank  AB   min ( rank A, rank B ). Доказательство. Строки матрицы AB являются линейными комбинациями строк матрицы B , так что число линейно независимых строк в матрице AB меньше, чем в матрице B , и Подобным же образом, столбцы матрицы rank  AB   rank  B  . AB являются линейными комбинациями столбцов матрицы B . Следовательно, rank  AB   rank A . 2. Если A − произвольная, а P и Q − любые две согласованные с A невырожденные матрицы, то rank  PAQ  = rank A . Доказательство. Поскольку справедливы равенства rank A  rank  AQ   rank  AQQ −1  = rank A , то rank A = rank  AQ  и т.д. 3. ( m  n ) − матрица, Пусть A − произвольная размерность N ( A) r = rank A , s− (нулевого пространства или ядра матрицы A ), т.е. Ax = 0 . Тогда: r + s = n. Доказательство. Пусть 1 ,  2 ,..., s − базис нулевого пространства размерность пространства x : N ( A) . Дополним эту совокупность векторов до базиса a1 ,  2 , ...,  s , 1 ,  2 ,..., t n − мерного евклидова пространства En . Всякий вектор из R  A − образа матрицы A можно представить в виде t t t t  s  Ax = A   ai  i +  b j  j  = A  b j  j =  b j A j =  b j  j = c. j =1 j =1 j =1 j =1  i=1  Предположим, что справедливо равенство t c  j =1 j j = 0. Тогда и c  t  t A  c j  j  =  c j  j = 0  j =1  j =1 j  j  N ( A) . Однако, это возможно, только если c1 = c2 = ... = ct = 0 , так что векторы  1 ,  2 , ...,  t линейно зависимы. Поскольку каждый вектор Ax из R  A , как образа матрицы A, можно выразить с помощью векторов  j , то эти векторы образуют базис R  A . Поэтому t = r . Поскольку s + t = n , то доказательство завершено. 4. Справедливы следующие равенства rank A = rank A = rank  AA = rank  AA. Ax = 0  AAx = 0 и AAx = 0   xAAx = 0  Ax = 0 . Поэтому ядра матриц A и AA совпадают. Поскольку же матрицы A и AA имеют одинаковое число столбцов, то, Доказательство. Пусть согласно A 2.3 , rank A = rank  AA . Аналогично получаем, что rank A = rank  AA , откуда и вытекает искомый результат. 5. Если R  A − образ матрицы A как пространство, порожденное столбцами матрицы A , то R  AA = R  A . Доказательство. Для равенства b = Aa имеем AAa = Ab , так что R  AA  R  A . Тогда согласно A 2.4 , эти два пространства должны совпадать, так как они имеют одинаковые размерности. 6. Если матрица A симметрична, то rank A равняется числу ненулевых собственных значений. Доказательство. В соответствии с A 2.2 имеет место равенство rank A = rank T AT  = rank  . 7. Всякая симметричная матрица A имеет n ортонормированных собственных векторов, и пространство R  A порождается теми из них, которые соответствуют ненулевым собственным значениям. Доказательство. Из соотношения T AT вытекает, что AT = T  , т.е. Ati = i ti , где T = ( t1 ,..., tn ) . Векторы ti ортогональны, поскольку T − ортогональная матрица. Пусть i = 0 ( i = r + 1, r + 2,..., n ) и x =  i=1 ai ti . n Тогда n n r r i =1 i =1 i =1 i =1 Ax = A  ai ti =  ai Ati =  ai i ti =  bi ti , и пространство R  A порождается векторами t1 , t2 ,..., tr . А 3. Положительно полуопределенные матрицы. Симметричная матрица A называется полуопределенной (п.о.), если для всех x выполняется неравенство xAx  0 . 1. Собственные значения п.п.о. матрицы неотрицательны. Доказательство. Если T AT =  , то подстановкой x = Ty мы получим xAx = yT ATy = 1 y12 + ... + n yn2  0 . Полагая y j =  ij , приходим к неравенству 0  xAx = i . 2. Если матрица п.п.о., то tr A  0 . Это вытекает из А 3.1 и А 1.3. 3. Матрица A является п.п.о матрицей ранга r в том и только в том случае, когда существует такая ( n  n ) − матрица R ранга r , что A = R R . Доказательство. Если A − п.п.о матрица ранга r , то, согласно А 2.А 3.1,  = diag ( 1 , 2 ,..., r , 0,...,0 ) , где Пусть  1 2 ( i  0 ( i = 1, 2,..., r ). ) = diag 1 2 , 2 2 ,..., r 2 , 0,...,0 . 1 1 1 Тогда из соотношения T AT =  вытекает, что A = T  2 T  2 T  = R R , 1 где rank R = rank  Обратно, если 1 2 1 =r. A = R R , rank A = rank R = r ( À 2.4 ) то и xAx = xR Rx = yy  0 , где y = Rx . 4. Если A − п. п. о. ( n  n ) − матрица ранга r , то существует такая ( n  r ) − матрица S ранга r , что S AS = I r . Доказательство. Из соотношения  T AT =  r  0 вытекает, что T1 AT1 =  r , столбцами матрицы T . 0 0  где T1 − матрица, образованная первыми r Полагая теперь S = T1  r 2 , мы приходим к 1 искомому результату. 5. Если A − п.п.о. матрица, то X AX = 0  AX = 0 . Доказательство. ( B = RX ) , Согласно А 3.3, 0 = X AX = X R RX = BB а отсюда следует, что bi bi = 0 , т.е., bi = 0 для каждого столбца bi матрицы B . Поэтому AX = RB = 0 . А 4. Положительно определенные матрицы Симметричная матрица A называется положительно определенной (п.о.), если xAx  0 для всех x, x  0 . Отметим, что всякая п.о. матрица является также и п.п.о. матрицей. 1. Все собственные значения п.о. матрицы A положительны (доказательство аналогично А 3,1); поэтому такая матрица A является невырожденной (А 2.6). 2. Матрица A является п.о. тогда и только тогда, когда существует такая невырожденная матрица R , что A = R R . Доказательство. Этот результат вытекает из 3.3 при r = n . 3. Если матрица A положительно определена, то это свойство имеет −1 также и матрица A . −1 Доказательство. Матрица A −1 = ( R R ) = ( R ) R −1 = SS  , где S − −1 невырожденная матрица. Искомый результат следует теперь из А 4.2. 4. Если матрица A положительно определена, rank CAC  = rank C . то Доказательство. Имеют место следующие равенства для рангов матриц rank CAC  = rank CR RC  = = rank CR  = (в силу А 2.4) = rank C (в силу А 2.2). 5. Если матрица размера A − положительно определенная ( n  n ) − матрица, а C − ( p  n) имеет ранг p , то C AC  − также положительно определенная матрица. Доказательство. Прежде всего, xC A C x = yAy  0 , причем равенство здесь достигается тогда и только тогда, когда y = 0 , т.е. C x = 0 и x = 0 (столбцы матрицы C  − линейно независимы). Отсюда следует, что xCAC x  0 для всех x  0 . 6. Если матрица X размера n  p имеет ранг p , то матрица X  X положительно определена. Доказательство. Мы имеем неравенство x X  xX = yy  0 , в котором равенство достигается тогда и только тогда, когда Xx = 0 , т.е. x = 0 (столбцы матрицы X линейно независимы). 7. Матрица A положительно определена в том и только в том случае, когда все ее главные миноры (включая и A ) положительны. Доказательство. Если матрица A положительно определена, то в силу А 4.1 A = T T A = T AT =  =  i  0. i Положим  a11 Ar  a  r1 Тогда имеют место соотношения a1r  ,  arr   x1    xr =   . x   r x  xr Ar xr = ( xr , 0 ) A  r   0 для xr  0 0  и матрица Ar − положительно определена. Поэтому, если матрица A имеет размер ( n  n ) , то из приведенного выше материала следует, что Ar  0 , r = 1,2,..., n . Обратно, предположим, что все главные миноры матрицы A положительны. Покажем, что при этом матрица A положительно определена. Пусть  A , c A =  n−1 ,    c , c I ,   R =  n−1 ,    0 , −1 где  = An−1 c . Тогда −1  A , 0 RAR =  n−1 ,  , k   где k = RAR An−1 = R 2 A An−1  0 (матрица R не вырождена). Далее действуем по индукции. При n = 1 результат очевиден. Предположим, что он верен для матриц порядка до n − 1 включительно. Если положить y = R −1 x ( x  0 ) , то получим x Ax = yRAR y = yn −1 An−1 yn−1 + k yn2  0 , поскольку матрица An−1 y  0. Следовательно, указанный результат справедлив и для матриц порядка n . положительно определена по предположению индукции и 8. Все диагональные элементы п.о. матрицы положительны. Доказательство. Полагая x j = i j ( j = 1,2,..., n ) , имеем 0  x Ax =  i j . 9. Если A − положительно определенная. ( n  n ) − матрица, ( n  n ) − матрица, а B− A − tB положительно определена для всех достаточно малых по абсолютной величине значений t . Доказательство. Если t = 0 , то i − й главный минор матрицы A − tB , являющийся функцией от t , положителен (А 4.7). Но поскольку эта функция непрерывна, он будет положительным и для t   i , где  i достаточно мало. симметричная Возьмем теперь то матрица  = min (1 , 2 ,..., n ) . Тогда при t   все главные миноры будут положительны, и искомый результат вытекает из А 4.7. 10. Разложение Холецкого. Если матрица A положительно определена, то существует единственная верхняя треугольная матрица U с положительными диагональными элементами, для которой A = U U . Доказательство. Далее используется метод индукции и предположим, что указанная однозначно определенная факторизация имеет место для матриц порядка до n − 1, включительно. Таким образом  An−1 , c   U n−1 U n−1 , c  A=  =  c, ,  c , a a nn  nn    где U n−1 − однозначно определенная верхняя треугольная матрица с положительными диагональными элементами. Поскольку определитель треугольной матрицы равен произведению ее диагональных элементов, то матрица U n−1 не вырождена, и можно определить матрицу  U n−1 , U =  0, d  , k где d = (U n−1 ) c и k = ann − d d . Поскольку матрица U определена −1 однозначно и A = U U , то при k  0 мы получаем требуемое разложение матрицы A . Но A = U U = U = U n−1 k , 2 2 так что k  0 , поскольку A  0 (А 4.7) и U n−1  0 . Таким образом, указанная факторизация существует и для положительно определенных матриц порядка n . 11. Если матрица L положительно определена, то для любого b  ( hb )2  −1 sup   = b L b . h: h  0  hLh  Доказательство. Для всех n имеем 0 (v − a) 2 = a 2 u − 2au v + v = 2  uv ) ( uv  2 =  a u − .  + v − 2 u u   u  0 мы получаем неравенство Коши – Шварца 2 Отсюда при 2 2 v u  ( u v ) . Равенство достигается здесь тогда и только тогда, когда v = au для некоторого a . Таким образом, 2 2 2  ( uv )2  sup   = uu . v: v  0  vv  Поскольку матрица L положительно определена, существует такая невырожденная матрица L , что L = R R (А 4.2). Полагая v = R h и u = R −1b , приходим к требуемому результату. 5. Идемпотентные матрицы Матрица P называется идемпотентной, если P = P . Симметричная идемпотентная матрица называется проекционной. 1. Утверждение. Симметричная матрица является идемпотентной матрицей ранга r тогда и только тогда, когда r ее собственных значений равны 1 и n − r собственных значений равны 0 . 2 Доказательство. Если P = P , то из Px =  x вытекает, что 2  xx = xP 2 x = ( Px ) ( Px ) =  2 xx и  (  − 1) = 0 . Поэтому собственные значения матрицы P равны либо 1, либо 0, и в силу А 2.6 r ее собственных значений равны 1 и ( n − r ) − нулю. Обратно, если собственные значения равны 0 или 1, то можно без ограничения общности полагать, что единице равны первые r собственных значений матрицы. Поэтому существует такая ортогональная матрица T , что I T PT =  r 0 0 =  или P = T T . 0  Следовательно, P = T T  T  T  = T  T  = P , и rank P = r (А 2.2). 2 2. Утверждение. Если P − проекционная матрица, то trP = rank P . Доказательство. Если rank P = r , то в силу А 5.1 r собственных значений матрицы P равны 1 и ( n − r ) − нулю. Отсюда trP = r (А 1.3). 3. Утверждение. Если матрица P идемпотентна, то такова и матрица I − P. Доказательство. 4. Утверждение. полуопределены. ( I − P) 2 = I − 2P + P 2 = I − 2P + P = I − P . Проекционные матрицы Доказательство. xPx = xP x = ( Px ) ( Px )  0 . 2 положительно 5. Утверждение. Если Pi ( i = 1,2 ) − проекционные матрицы и разность P1 − P2 положительно полуопределена, то (a) P1 P2 = P2 P1 = P2 , (b) P1 − P2 − проекционная матрица. Доказательство. (a) Если P1 x = 0 , то 0  x ( P1 − P2 ) x = − xP2 x . Поскольку матрица P2 положительно полуопределена (А 5.4), то x P2 x = 0 и P2 x = 0 . Поэтому для любого y мы имеем P2 ( I − P1 ) y = 0 , так как P1 ( I − P1 ) y = 0 . Таким образом, P2 P1 y = P2 y , отсюда вытекает, что P2 P1 = P2 (А 9.1). Производя транспонирование, получаем P1 P2 = P2 , и (a) доказано. (b) ( P1 − P2 ) 2 = P12 − P1 P2 − P2 P1 − P22 = P1 − P2 − P2 + P2 = P1 − P2 . А 6. Дифференцирование векторов. Если 1. d d ( = d d i ) , то выполнены равенства d (  a ) d (   A ) = a , 2. = 2 A d d (симметричная матрица). Доказательство. Утверждение (1) тривиально. Что касается (2), то  d (   A ) d  =    ai j i  j  = d i d i  i j  = 2aii i + 2  ai j  j = 2  ai j  j = 2 ( A )i . j =i i 7. Разбиение матриц на блоки. Если матрицы A и D симметричны и существуют все встречающиеся ниже обратные матрицы, то −1  A−1 + FE −1 F   A B  B D  =  −1    −E F  −1 −1 где E = D − B A B и F = A B . − FE −1  , E −1  Доказательство. Поскольку матрица, обратная для заданной, определена однозначно, то достаточно проверить, что в результате умножения исходной матрицы на указанную получается единичная. 8. Решение линейных уравнений. Bx = c можно − − представить в виде B c , где B − некоторая обобщенная обратная для B Всякое решение совместной системы уравнений матрица. Доказательство. Прежде всего, покажем, что все решения уравнений Bx = c для любой конкретной матрицы B− = C можно получить по формуле (1) x = Cc + ( CB − I ) z , где вектор z произволен. Для x , заданного формулой (1), имеем Bx = BCc + ( B CB − B ) z = BCc = c (в силу соотношения (3.45) из раздела 3.8.1с), так что x − решение системы. Обратно, если x̂ − какое-нибудь решение этой системы, то, полагая z = − xˆ , получаем x = Cc − ( CB − I ) xˆ = Cc − Cc + xˆ = xˆ , так что x̂ можно получить по формуле (1). Это доказывает эквивалентность этих двух решений. Eсли x̂ − решение системы, то в силу доказанного вектор x̂ можно представить в виде (1) для некоторого z . Если выбрать матрицу M так, ( ) −1 чтобы z = −M c, ck  0 и положить M =  mi j  , где mi j = − jk zi ck , то имеют место соотношения x̂ = Cc − ( CB − I ) Mc = ( C − CBM + M ) c = Dc , где BDB = BCB − BCBM B + BM B = B − BM B + BM B = B . Таким образом, матрица D является обобщенной обратной для B и x̂ имеет вид B − c . (Приведенное доказательство основывается на книге Searle (1971, гл.1).) 9. Два соотношения. 1. Если Ax = 0 для всех x , то A = 0 . Доказательство. Полагая xk =  ik ( k = 1,2,..., n ) , имеем Ax = ai = 0 , где ai есть i − й столбец матрицы A . 2. Если матрица A симметрична и x Ax = 0 для всех x , то A = 0 . ( k = 1,2,..., n ) ; Если положить xk =  ik +  jk ( k = 1,2,..., n ) , то Доказательство. Положим xk =  ik тогда ai j = 0 . xAx = 0  aii + 2i j  ai j = 0 . 10. Разложение матрицы по сингулярным значениям. Пусть X − матрица размера n  p . Тогда ее можно представить в виде X = P  Q , где P − матрица размера n  p , образованная p ортонормированными собственными векторами, соответствующими p наибольшим собственным значениям матрицы X X  ; Q − ортогональная матрица размера p  p , образованная ортонормированными векторами матрицы X X , а  diag ( , 1 2 ,..., p ) − диагональная ( p  p) − матрица, где  1   2  ...   p  0 − сингулярные значения матрицы X , равные квадратным корням из (неотрицательных) собственных значений матрицы X X . Доказательство. Предположим, что rank  X X  = rank X = r. (А 2.5). Тогда найдется такая ортогональная p  p − матрица T , что где  = diag ( X X T = T  , 2 1 ,  22 ,..., r2 , 0,...,0 ) ,  i2  0 . Положим, si =  i−1 X ti ( i = 1,2,..., r ) . Тогда X si =  i X ti =  i ti и X X si =  i Xti =  i si . −1 2 Таким образом, векторы si , i = 1,2,..., r , являются собственными векторами матрицы X X  , соответствующими собственным значениям  i2 , i = 1,2,..., r , . Далее, si si = 1 , и, поскольку собственные векторы для различных собственных значений симметричной матрицы ортогональными, а различные векторы si − ортонормированные. В силу А 2.3 и А 2.4 являются существует ортонормированный базис sr +1 , sr +2 ,..., sn  пространства N  X X   = N  X  . Но N  X  ⊥ R  X  и si  R  X  ( i = 1,2,..., r ) , так что S = ( s1 , s2 ,..., sn ) − ортогональная матрица размера n  n . Поэтому  i si s j , i = 1,2,..., r , ( S X T )i j = si ( Xt j ) =  0, i = r + 1,..., n,  .   и SX T =  Наконец,  X = S   T  = P  Q, 0  где P − матрица, образованная первыми p столбцами матрицы S , и Q = T . 11. Некоторые результаты из математической статистики. 1. Утверждение. Для всякой случайной величины X выполняется неравенство  2  −2 . Доказательство. Пусть  = E  X  . Тогда имеют место соотношения  2 4 2 0  var ( X −  )  = E ( X −  )  − E ( X −  )        = 2   = 4 − 22 = 22  42 − 3 + 2  = 22 (  2 + 2 )  2  и 2 + 2  0. 2. Пусть X − неотрицательная невырожденная (т.е. не равная тождественно постоянной) случайная величина. Если соответствующие математические ожидания существуют, то E  X −1   ( E  X  ) . −1 Доказательство. Пусть f ( x ) = x −1 X не равняется тождественно нулю).  = E  X  (   0 , так как и Используя формулу Тейлора, получаем 1 2 ( X −  ) f  ( X 0 ) , 2 f  ( X 0 ) = 2 X 0−3  0 , так что f ( X ) = f (  ) + ( X −  ) f (  ) + где X 0 лежит между X и . Далее, 2 E ( X −  ) f  ( X 0 )   0 . Поэтому   E  X −1  = E  f ( X )   f (  ) = ( E  X  ) . −1 1. МАТЕМАТИЧЕСКИЕ МОДЕЛИ ДЛЯ СИНТЕЗА СИСТЕМ УПРАВЛЕНИЯ ОПЕРАЦИЯМИ С ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ Рассматриваются модели для управляемых динамических объектов, используемых для синтеза управлений при моделировании операций. 1. Математические прямые и обратные модели для синтеза управлений операциями в дискретных системах. Задачи управления дискретными объектами могут иметь вид: вычислить интервально допустимые и оптимальные прогнозируемые управления для минимизации суммарного функционала качества заданных программных траекторий и управлений системы с линейным объектом на основе прогнозирования координат на интервале  k , k + p . Задача Коши для дифференциального оператора имеет вид x = Аx + Fuu, y = cx, x(0) = x0  D, (8.а) а обратный оператор есть формула Коши t x(t) = e At x(0) +  e A(t − ) Bu ( ) y = cx, x(0) = x0  D. (8.б) xk +1 = Hxk + Fuuk , y k = cxk , xk0 = x0  D, (8.в) h где H = e Ah , F =  e A d В. Область D  n − область притяжения, а векторы и матрицы имеют вид xk  nx , yk  ny , H nx nx , Fu  nx nu , c n y nx . Пусть система (8) управляема по Р. Калману по выходным координатам yk , а многошаговые прогнозы динамики объектов на интервале  k , k + p   для выходов модели (8.в) и управлений заданы соответствующим линейным многообразием yk +1 = cHxk + cFuk , yk + 2 = cH 2 xk + cHFuk + cFuk +1 , .............................................. yk + p = cH p xk + cH p −1Fuk + cH p −2 Fuk +1 + ... + cHFuk + p −2 + cFuk + p −1. (9) Эквивалентное представление (9) для состояний и управлений имеет соответствующий вид yk +1 − cFuk = cHxk , yk +2 − cHFuk − cFuk +1 = cH 2 xk , (10) .............................................. yk + p − cH p −1Fu k − cH p −2 Fu k +1 − ... − cHFu k + p −2 − cFu k + p −1 = cH p x k . Прогнозы (10) для значений k   k , k + p   , где прогноз р задает «горизонт планирования динамики объекта» на основе «множества моделей» для выходных координат и управлений  T D0Z =  Z kp = (Yk , U k ) AZ kp = bk , A =  E p ny − G     p ny  p ny где в силу (10) матрицы E p ny  , G pn y  pnu p ny  p ny ( pny + pnu )  , (11)   следуют из (10), а векторы Z kp определяют уравнение AZ kp = bk в векторно-матричной форме  Eny   ...   0ny  ...   0n  y ... 0ny ... 0ny ... ... ... ... ... Eny ... 0ny ... ... ... ... 0ny ... ... ... − cH k + j −1F ... ... ... Eny −cF ... ... − cH k + p−1F ... ... 0ny nu   yk +1  H   ...   ...   ... ... ...       yk + p  −c F ... 0ny nu     = c  H j  xk .    uk  ... ... ...    ...    ...  H p   −c H k + j −1F ... −cF  u   k + p−1  0ny nu Тогда векторы множества моделей (11) определяются равенствами Z kp = Yk ,U k  , Yk =  yk +1,..., yk + j , ... , yk + p  , U k = uk ,..., uk + j −1, ..., uk + p−1  , T T T а матричные параметры имеют согласованную структуру: TU = 0 p ny  pnu E pnu  pnu  , A =  E pny − G  , rang A = pny . Блочная матрица и вектор параметров в (11) определены равенствами  cF   cHF G=  ... cH p −1F ... 0ny nu   cF ... 0ny nu   ... ... ...  cH p −2 F ... cF  0ny nu H  H 2  pn y  pnu , cHxk = c   xk = bk . (12)  ...   p H  Определение 1. Продолженные решения уравнений объекта (8) на основе моделей (11), (12) для управляемых по Р. Калману векторов выходов из текущего состояния xk на интервал [k + 1, k + p] определяют прогнозируемые выходы yk + j ( xk , uk + j −1 ) на этом интервале как функции состояния xk и управлений u k + j −1 , j   0, p . Аналогично вычисляются прогнозы состояний. Таким образом, в (11) определены «множество моделей» как линейное многообразие для прогнозирования координат и управлений на интервал на основе продолжения решений (8) для выходов (состояний). Множество-параллелепипед задает смешанные ограничения-неравенства на выходы и управления, аппроксимированные шарами  DZ1 = Z kp = (Y k , U k ) T 2 Z kp 2   r2 . (13) В связи с этим данное выше определение решения (8) обобщается на случай допустимых ограниченных продолженных решений. Таким образом, методы исследования операций используют комплекс моделей функционального анализа. 2.СИСТЕМЫ СТАБИЛИЗАЦИИ ПОЛОЖЕНИЯ РАВНОВЕСИЯ С ЗАДАННЫМ УБЫВАНИЕМ ФУНКЦИИ ЛЯПУНОВА Рассмотрен аналитический метод синтеза асимптотически устойчивых локально оптимальных систем с устойчивым линейным дискретным объектом и заданным убыванием функции А.М. Ляпунова на основе необходимых условий для адекватного решения задачи конечномерной оптимизации. 1. Математическая формулировка задачи. Задача синтеза управлений формулируется в виде: вычислить вектор управлений  uk  = arg min  = xk +1 22 + uk 2 2 xk +1 = Hxk + Fuk  n , xk 0  D, H 2  1, Vk  − xkT Qxk , Vk = xkT Pxk , Q = Q1 + Q2 , Q = QT  0, xkT H T PHxk − xkT Pxk + xkT Q1 xk = 0   m , как решение задачи (1) на основе метода функций Лагранжа, где матрица H  nn , не имеет нулевых собственных чисел. При (1) невыполнении этого условия можно применить метод модального управления, а также локально-оптимального управления на основе результата раздела 3.2. Синтез на основе решения задачи (1) будет выполнен с помощью уравнения Ляпунова для устойчивого объекта. Функция Лагранжа для задачи (1) принимает вид L = xk +1 2 2 + uk 2 2 + ( 0 , xk +1 − Hxk − Fuk ) + +1 ( xkT+1 P xk +1 − xkT P xk + xkT Q1 xk + xkT Q 2 xk ) + +  2 ( xkT H T P H xk − xkT P xk + xkT Q1 xk ) . (2) В результате система необходимых условий (2) преобразуется к виду L  0 = xk +1 − H xk − Fuk = 0n , (3) L 1 = xTk +1P xk +1 − xkT P xk + xkT Q1 xk + xkT Q 2 xk = 0, (4) L  2 = xkT H T P H xk − xkT P xk + xkT Q1 xk = 0, (5) L x k +1 = 2 xk +1 +  0 + 21P xk +1 = 0n , (6) L xk = − H T  0 − 21P xk + 21 Q1xk + 21 Q 2 xk = 0n , (7) L uk = 2 uk − F T  0 = 0m. (8) Далее синтез управлений выполнен на основе (3) – (8). На первом этапе условие (4) в силу (3) и (5) преобразовано к виду xk +1Pxk +1 − xk Pxk + xk Q1xk + xk Q2 xk = = xk H T PHxk +1 − xk Pxk + xk Q1 xk + xk Q2 xk + 2 xkT H T PFuk + ukT F T PFuk = = 2 xkT H T PFuk + ukT F T PFuk + xkT Q2 xk = 0. (9.а) T где xk H PHxk +1 − xk Pxk + xk Q1 xk = 01 в силу уравнения Ляпунова H T PH − P + Q1 = 0nn , как «матричного аннулятора» во второй группе уравнений в (9.а). С учетом уравнения Ляпунова равенство (9.а) примет следующий вид xk +1Pxk +1 − xk Pxk + xk Q1 xk + xk Q2 xk = = xk Q2 xk + 2 xkT H T PFuk + ukT F T PFuk = = 2 xkT H T PFuk + ukT F T PFuk + xkT Q2 xk = 0. (9.б) На втором этапе вычисляется вектор множителей Лагранжа из (6), которое является функцией вектора состояний и управлений  0 = −2 ( E + 1P ) xk +1 = −2 ( E + 1P ) ( Hxk + Fuk ). Оказывается −F T ( H T ) −1 уравнение !!!, что если (7) умножить (10) на матрицу − F T H −T , то можно получить − F T H −T ( − H T  0 − 21Pxk + 21Q1 xk + 21Q 2 xk ) = = F T  0 + 21F T H −T P xk − 21F T H −T ( Q 1+ Q 2 ) xk . (11.а) Если далее сложить (8) и (11.а), то полученное уравнение примет вид 1F T H −T P xk − 1F T H −T ( Q 1+ Q 2 ) xk + uk = 0. (11.б) Тогда из (11.б) следует оператор управления с обратной связью, т.е. в функции координат состояний uk = 1 ( A + B ) xk  m . (12) где матрицы равны: A = − F T H −T P, B = F T H −T ( Q1 + Q2 )  m . Тогда вектор множителей Лагранжа в силу (10) можно определить следующим равенством  0 = −2 ( E + 1P )  ( Hxk + 1F ( A + B ) xk )  m . (13) Подстановка (12) в (9.б) при условии K = H T PF , M = F T PF определяет  1 из квадратного уравнения a12 + b1 + c = 0, (14) a = xkT ( A + B ) M ( A + B ) xk , b = 2 xkT K ( A + B ) xk , c = xkT Q 2 x k , T A = − F T H −T P, B = F T H −T ( Q1 + Q 2 ) , K = H T PF , M = F T PF , поскольку имеют место следующие соотношения для используемых параметров: 2 xkT Kuk + ukT Muk + xkT Q 2 xk = = 21 xkT K ( A + B ) xk + 12 xkT ( AT + BT ) M ( A + B ) xk + xkT Q 2 xk = 0. Таким образом, метод синтеза задан соотношениями для управлений (12) – (14), которые в аналитической форме задают локально оптимальное управление с заданным убыванием функции А.М. Ляпунова. 2. Динамика системы ЛОУ с заданным убыванием функции Ляпунова. Динамика системы управления с заданным убыванием функции Ляпунова на траекториях системы с обратной связью определена управлениями (1) исследована для объекта, где параметры равны  0,5 0,1  1 , H = Q =  1 0  1,0 0,5  0 2 , Q = 2 0 1   0 0,5 1  , F = , x = ( ) 0,5 0 . 2      Управления (12) – (14) определяют динамику системы с заданным убыванием функции Ляпунова данными табл. 4.1. На рис. 4.1 приведены процессы изменения фазовых координат объекта (1) xk1 , xk 2 при условии: uk = 0, а также для синтезированной оптимальной системы с обратной связью управлениями, соответствующим (12), (14). с Таблица 4.1 uk xk1 xk 2 -2.29 1.00  2.61 1.62 -0.64 -0.14 1.31 -1.17 0.47 0.09 1.41 0.85 -0.34 -0.06 1.39 -0.61 0.24 0.04 1.39 0.44 -0.17 -0.03 1.39 -0.32 0.12 0.02 1.39 локально объектом (1) и При этом можно отметить качественное изменение динамики фазовых траекторий при использовании синтезированной обратной связи. 3.ОПЕРАТОРЫ ОПТИМИЗАЦИИ ДЛЯ СИСТЕМ С МАТЕМАТИЧЕСКИМ ПРОГРАММИРОВАНИЕМ ЦЕЛЕЙ И ОГРАНИЧЕНИЙ Современные системы управления характеризуются сложностью задач и ограничений в связи с расширением функциональных требований. В лекции сформулированы модели и стратегии управления, реализованные на основе обобщенных ортогональных и неортогональных (косых) проекционных операторах оптимизации [1-5]. • Модели и стратегии сетевого управления, где все объекты связаны между собой К предлагаемым моделям и стратегиям сетевого типа относятся стратегии управления связанными объектами на основе физических или информационных связей. Первый класс моделей и стратегий сетевого типа реализует оптимальное управление автономными системами с учетом смешанных ограничений на координаты и управления. Указанные модели и стратегии реализуются на основе квазианалитических проекционных операторов оптимизации с программированием в математической форме ограничений задач оптимальной стабилизации [1 – 3]. Модели и стратегии реализованы в двух формах - оптимальной стабилизации положения равновесия; - оптимальной стабилизации программных движений автономных подсистем или системы в целом. Математическая форма программируемых функционалов качества и ограничений подсистем реализуется в классе ограничений задач оптимизации как пересечений семейства линейных многообразий и неравенств, которые удовлетворяют требованиям достаточной универсальности; Второй класс моделей и стратегий сетевого типа реализует управление выделенной совокупности подсистем на основе заданной степени убывания функции Ляпунова автономных подсистем с оптимизацией качества управления для функционалов на траекториях выделенных групп подсистем объектов. Указанная стратегия также реализуется на основе квазианалитических проекционных операторов указанного выше типа. Для вычисления управлений используется «погружение» обобщенных задач в базовые задачи оптимизации, сформулированные в [1–4]. Ограничения и функционалы базовых задач оптимизации используются в качестве математической программируемой среды, расширяющей возможности приложений базовых проекционных операторов оптимизации для задач синтеза управлений. Базовые задачи и стратегии первого класса, реализуемые на основе операторов условной оптимизации Обобщения задач и операторов оптимизации выполнены на примере обобщения базовой задачи квадратичной условной минимизации [1, 3, 4]: вычислить вектор  x = ( xk  u k  ) = arg min  ( x ) = x − С T A mn T , Q = Q  0 Аx = b, 2 2 , rang A = m, xT x  r 2   n . (1) Квазианалитические проекторы определяют решения задач, аналогичных (1), c линейными или квадратичными функционалами. Обобщения задач оптимизации типа (1) и их аналогов, а также проекционных операторов далее могут быть ориентированы на задачи синтеза систем управления двух классов: 1. Системы обобщенной оптимальной «стабилизации положения равновесия» для координат управления на основе минимизации квадратичных функционалов и ограничений, которые программируются в математической форме в базовой задаче типа (1). Системы этого класса предназначены для стабилизации координат объектов в стационарных (неизменных во времени) положениях равновесия. 2. Системы с обобщенной оптимальной «программируемой динамикой» на основе минимизации квадратичных функционалов с программируемыми в математической форме ограничениями задачи (1). Системы данного класса стабилизируют отклонения координат и управления объекта от заданных программных вектор-функций времени. Далее рассмотрена методика оптимальной стабилизации систем управления с операторами, заданными в пространствах числовых векторов или в пространствах вектор функций [3–5]: а). Программные числовые векторы Сk  n , k , определяющие координаты, управления и операторы дискретных систем времени являются элементами евклидова пространства числовых векторов Сk  n 2 , устойчивость (сходимость) которых исследована в [3], а также элементами пространства вектор-функций с квадратично суммируемыми координатами пространства, например, Сk  n ( l ). 2 ( ) б). Программные вектор-функции С ( t )  R n L20, T  , координаты, управления и операторы непрерывных систем заданы в пространствах вектор-функций, интегрируемых с квадратом, т.е. С (t )  n ( L 0, T ) 2  С (t ) 2 n ( L  0, T  2 )  T С T ( t ) С ( t ) dt  +, или в пространствах непрерывных функций с равномерной нормой, например, С ( t )  n ( С s 0, T ) , где С (t ) n (С 0, T ) s max i =1,...,n   n i =1 ( j) max x (t ) . i j =1 s t a , b  Для указанных выше типов пространств могут использоваться математические модели в виде прямых и обратных операторов динамических систем, прообразы и образы которых принадлежат алгебраической структуре одного типа. Это соответствует «принципу сохранения алгебраических структур» в функциональном анализе. Таким образом, обобщения могут отличаться по классам. Обобщения первого класса связаны с переходом от линейных моделей в пространствах числовых векторов к линейным моделям в пространствах вектор-функций. Обобщения могут также использовать «текущую линеаризацию» нелинейных моделей процессов в темпе управления. При этом линейные математические модели объектов задаются линейными многообразиями задач оптимизации типа (1). Обобщения второго класса связаны с дополнительными требованиями к динамике объектов, которые можно учесть в «расширениях» линейного многообразия задачи (1) за счет математических дополнений, реализующих технологические требования. В результате можно утверждать, что обобщения математических моделей и дополнительных требований к объекту включаются в структуру линейных многообразий, которые в «математической форме» программируются при сохранении класса задач оптимизации. Таким образом, обобщения второго типа связаны с обобщением параметров функционала качества и ограничений. Модели объектов, используемые для синтеза управлений в функции программных движений, заданных в отмеченных выше функциональных пространствах с учетом ограничений в виде пересечения линейного многообразия и эллипсоида задач оптимизации. Обобщение задачи второго типа, основанное на обобщении ограничений-равенств и функционала качества, в конечномерном евклидовом пространстве имеет вид: вычислить числовой вектор  x = arg min  ( x ) = x − Сk A mn 2 2 , с  0n Ax = b, , rang A = m, xT Rx  r 2 , R = RT  0   n 2 . (2) При этом обобщенная задача для задачи (2) с расширенными свойствами функционала и ограничений-неравенств имеет вид: вычислить вектор  x = arg min  ( x ) = ( x − C ) Q ( x − C ) , Q = QT  0 Ax = b, A mn T , rang A = m, xT Rx  r 2 , R = RT  0   n 2 . (3) Функционал и ограничения в задачах оптимизации типа (3) определены квадратичными формами общего вида, которые обобщают базовые задачи типа (1). Программируемые цели, ограничения и операторы для реализации сетевых операций оптимальной стабилизации в конечномерных пространствах Программируемые математические модели для реализации «обобщенной управляющей среды управления» в сетевых системах иллюстрированы для задач, в которых управления, вычисляются на основе решения задач типа (1), (2) и (3). Обобщенные задачи условной оптимизации с квадратичными функционалами могут быть сведены к базовым задачам минимизации нормы элементов в пространстве более высокой размерности на основе расширения ограничений-равенств типа (3). Для этой задачи можно ввести два (или конечное число) дополнительных числовых векторов y = Q1 2 x, v = R1 2 x, которые с учетом вектора x  блочный вектор n (4.а) образуют обобщенный числовой z = ( x, y , v )  T 3n . (4.б) Тогда базовая задача вычисления управлений для оптимальной стабилизации состояния равновесия с учетом (3) (4.а) и (4.б) примет вид: вычислить числовой вектор  z = arg min  ( x ) = z T Qz , z = ( x, y, v ) , Q = QT  0  A Az = Q1 2   R1 2 0mn − En 0nn T 0mn   x   b   En 0nn    y  = Q1 2C  = b, Q =  0nn       12  0nn − En   v   Q   zT z = x 2 + y 2 + v 2  r 2  2 2 2 3n 0nn Еn 0nn 0nn  0  , (5)  En  . С учетом обобщенных переменных z  ограничения-неравенства в базовой задаче оптимизации (5) представляются совокупностью неравенств 3n zT z = z 2 = x 2  x 2 2 2 x + y 2 2 + Q1 2 x 2 2 + Q 2 2 2 2 + v 2 2  x 2 2 2 2 + R1 2 x  2 + R = 2 2 2  x 2 = r 2, 2 (6) (1 + Q + R ) = r   r (1 + Q + R ) .  x x 2 2 2 2 2 2 2 2 2 2 2 −1 2 2 где может использоваться обобщенный скалярный параметр r 2 = r 2 (1 + Q 2 + R 2 ). Таким образом, иллюстрируемый «принцип математического программирования целей и ограничений» реализуется в конечномерном пространстве, определяет обобщенные требования к системам управления при сохранении класса операторов оптимизации. При этом управления могут быть вычислены на основе базовых проекционных методов для задач с квадратичным функционалом качества. Обобщенная задача (5), (6) может быть решена оператором минимизации типа (1) [2]. 4.ПРОЕКЦИОННЫЕ ОПЕРАТОРЫ УСЛОВНОЙ МИНИМИЗАЦИИ ЛИНЕЙНЫХ ФУНКЦИОНАЛОВ ДЛЯ УПРАВЛЕНИЯ ОПЕРАЦИЯМИ ДИНАМИЧЕСКИХ ОБЪЕКТОВ Операторы конечномерной оптимизации для задач минимизации или максимизации линейных функционалов на компактных множествах конечномерного пространства преобразуют параметры функционала и ограничений задач оптимизации в оптимальные решения [15, 25, 28 – 33, 35]. Эти операторы действуют в факторизованных пространствах, и определяются проекторами, сохраняющими алгебраическую структуру евклидова пространства. Определение 1. Операторы конечномерной оптимизации (ОКО) – это проекционные операторы конечномерной минимизации или максимизации в евклидовом пространстве для задач: вычислить  z =  ( p , pD ) = arg min  ( z ) z  D  n  n ,  z  =  ( p , pD ) = arg max  ( z ) z  D  n  n . Эти операторы отображают целевой вектор C  n функционала  ( z ) = C T z с учетом параметров pD − допустимого множества D в оптимальные решения z  D или z   D на множестве, заданном непустым выпуклым пересечением линейного многообразия D 0  n и эллипсоида-шара D1  n [28]. 1. Постановки задач условной оптимизации для линейных функционалов. Эта задача при ограничениях-равенствах и двухсторонних (интервальных) неравенствах имеет вид: вычислить вектор  z = arg min  ( z ) = C0T z A0 z = b0 , A0    arg min  ( z ) = C0T Z A0 z = b0 , A0  mxn mxn , z−  z  z+   , ( z − d ) Q( z − d )  r2  T n , (1.a) В задаче (1.а) интервальные ограничения в виде параллелепипеда z −  z  z + аппроксимируются эллипсоидом  D= z (z − d) T Q ( z − d )  1, Q = diag ( Qi )  0,  Qi = ( zi+ − zi− ) 2  , d = ( zi+ + zi− ) 2 . 12 Взаимно однозначная замена переменных z − d = Q −1 2 x, x = Q1 2 ( z − d ) , преобразует эллипсоид в шар (z − d) T Q ( z − d ) = ( z − d ) Q1 2Q1 2 ( z − d ) = xT x = r 2 . T Это позволяет сформулировать две преобразованные минимизации и максимизации, имеющие вид: вычислить  = arg max  ( x ) = C Q задачи  x = b = b − A d , x x  r . (1.в) x = arg min  ( x ) = C0T Q −1 2 x + c0d A0Q −1 2 x = b = b0 − A0 d , xT x  r 2 , (1.б) x T −1 2 x + c0d A0Q −1 2 T 2 Сущность обобщений: эти задачи позволяют использовать для вычисления управлений стандартные операторы. Задачи (1.а) и (1.б) можно решать на основе необходимых и достаточных условий теоремы Куна-Таккера о седловой точке. Далее операторы оптимизации синтезированы на основе необходимых условий Лагранжа и принципов «экстремальных граничных векторов», «сужения допустимой области» и «одномерной оптимизации». 2. Метод синтеза оператора условной оптимизации линейных функционалов на основе «принципа граничных экстремумов». Задачи решены в два этапа на основе проекционного метода. Для решения применены «классические необходимые условия Лагранжа» для задач (1.б) и (1.в), из которых следует структура проекционных операторов при ограничениях в виде пересечения линейного многообразия и шара, задающие «граничные экстремальные элементы» как решения классических задач математического программирования. Граничные экстремальные лагранжевы элементы определяют выпуклое «однопараметрическое сужение допустимого множества» как пересечения линейного многообразия и шара, что позволяет обобщить метод Лагранжа для неклассических задач условной минимизации. Таким образом, проекционный оператор решения задачи оптимизации отображает параметры функционала и ограничений в оптимальное решение. Свойства ортогональных проекторов на многообразия и подпространства конечномерных пространств дана в лемме. Лемма 1. Пусть задача минимизации имеет вид: вычислить  x = arg min  ( x ) = x − С 2 2 Ax = b, A  mxn  , rang A = m  n , где rang ( AT С T ) = m + 1. Тогда решение задачи минимизации в виде проекционного оператора на линейное многообразие имеет вид [15] Z = P0 ( С ) = P0С + P+b, P0 = En − P ⊥  nn , P + = AT ( AAT )  −1 nm , P⊥ = P+ A  nn . Лемма 2. Ортогональные проекторы на линейные многообразия и подпространства обладают идемпотентностью, симметричностью, ортогональностью и обратимостью специальных линейных комбинаций: 1). ( P0 ) = P0 , P0 = ( P0 )  2 T nn . 2). ( P⊥ ) = AT ( AAT ) А = P⊥ , P⊥ = ( P⊥ ) . −1 2 3). P0 P ⊥ = ( En − P ⊥ ) P ⊥ = P ⊥ P0 = 0nn , P0 P + = 0nm , T (P ) + T P 0 = 0mn . 4). ( P0 ( z ) ) = P0 ( P0 z + P +b ) = P0 ( z ). 2 5). ( E +  P ) = E −  P = E −  (1 +  ) P, P = P 0 , P = P ⊥ ,   . −1 Доказательства утверждений cледуют из равенств 1) – 5) для матриц проекторов [15]. Идемпотентность, симметричность, суперпозиция, ортогональность и обратимость следуют из соотношений: Идемпотентность и симметричность 1). P 0 P 0 = ( En − P + A )( En − P + A ) = En − P + A − P + A + P + A = P 0 = ( P 0 ) . Т 2). ( P ⊥ ) = P ⊥ = P + A = ( P ⊥ )  Т 2 nn . 3). P0 P ⊥ = ( En − P ⊥ ) P ⊥ = P ⊥ ( En − P ⊥ ) = 0nn , P 0 P + = 0nm , (P ) + T P 0 = 0mn . Суперпозиция проекторов: 4). P 0 ( z ) P 0 ( z )  P 0 ( P 0 z + P +b ) + P +b  = P 0 z + P 0 P +b + P +b = P 0 z + P +b. Обратимость специальной линейной комбинации: 5). ( E −  P )( E +  P ) = E −  P +  P −  P   =  (1 +  )  . Эти свойства использованы для преобразования необходимых условиях оптимальности, из которых следуют операторы оптимизации, данные в [15, 25, 33]. Утверждение 1. Пусть выполнены условия: 1. Невырожденные задачи условной оптимизации для линейных функционалов определены в (1.б), (1.в). Тогда для оптимальности решений этих задач необходимо и достаточно выполнение условий:  1. x = arg min  ( x ) = C T x, с  0n Ax = b, A  mn  , rang A = m, xT x  r 2 = = P +b − P 0C ( 2  ) = P +b − 0,5P 0C ( −1 ) = x (   ) , 12  2. x = arg max  ( x ) = C T x Ax = b, A  mn (2.а)  , rang A = m, xT x  r 2 = = x (   ) = P +b − P 0C ( 2  ) = P +b − 0, 5P 0C ( −1 ) . 12 (2.б) 3. В равенствах (2.а) и (2.б) введены обозначения: P 0 = En − P + A  P 0 = En − P + A  nn , P0 P0 P0 −1 2 nn , , P + = AT ( AAT )  −1 nm , −1 rang AT c = m + 1,  = 4 bT ( AAT ) b − r 2  .   4. Оптимальные множители Лагранжа в (2.а) и (2.б), равные  = + (   ) ,  = − (   ) 12 12  , являются решениями квадратного уравнения 2  2 +  = 0,  = С T P0С = P 0С 2 , (2.в) 5. Ограничения задач (2.а), (2.б) совместны, если:   0. Доказательство необходимости. На первом этапе определяется структура оператора оптимизации, а на втором – значения параметров оптимальности для задач на минимум и максимум линейного функционала. Структура и параметры оператора следуют из необходимых условий для классической задачи на основе функции Лагранжа L = С T x + 0T ( Ax − b ) +  ( xT x − r 2 ) , которые представляются системой уравнений L x = C + AT 0 + 2 x = 0n , L 0 = Ax − b = 0m , L  = xT x − r 2 = 0. (3) Система (3) решается методом исключения. Умножение первого уравнения в (3) на матрицу A  mn , m  n, учет не особенности mm матрицы AA  (в силу рангового условия) и второго уравнения (3), определяют классический множитель Лагранжа T  0 = ( AAT ) ( − AC − 2b )  m . Подстановка  0 в (3) определяет «проекционное уравнение» в виде C − AT ( AAT ) AC − 2 AT ( AAT ) b + 2 x = P 0C − 2 P +b + 2 x = 0n , задающим операторы оптимизации с параметром  [5, 6, 25, 33, 35, 51] x = x (  ) = P +b − 0,5 −1P 0 C, где операторы P0 = Еn − P + A, P + = AT ( AAT ) (4) обладают свойствами, данными в леммах 1 и 2. Равенство (4) определяет оператор, который при вычислении параметров задает оператор, проецирующий векторы из n на пересечение линейного многообразия и сферы в (2.a). На втором этапе определяются параметры проекционного оператора (4). Множитель   вычисляется из уравнения, получаемого подстановкой параметризованного вектора X (  ) типа (4) в третье уравнение необходимых условий (3). С учетом лемм 1 и 2 третье уравнение системы (3) представляется в виде xT (  ) xT (  ) = ( P +b − P 0C ( 2 ) ) ( P +b − P 0C ( 2 ) ) = T = bT ( P + ) P +b − 2 C T P 0 P +b ( 2 ) + C T P 0 P 0C ( 4 2 ) = r 2 . T Преобразования с учетом леммы 2 определяют квадратное уравнение ( ) 4 2 r 2 − bT ( AAT ) b = C T P 0 C, −1 для вычисления двух множителей Лагранжа [28] ( )  2 −  = 0,  = 4 r 2 − bT ( AAT ) b  0,  = C T P 0C = P 0c 2  0, C  0n. −1 2 Из этих уравнений следуют операторы, образы которых на элементе C  n в силу (4) задают решения задач (2.2.а) и (2.2.б) в виде x = x (  ) = P +b − 0,5P0C ( −1 ) 12 , x = x (   ) = P +b + 0,5P 0C ( −1 ) 12 , (5) где оптимальные множители Лагранжа равны:   = ( −1 ) ,   = − ( −1 ) . 12 12 Справедливость операторов (5) следует из сравнения функционалов на векторах (5), которые определяют неравенство 12  ( x ) = C T  P +b − 0,5P 0C (  )  = C T  P +b − 0,5P 0C P 0C   −1  1 2   2   −1 12   ( x ) = C T  P +b + 0,5P 0C (  )  = C T  P +b + 0,5P 0C P 0C  1 2  . (6) 2     Из (6) следует  ( x )   ( x ) и оптимальные множители Лагранжа   = ( −1 ) ,   = − ( −1 ) . 12 12 Таким образом, необходимость доказана, первое решение (6) соответствует минимуму, а второе – максимуму функционала, что совпадает с утверждениями о седловой точке теоремы Куна-Таккера. Доказательство достаточности. Подставновка решений (5) в условия (3) приводит к выполнению ограничения типа равенства: Аx = АP +b − 0,5 АP 0C 1 2 = ( ) = ААТ ( ААТ ) b − 0,5 А Еn − AT ( AAT ) A C 1 2 = −1 = ААТ ( ААТ ) b − 0,5 А ( A − A) C 1 2 = b, −1 и ограничения-неравенства как равенства при P PA = 0nm в виде ( x x = P b − 0,5P C ( Т   + )( Т −1 1 2 ) P +b − 0,5P 0C ( −1 ) = bT ( P + ) P +b − 2C T P 0 0,5P +b ( −1 ) Т 12 12 )= + 0,25C Т P 0C ( −1 ) = ( = bT ( AAT ) b + 0,25C Т P 0C ( −1 ) = r 2 ,  = 4 r 2 − P +b −1 ( 2 2 ). С учетом равенства ( P + ) P0 = 0mn и значения  = 4 bT ( AAT ) b − r 2 Т −1 ) можно представить полученные выше соотношения в виде (( ) ) bT ( AAT ) b + 0,25C Т P 0C 4 r 2 − bT ( AAT ) b  −1 = −1 −1 ( ) = bТ ( AAT ) b + C Т P 0C r 2 − bT ( AAT ) b  −1 2 = −1 ( −1 ) = bТ ( AAT ) b + r 2 − bT ( AAT ) b = r 2 . −1 −1 Эти соотношения завершают доказательство достаточности. Из теории линейного программирования известно, что экстремумы линейных функционалов достигаются на границах компактного множества. Операторы (5) соответствуют этому положению, т. к. операторы условной минимизации и максимизации линейных функционалов (2.а), (2.б) в силу (2.в) определяют граничные точки множества. Следствие 1 об эквивалентных формах операторов оптимизации. Операторы оптимизации имеют две формы, одна из которых имеет вид x1 = x1 (  ) = P +b − P 0C ( 2 ) , (7) где P0 = En − PA A  nn , P + = AT ( AAT )  −1 nm . Вторая форма может быть получена из (7) с помощью элементарных преобразований. Результаты утверждения 1 имеют геометрическую интерпретацию. Вектор X 1 = X 1 (  ) = PAb − P 0С 2 в (7) включает первое слагаемое – проекцию начала координат на линейное многообразие, а второе – вектор, пропорциональный антиградиенту линейного функционала. Параметр ( −1 2 ) определяет проектор вектора P 0c  n на шар. Следствие 2. Приближенное решение задачи (1.а) имеет вид z = Q −1 2 x + d  где вектор X   n n , (8) определен в утверждении 1. Таким образом, операторы оптимизации определяют условные экстремальные векторы, которые является допустимыми решениями. Следствие 3. Допустимые решения задач (1.а) и (1.б), формируемые на основе выпуклой комбинации экстремальных векторов типа (5), определяются выпуклой комбинацией x =  x + (1 −  ) x ,    0, 1. (9) Полученные результаты иллюстрируются примером. Пример. Рассматривается решение задачи минимизации и максимизации линейного функционала на компактном множестве  ( X ) = C T X = x1 + 2 x2 , C T = (1 2 ) , x = ( x1 x2 )  T 2 , заданном пересечением линейного многообразия и шара Ax = x1 + x2 = 1, A = (1 двумерного пространства. На рис. 2.1 приведены 1 ) , b = 1, x 2  r 2 = 1, 2 линейное многообразие Ax = b , шар ограничений в задаче конечномерной оптимизации и допустимая область D (жирная линия), точки минимума x и максимума x , направление вектора функционала. С 2 для минимизируемого линейного Рис. 2.1. Образы операторов минимизации x = P+b − 0,5P0C ( −1 ) 12 и максимизации x = P +b + 0,5P0C ( −1 ) 12 на элементе C  2 для линейного функционала  ( x ) = C T x на компактном множестве D  2 Как доказано в утверждении 1, оператор для вычисления векторов, обеспечивающих минимум и максимум линейного функционала, имеют вид (5). Алгоритм для экстремальной задачи, иллюстрируемой на рис. 2.1, на основе квазианалитических операторов оптимизации имеет вид: Шаг 1. Вычисление матрицы ортогонального проектора на линейное подпространство евклидова пространства и симметричной квадратичной формы с матрицей, которая соответствует указанному проектору P0 = E2 − AT ( AA ) T −1 −1 1 0 1  1   0,5 −0,5 A= −  1 1   1 1 =        1 1  −0,5 0,5  ; 1          0,5 −0,5 1  T T −1  = 0,5; b AA ( ) b = 1 0,5 1 = 0,5.     −0,5 0,5   2  = C T P 0C = 1 2   Шаг 2. Вычисление параметров уравнения  2 −  = 0, где  = 4  r 2 − bT ( AAT ) b  = 4 − 4 1  0,5 1 = 2  0,  = C T P 0C = P 0c 2 = 0,5.   −1 Шаг 3. Вычисление корней квадратного уравнения 2 2 2 − 0,5 = 0  1,2 =  0,5. Шаг 4. Вычисление векторов X, X   2 , обеспечивающих условные минимум и максимум линейного функционала x = x ( 0,5) = P +b − 0,5P 0C ( −1 ) 12 x = x ( −0,5) = P +b + 0,5P 0C ( −1 ) 0,5  0,5 −0,5 1  1  = −    2  = 0  , 0,5 − 0,5 0,5         12 0,5  0,5 −0,5 1  0 = +    2  = 1  . 0,5 − 0,5 0,5         поскольку P +b = 0,5 0,5 . T Векторы X  и X  определяют минимум и максимум линейного функционала, подтверждаемые линейными формами на каждом из этих векторов. Иллюстрации оптимальных решений задачи даны на рис. 2.1. 5. ПРОЕКЦИОННЫЕ ОПЕРАТОРЫ ОГРАНИЧЕННЫХ УПРАВЛЕНИЙ ДИНАМИЧЕСКИХ СИСТЕМ В ФУНКЦИОНАЛЬНЫХ ПРОСТРАНСТВАХ Современные технологические процессы и системы управления ими характеризуются сложностью задач и ограничений в связи с расширением функциональных требований. В статье сформулированы обобщенные проекционные операторы оптимизации фазовых координат и управлений, которые используются для оптимизации ограниченных управлений и координат, синтезируемых на основе операторных решений задач математического программирования динамики объектов в векторно-функциональных пространствах. Операторы используют «погружение» задач вычисления управлений в базовые задачи оптимизации [1 – 4]. 2. Метод вычисления управлений для программной стабилизации объектов в пространстве вектор-функций. Пусть динамика управляемого по Р. Калману объекта при ограничениях на координаты и управления [1, 2] в пространстве вектор-функций n ( L2 0, T ) задана моделью в виде линейного дифференциального оператора x ( t ) = Аx ( t ) + Bu ( t ) , x ( t0 ) = x0 , (1.а) где классы вектор-функций заданы равенствами x (t )  n ( L 0, T ) , u (t )  ( L 0, T ) , 2 m 2 nn а числовые матрицы в (7) определены условиями A  (1.б) , B nm . Для синтеза управлений, стабилизирующих положение равновесия и программных движений, далее использован обратный оператор для (1.а) в виде оператора Коши x ( t ) = e At x 0 +  e A (t − ) Bu ( ) d . t (2) Таким образом, формула Коши как обратный оператор дл оператора (1.а) в этой задаче образует линейное многообразие в пространстве вектор-функций. Требуется синтезировать вектор управлений в заданном классе функций для оптимальной стабилизации положения равновесия системы данной системы в смысле минимума локального функционала  = z (t ) 2 L2  0,T   , (3)  x ( t ) u ( t )  n+m ( L2  0, T ) , на траекториях (2). Задача синтеза управлений для программной стабилизации формулируется на основе минимизации функционала заданного вектором z ( t )  = z ( t ) − Cz ( t ) Т 2 n =   z ( t ) − Cz ( t )  Т  z ( t ) − Cz ( t )  dt  R. (4) L 0, T (  ) 0 2 при ограничениях типа равенств и неравенств A z (t ) = b (t ) , z (t ) Эти ограничения в пространстве n 2 n ( L 0,T ) 2 ( L 0, T )  r 2. (5) определяют допустимое 2 множество в виде пересечения линейного многообразия и шара. При этом в пространстве обобщенных вектор-функций z ( t ) =  x ( t ) u ( t )   T n+ m ( L 0,T ) 2 линейное многообразие определено в силу (2) следующим равенством Аz ( t )  x t − t e A (t − ) Bu  d  = e At x 0 ( )  0  ( )  конечномерном пространстве вектор-функций. b (t ) , (6.а) Шар ограничений-неравенств, аппроксимирующий параллелепипед или эллипсоид этого пространства, определен квадратичным неравенством z (t ) 2 n ( L 0,T ) 2  Т z T ( t ) z ( t ) d  r 2  . (6.б) Тогда квадратичный функционал качества, определенный на обобщенных векторах для задачи локально оптимальной программной стабилизации примет вид  = z ( t ) − Cz ( t ) где Cz ( t ) = Сxu ( t ) n =  x ( t ) u ( )  − Сxu ( t ) T 2 n+m ( L 2  0,T ) ( L 0,T ) − целевой 2 2 стабилизируемый n+m ( L 2  0,T ) , (7.а) обобщенный вектор задачи локально оптимальной программной стабилизации. Если вектор-функция программного воздействия удовлетворяет условию Cz ( t ) = Сxu ( t ) = 0n+m  n+ m ( L 0, T ) 2 (7.б) то задача (7.а) для объекта (2) преобразуется из «задачи квадратичной программной стабилизации» в задачу «оптимальной стабилизации нулевого положения равновесия» динамического объекта (2) с функционалом (7.б) для системы с обратной связью. Таким образом, на основе приведенных соотношений (2) – (7.б) можно формулировать две основные задачи вычисления управлений: 1. Задача синтеза управлений для локально оптимальной системы программной стабилизации, которая конструируется с помощью задачи минимизации функционала (7.а). 2. Вычисление управлений для оптимальной стабилизации нулевого положения или программного вектора Cz ( t ) , которые конструируются на основе минимизации функционала (7.б). Оптимальные управления вычисляются на основе оператора объекта, который для кусочно-постоянных управлений u ( kh ) =  s=0 u ( ts ) , kh (8) и с учетом свойства аддитивности интеграла в (6.а) принимает вид x ( tk ) x ( kh ) = e Akh x 0 +  e A ( kh− ) d B  s=0 u ( ts ) = kh kh = e At x 0 + А−1 ( e Akh − En ) B  s=0 u ( ts ). kh (9) В результате задача синтеза как задача конечномерной условной минимизации имеет вид: вычислить счетное множество управлений в виде кусочно–постоянных вектор-функций u ( kh ) , которые на дискретном интервале прогноза k  0, p   , обеспечивают минимум функционала 2   = Z ( kh ) − Cz (kh) AZ ( kh ) = b ( x ( kh ) ) =  ( k −1)h  −1 Akh = AZ ( kh ) X ( kh ) − А ( e − En ) B  s=0 u ( ts ) = U  ( kh ) = TU arg min  (10) Akh 0 = e x b ( x ( kh ) ) ,   2  Z kh  r 2. ( )  ( где Z ( kh ) = X U ) «фильтрующая» матрица T u Z ( kh ) вектор управлений U  ( kh ) .  m( n+ m ) «выделяет» из Задача (10) может быть решена операторами оптимизации, сформулированными в утверждении. Утверждение. Пусть (10) – корректная задача, пересечение линейного многообразия с шаром – не пусто и выполнены условия [3,4]: 1. Решение задачи (10) в силу «принципа граничных лагранжевых экстремумов» и «сужения допустимой области» задано выпуклой линейной комбинацией образов для регуляризованных ортогональных проекторов [ ] ( ) ( ) z* = 1 −  * z3 (+ ) +  * z3 (− ) = P +b ( t ) + 1 − 2 * P 0C ( t ) , (11.а) где лагранжевы векторы x3 ( + ) и x3 ( − ) принадлежат пересечению линейного многообразия (подпространства) и сферы как границы шара в (10), и определены ортогональными проекторами [3, 4] z3 = z3 (  ) = P +b ( t )  P 0C ( t )  −1 1 2 , (11.б) P + = AT ( AAT ) , P 0 = En − P + A,  = (  ) , −1  = P 0C ( t ) m ( n + m ) (L ) 2 12 ,  = r 2 − P +b ( t ) 2 m ( n + m ) (L ) 2 ,  = P 0C ( t ) 2 m ( n + m ) (L ) 2 . Тогда для оптимальности решения (11.а), (11.б) необходимо и достаточно, чтобы оптимальный параметр в (18) был задан равенством   = P (0 ) = 0,5( 0 − 0 − 1 + 1)  0, 1, 0 = 0,5 1 −  −1 ( t )  ,  −1 ( t ) =  ( t ) = (   ) , 12  ( t ) = r 2 −  bT ( t ) ( AAT ) b ( t )  , −1  где  = C ( t ) P C ( t ) . T  Для задачи локально оптимальной стабилизации положения равновесия функционал качества следует из (17.а) при выполнении условия: C ( t ) = 0, а вектор оптимальных управлений имеет вид x = P +b ( t ) , т.к. второе слагаемое в (17.б) равно нулю в силу C ( t ) = 0. Результаты использованы в задачах оптимизации управления частотой и активной мощностью энергосистем, в гидромеханике при оптимизации передачи углеводородов по магистральным трубопроводным сетям, при анализе теплопроводности в твердых многослойных объектах и др. 6. УСТОЙЧИВОСТЬ ЛИНЕЙНЫХ ЛОКАЛЬНО ОПТИМАЛЬНЫХ СИСТЕМ УПРАВЛЕНИЯ Уравнения динамических систем как «участников программируемых операций объектов» с линейными операторами локально оптимальных управлений (ЛОУ) следуют из общей формы разностных уравнений (19) и (20), сформулированных в п. 3.1 [1]. Спектральные условия устойчивости линейных систем ЛOУ по состоянию и управлению позволяют определить «запас устойчивости» на основе собственных чисел. Аналогичная задача может быть решена на основе оценок норм операторных числовых матриц линейной части разностных уравнений (операторов). В силу принципа сжимающих отображений (операторов) оценки нормы являются оценками сверху. Спектральные условия устойчивости (сходимости для разностных операторов) связаны с параметрами сжатия линейных операторов (матриц), нормы которых должны быть меньше единицы. Основные модели и этапы проекционного метода синтеза, сформулированные в п. 3.1 [1] задают аналитические проекционные операторы на линейные многообразия (подпространства). При этом важно выполнить конструктивный анализ устойчивости на основе моделей минимальных реализаций объектов управления, к которым относятся фробениусовы или жордановы формы матриц управляемых по Р. Калману линейных объектов в силу, например, рангового критерия, как одной из 5пяти форм представления критерия. Далее задача решена для случая одного управления по состоянию, что иллюстрирует существование непустого множества стабилизирующих линейных проекционных управлений. Для векторных управлений используются адекватные канонические формы. Эту задачу можно обобщить для многих управлений на основе блочных фробениусовых матриц для аналогов структурно-инвариантных уравнений объекта в п. 4.1 [1]. Синтез управлений по выходным координатам может быть выполнен аналогично при выполнении «управляемости по Р. Калману для выходов» на основе соответствующего рангового критерия [3]. Проекционные методы могут реализовать различные формы линейных моделей, однако далее использована третья форма проекторов из п. 2.2, реализующих ЛОУ. Далее рассмотрены модели, следующие из (3.1.20) [1, 2] при условиях  x ( x k ) = xk , числовой вектор C = 0nx +nu , а линейный оператор управления соответствует третьей форме операторов, данных в п. 2.3, табл. 2.3. 1. Постановка задачи синтеза локально оптимального управления для стабилизации положения равновесия. Уравнения замкнутых систем с пропорциональными управлениями формируются проекционным методом синтеза на основе «погружения» моделей линейных разностных объектов систем (3.1.20) в линейные многообразия евклидова пространства состояний Пусть выполнены условия: 1). Динамика объекта в отклонениях от стационарного состояния описывается задачей Коши для аффинного разностного оператора xk +1 = Hxk + Fu uk , xk 0 = x 0 , (1.1) где управляемая по Р. Калману пара матриц (H,F ) определяет управляемый устойчивый объект. Модель объекта для синтеза соответствует (1), где параметры модели и объекта совпадают так, что H = HM  nx  nx а локальный функционал качества , Fu = FM  nx 1 , (1.2)  = xk +1 − Сxk 2 + uk − Cuk . 2 (1.3) Требуется синтезировать устойчивый оператор системы локально оптимального управления (ЛОУ) с проекционным оператором стабилизации программного движения, заданного программными векторами для состояний Сxk  n и управлений Сuk  m . Задача синтеза формулируется следующим образом. Линейный оператор ЛОУ в силу (1.1) имеет вид ( uk* =  Tu zk  =  Tu P 0 C , b k ) ( ) Tu P 0C + P +b k , C = 0nx +1 , где проекторы на линейное многообразие линейного многообразия-уравнения P0 (2.1) вычислены на основе Azk = bk , в которое «погружена» совпадающая с (1.1) модель оператор объекта, имеет вид Azk ( En n x x ) − FМ zk = H М xk bk , zk = ( xk +1 uk ) . T (2.2) Ортогональный проектор на многообразие (2.2) и на ортогональное дополнение к нему, «фильтрующая» матрица в (2.1) заданы равенствами P0 ( C ) ( P + = AT AAT ) P 0C + P +bk , P 0 = Enx nx − P + A; −1  n1 ( (2.3) ) , n = nx + 1; в). Tu = 0nu nx Enu 1 . В равенствах (2.1) – (2.3) использованы обозначения: P ( C ) − ортогональный проектор для вектора программного движения C  n+ m + на линейное многообразие (2.2); P bk − проектор на ортогональное дополнение для линейного многообразия (2.2). Таким образом, структура оператора (2.1) определяет аффинный оператор ЛОУ управлений в функции состояний и программного движения, необходимых для координации операций. На первом этапе исследования требуется исследовать условия устойчивости в спектральной форме для линейного оператора системы ЛОУ, на траекториях которой достигает минимума функционал типа нормы с параметром линейной обратной связи  =  Enx ,   . 2. Условия устойчивости линейных разностных операторов локально оптимального управления. Для анализа доказано утверждение о свойствах сжимающего оператора линейной системы ЛОУ. Утверждение о спектральных условиях устойчивости. Пусть выполнены условия: 1). Динамика объекта в отклонениях от стационарных состояний описывается задачей Коши с разностным оператором (1.1). 2). Матрицы оператора (1.1) известны и определены в (1.2) так, что для вычисления управлений используется уравнения xk +1 = H М xk + FМ uk , где H = H M  nx  nx , F = FM  nx 1 . 3). Функционал качества в виде квадрата евклидовой нормы  = xk +1 2 + uk . 2 4). Тогда аффинный линейный проекционный оператор локально оптимальный оператор стабилизации программных движений имеет вид ( ) ( ) uk* =  Tu zk  =  Tu P 0 C , b k = Tu P +b k + P 0Ck , b k = Hxk , (3) где проекторы на линейное многообразие, ортогональное дополнение и «фильтрующая» матрица определены равенствами: P 0 ( C ) = P 0C + P +bk , P 0 = Enx nx − P + A, P + = AT ( AAT )  −1 ( ) n1 ( , n = nx + 1, ) Azk = Enx nx − Fu zk = Hxk = bk , zk = ( xk +1 uk ) , Tu = 0nu nx Enu 1 . T В равенстве (3) ортогональный проектор P 0 ( C ) задает проекции вектора C на линейное многообразие, в которое «погружена» модель объекта в виде линейного разностного оператора. Оператор (3) определяет аффинный оператор ЛОУ как сумму проектора P Ck на линейное многообразие для программного движения Ck  m , и проектора на ортогональное дополнение как функцию вектора состояния xk  n . Требуется определить условия устойчивости в спектральной форме для линейных операторов систем ЛОУ, минимизирующих евклидову нормы с параметром обратной связи  =  Enx ,   . 1. Решение задачи стабилизации. Уравнения состояния линейного объекта заданы разностным оператором уравнениями в системе (1), (2), где пара матриц 0( n −1)1 E( n −1)( n −1)  0( n −1)1  x x H = x  , Fu =  x , p .. . p 1  1    n (1) имеют фробениусову форму, а управления заданы в (2), где Ck = 0(n +1). x Пара матриц ( H , Fu ) – управляема в силу рангового критерия Р. Калмана rang ( H n−1Fu | H n−2 Fu | | HFu | Fu ) = n = dim nx . (2) Локальный функционал для управлений (2) задан равенством  = xk +1 + uk . 2 2 4. Характеристический полином  (  ) = det (  En − H ) =  n + p1 n−1 + p2 n−2 + + pi  n−i + соответствует фробениусовой форме матрицы объекта. 5. Скалярное управление, следующее из (2), уравнению возмущенного движения и имеет вид uk* =  0Tu zk* =  Tu P + Hxk  1 + pn , (3) соответствует , P + = A T ( AA T ) . −1 (4) Тогда имеют место утверждения, обобщающие результаты [16]: 1. Динамика дискретной системы ЛОУ с проекционнооператорной обратной связью по состоянию описана линейным разностным уравнением xk +1 = Hxk , H = ( En +  FuTu P + ) H , xk0 = x 0 , (5) следующим из (1), (2), где матрица оператора системы с обратной связью определена матрицей 0 H =  ( n−1)1   p1 E( n−1)  .  pn  2. При условии n  2 линейный оператор ЛОУ (4) равен uk* =  Tu P + H xk , Tu = 0 T(1nx ) 1 , (6) где числовая матрица оператора ЛОУ в (6) определена проектором  E( n −1)( n −1) 0( n −1)1  x x  xT  + P =  0 1( nx −1) 0,5  ,  T  −0,5   0 1( nx −1) на ортогональное дополнение к линейному многообразию, в которое «погружен» управляемый по Р. Калману линейный разностный оператор объекта с различными собственными числами. 3. Характеристическое уравнение системы ЛОУ имеет вид  (  ) = det (  En − H ) = =  n +  ( p1 n−1 + p2 n−2 + + pi n−i + + pn ) = 0, ( (7.1) ) где H = ( Enx nx +  FuTu P + ) H , P + = AT ( A AT ) , Tu = 0nx nx | Enx 1 , −1 а параметр  =1−  2 для ЛОУ по состоянию. В результате спектральное условие устойчивости оператора ЛОУ имеет вид  (  Enx − H )  1, j = 1, , n. (7.2) j Доказательство использует уравнение (1), а также на проекцию на линейное многообразие, задающее модель (1) в форме Az k = ( En − Fu ) zk = Hxk = b1k ( xk ) , A = ( En − Fu ) , с вектором zk = ( xk +1, uk )  T nx +1 . Тогда линейное многообразие D0 =  zk | Azk = ( En | − Fu ) zk = Hxk bk   nx +1 , (8) задает (1) с матрицей Фробениуса. На основе (2), (6), (8) оператор ЛОУ uk* =  Tu zk* =  Tu P + Hxk  , где матрицы оператора P + = A T A, A = ( ААT ) определены равенствами −1  E( nx −1)  En  T AA =  En | − Fu    Т  = En + Fu Fu =  T  − Fu  0 1 ( nx −1) 0 ( nx −1)1  T A = ( AA T ) −1  E( n −1) = T  0(11) x Матрица Fu = ( 0T( nx −1)1 1 )  T n , 2 , (9)   ( nx nx ) 0( n −1)1  .  0,5  ( n n ) x x x тогда управление (6) для P + формируется индукцией по размеру вектора, равного n . База индукции: для n = 1 скалярное ЛОУ имеет вид −1 1   1  uk* =  Tu P + Hxk =  0 1      1 −1     Hxk =  −1   −1   0,5  =   0 1    Hxk = −0,5 Hxk . − 0, 5   Для случая n = 2 скалярное управление линейной системы ЛОУ (6) примет вид uk* =  Tu P + Hxk =  Tu АТ ( ААТ ) Hxk = −1 −1 1 0   1 0   1    0 1   Hx = =   0 0 1  0 1      k   0 1 −1   0 −1  0 −1  1 0  1 −1 1 0    =   0 0 1  0 1   Hxk =  0 0 1  0    0 2  0 −1  0 0  1 0 1   =   0 0 1  0 0,5  Hxk =   0 −0,5   x   p1 p2  k  0 −0,5 0 1 0  1  Hx =  0 0,5 k −1 =  ( −0,5 p1 | − 0,5 p2 ). Тогда оператор системы локально оптимального управления с линейной обратной связью типа (5), имеющий вид xk +1 = Hxk , H = ( En +  FuTu P + ) H = ( En +  FuTu P + ) H , при условии n = 2 представляется в матричной форме −1  1 0   1 0     1 0  0  0 1    1 0 0   0 1    H  (22) . H =  +   1     1   0 1 −1       1     0 1     0 −1        Фробениусова матрица объекта определяет оператор системы (5) при n = 2. Структура H задает характеристический полином (7). Оператор H для системы с обратной связью формируется сс помощью матриц FTAT , A = ( AAT ) и P + заданы равенствами −1 0 0  1 0  FuTu AT =  , A =  0 0,5 , − 1     0  1 0  1 1   P + = AT A = 0 1    = 0 0,5  .   0 0,5   0 −1 0 −0,5 Тогда оператор линейной системы ЛОУ для n = 2 имеет числовую матрицу 0   0 1 0  0 H=  +  H =  p  0 −0,5 0 1     1 1  ,  = 1 −  2.  p2  Таким образом, база индукции для синтеза структуры линейного оператора системы ЛОУ для параметра n = 2 доказана. Продолжение доказательства по индукции для n = 3 и закона (2.а) представляет оператор ЛОУ в виде uk* =  Tu P + Hxk , где матрица этого линейного проекционного оператора примет вид 1 0 uk  =   0 0 0 1   0  0 −1 0 0  1 1    0 1 0    0 1 0 0   0 0 1      0 0 1 −1  0 −1   0 =   −0,5 p1 −0,5 p2 −0,5 p3  xk , xk  0 0   1 0   Hx = k 0 1   0 −1  3 . Далее доказано, что в операторе ЛОУ с обратной связью по состоянию + типа (6) матрица P задается равенством 0 0  1 0 1    0 1 1 0    0 1 0 0   0 0 0 1      1 − 1   0 −1   0 0 0 0  1 0  1    0 1 0   0   0 1 0  =  .     0 0 0,5  1    0 0 0,5    −1 0 0 −0,5 1 0 + T T −1 P = A ( AA ) =  0  0 1 0 = 0  0 1 −1 0   0   = 1   −1  Фробениусова форма матрицы системы с обратной связью равна  0 1  H = 0   p1  p 2  0   1  ,  = 1 −  2.  p 3  Фробениусова матрица H оператора системы с обратной связью определяет характеристический полином типа (7). На данном этапе в Этим доказана база индукции для системы ЛОУ с обратной связью по состоянию (6). Индукционный переход обобщает структуры матриц системы ЛОУ введением матрицы K  nxnx . Тогда вектор управления для uk* =  Tu P + HKxk = −1 1 0   1 0   1    0 1   H  k1 0  x = =   0 0 1  0 1      0 k  k   0 1 −1    2   0 −1  0 −1  1 0  −1  k1 0  1 0    =   0 0 1  0 1   H  0 k  xk .   0 0,5  2 0 −1 В результате линейный оператор ЛОУ примет вид 0 uk  =   0 −0,5    p1 1  k 1 0  k2   0  x =  − , 5    k p k p  xk = p 2   0 k 2  k  1 1 2 2 =  ( −0,5k 1 p 1 | − 0,5k 2 p 2 ). Из доказанного выше следует, что для векторного случая управления по состоянию матрица при K  nx nx , а управление имеет вид uk* =  Tu P + HKxk = ( =  −0,5 k1 p1 ... − 0,5 ki pi ) − 0,5 knx pnx xk . ... Таким образом, метод синтеза определяет параметры обратной связи  для оператора системы ЛОУ на основе характеристического полинома системы. Для управлений на основе «взвешенных» компонент вектора состояний линейные операторы допускают обобщения для квадратичных функционалов общего вида. При синтезе систем ЛОУ с интервальными ограничениями на параметры объекта для моделей данного раздела можно использовать теоремы проф. В.Л. Харитонова, например, для анализа интервальной устойчивости линейных систем ЛОУ. 3. К устойчивости линейных разностных операторов систем с динамическими законами ЛОУ. Пусть оператор линейной системы ЛОУ с дискретным динамическим регулятором имеет вид F   xk   xk +1   H zk +1 =  = (9)     u  = Hzk , u  T P E m  k +1,   u A  k где приращения векторов локально оптимальных управлений равны uk* =  Tu PA zk* =  Tu P + Hxk , P + = AT ( AA T ) . −1 Тогда для суммарного скалярного управления и фробениусовой матрицы объекта матрица оператора линейной системы ЛОУ равна  H H ( ) =  +  Tu P H F  , Enu   =  Enx . Таким образом, разностный оператор системы ЛОУ с обратной связью имеет вид xk +1 = H ( ) xk , xk0 = x0 , а характеристическое уравнение ( системы ) суммарным представляется в форме det H (  ) −  E nx +nu = 0. законом 7.СИНТЕЗ ЛИНЕЙНЫХ ЛОКАЛЬНО ОПТИМАЛЬНЫХ СИСТЕМ ПРОГРАММНОЙ СТАБИЛИЗАЦИИ Результаты п. 2.3 позволяют получить решение задачи: вычислить числовой вектор  x = arg min  ( x ) = x − C ( t ) = P + b + P 0C  2 2 x  D =  Ax = b, A  n mn  = (11) . Нетрудно видеть, что решение данной частной задачи оптимизации позволяет синтезировать локально оптимальное управление для стабилизации программных движений, заданных программным вектором C = С ( t )  m . При этом справедливы все соотношения для синтеза управлений, полученные в п. 2 данного раздела. Поэтому уравнение системы локально оптимальной стабилизации программных движений с обратной связью примет вид xk +1 = Hxk + F  Tu P +bk + P 0Ck  bk Hxk , yk = D1 xk + D2uk  ny nx , , xk0 = x 0 , (5) где вектор управлений uk = Tu P +b + P 0C , формируется управление в функции программного вектора и вектора отклонений координат состояния от положения равновесия. Данная задача оптимизации может быть обобщена для аппроксимации динамики в пространстве m ( l 2 ) с конечным временем прогнозов состояний или выходов (см. п. 3.5). В результате исследования показано, что уравнения линейных систем с операторами ЛОУ следуют из (3.1.16). Условия устойчивости линейных операторов систем ЛОУ (5), (6) дополняют результаты, полученные в [16, 17]. При этом должен быть выполнены ранговый критерий управляемости, устойчивости и минимальной фазовости линейных разностных уравнений динамического объекта. Таким образом, на основе проекционного метода для локально оптимальных систем стабилизации положения равновесия и программного движения с управляемыми по Р. Калману объектами определены характеристические полиномы замкнутых систем с учетом факторизации в проекционном методе пространства «координатуправлений» на многообразие (подпространство) и ортогональное дополнение к нему. Выводы: 1. Спектральные условия устойчивости линейных систем ЛОУ для управляемых по Р. Калману объектов сформированы методом индукции по размеру для разностных операторов и характеристических полиномов систем управления с обратной связью. 2. Аналитическая структура матриц разностных операторов систем ЛОУ позволяет качественно исследовать спектральные условия сжатия. 3. Характеристические полиномы замкнутых систем получены с учетом факторизации в проекционном методе пространства «координат-управлений» на многообразие и ортогональное дополнение к нему. 4. Методика обобщается в п. 3.5 естественным образом для синтеза интервально оптимальных управлений с «конечным горизонтом планирования» динамики системы в аппроксимации пространства nx (l ) , 2 не используя процедуру решения уравнения Риккати. 8. УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ СИСТЕМ С ЛОКАЛЬНО ДОПУСТИМЫМИ УПРАВЛЕНИЯМИ ДЛЯ СТАБИЛИЗАЦИИ ПРОГРАММНЫХ ДВИЖЕНИЙ ОБЪЕКТОВ (используются многие разделы функционального анализа) Синтез нелинейных систем стабилизации программных движений выполнен на основе моделей с проекционными операторами локально допустимых (ЛДУ) и локально оптимальных (ЛОУ) управлений. Сходимость (как существование предельных элементов последовательности )и условия сжатия операторов систем данного класса исследованы в евклидовом пространстве. Счетные последовательности (с аргументом k  ) образов нелинейных разностных операторов систем определяются нелинейными моделями, а также линейными моделями, введенными на прошлой лекции. Операторы систем учитывают нелинейности объекта и нелинейные особенности проекционных управлений. Устойчивость операторов исследуются на основе принципа сжимающих отображений, адекватных системам управления с адекватными проекционными проекторами для управлений. Полученные на первом этапе условия устойчивости операторов линейных систем ЛОУ (п. 3.2) определяют «запасы устойчивости», используемые при синтезе корректных нелинейных систем. На втором этапе исследуется устойчивость нелинейных систем ЛДУ и ЛОУ с вычислительной регуляризацией операторов управления. Регуляризация обеспечивает корректность операторов управления при различных состояниях объекта. В управлении также используются уравнения стационарных состояний объекта. Евклидова метрика для оценки норм возмущенного движения систем вычислена на основе разностных и стационарных уравнений. Условия устойчивости как условия сжатия разностных операторов систем ЛДУ и ЛОУ в областях притяжения учитывают смешанные ограничения-неравенства на координаты и управления. Для исследования устойчивости применяются элементы методов анализа операторных уравнений в банаховых пространствах [1, 2], представленные ранее. Как было отмечено, условия сжатия используют «запасы устойчивости» уравнений объекта или линейных частей операторов управления [1, 2]. При этом «обобщенные запасы устойчивости» включают «запасы объекта» или «запасы объекта и линейной части оператора управления». Устойчивость систем анализируется для операторов, которые реализуют статические законы управления. Единственные стационарные управления систем ЛДУ и ЛОУ принадлежат окрестности вектора определенного с учетом «фильтрующей матрицей» управлений. Состояния достижимы при наличии ресурсов управлений, определяющих общие для ЛДУ и ЛОУ «счетные условия совместности ограничений». Условия сжатия доказывают существование стабилизирующих управлений. Определение 1. Решение задачи Коши для операторов (3.1.19) и (3.1.20) является устойчивым (сходящимся) в некотором шаре D – области притяжения, если выполнены условия xk 0  D,   0  k0  :  k  k0  xk − x   . Определение 2. Решение задачи Коши для разностных операторов (3.1.19), (3.1.20) является асимптотически устойчивым (асимптотически сходящимся) в некотором шаре D, если выполнено условие  xk 0  D  n  xk − x → 0, k → . Выпуклая комбинация классических «граничных экстремальных z z векторов» k  и k с «параметром допустимости» в (1) и в силу (18) – (20) из п. 3.1 [1, 2], при одношаговом прогнозе и фильтрующей матрице Tu задает счетное семейство векторов локально-допустимых управлений (ЛДУ) uk ( xk ) =  Tu zk = Tu (1 −  ) zk  +  zk  = ( )   = Tu  PAbki ( xk ) + 1 − 2 P 0C  −1 2 1 2 ( xk )  ,    0, 1  ,   bk1 ( xk ) = Hxk , bk2 ( xk ) = H  x ( xk ) , (1.a) где граничные векторы как решения задач классической оптимизации zk ( xk ) = PAbki ( xk ) + P 0C  −1 2 1 2 ( xk ) , zk = PA bki ( xk ) − P 0C  −1 2 1 2 ( xk ). Тогда модель системы с локально допустимыми управлениями (ЛДУ) типа (1.а) представлена задачей Коши для счетной последовательности нелинейных разностных операторов x k +1 = H  x ( xk ) + Fu  u  uk ( xk )  =   = H  x ( xk ) + Fu  u  Tu  PAcH  x ( xk ) +  P 0Ck  −1 2 k1 2 ( xk )  , yk = cxk , (1) с нелинейным объектом x k +1 = H  x ( xk ) + Fu u  uk , далее uk =  uk ( xk ) ; xk 0 = x 0  D − область притяжения как множество начальных состояний, из которых система возвращается в положение равновесия. «параметр допустимости» ограничен  = (1 − 2 )   −1, + 1, «функция ограничений» для координат  1 2 ( xk ). Оператор u  uk ( xk ) задает ограничения на управления, вносимые нелинейностями объекта, которые учтены при синтезе. Граничные (лагранжевы) векторы минимума максимума zk zk и векторы для функционала 2  = zk − Ck 2 принадлежат пересечению линейного многообразия и сферы (п. 2.3). Вектор локально допустимых управлений u ( xk ) в (1) формирует управления при нежестком учете ограничений на управления целевым вектором C = ( Сn Cn y u ) или C = ( 0 T ) T ny Cnu а «функция ограничений» для координат, следующая из структуры оператора оптимизации (см. ранее) в терминах задачи управления равна  ( xk ) = r 2 − (bik ) ( AAT ) bik , bik = cHx k , 1 2 = (СТ P0C ) = P0C 2 , C  0nx +nu . −1 T 12 2. Модель системы локально оптимального управления (ЛОУ) с «функцией оптимальности»  ( xk ) реализует минимальные отклонения выходов и управлений от вектора C = ( 0n Cu ) T y с «функцией ограничений», вытекающей из структуры оператора отимизации, которая равна  1 2 ( xk ) , которая для координат состояний учтена в задаче Коши xk +1 = H  ( xk ) + F  uk  ( xk )  =   = H  x ( xk ) +  Fu  Tu  P + H  ( xk ) + 1 − 2 ( xk ) P 0C  −1 2  1 2 ( xk ) , (2) где xk 0 = x0  Dx , а область Dx − область притяжения системы (2). В силу п. 2.2 для разностного оператора дискретной системы ЛОУ «функция оптимальности»   ( xk ) = 1 − 2 p ( 0 k )   0, 1,  0 k = arg min  ( ) = (1 −  ) zk +  zk − C 2 2  , (3) определена проекцией на интервал [0, 1] прямой, принадлежащей счетному семейству пар граничных элементов для задач оптимизации, решаемых в реальном времени. Как отмечалось, «функция оптимальности» для оператора системы ЛОУ учитывает смешанные ограничения координат и управлений на основе одношагового прогноза. Для корректности управлений в (1) – (2) требуется отделимость от нуля вектора функционала, т. е. С может не быть нулевым вектором, а весьма малым по норме (длине) для задачи стабилизации программных движений, что очевидно следует из разностного оператора. Свойства «функции ограничения» параметров операторов (1) – (2) исследованы в леммах, которые основаны на свойстве Липшица для операторов. Лемма 1. Пусть «функция ограничения» для систем ЛДУ и ЛОУ:  1 2  p ( qT Pq ) =  r 2 − p ( qT Pq ) 12 , (4) заданная в (1), (2) и (4) суперпозициями квадратного корня, преобразования сдвига, квадратичной формой и оператором проекции p ( vk ) элемента vk на интервал  2  qkT Pqk  ( r 2 −  2 )  , 0    r , корректно определена. При этом структура векторов vk определяются моделью объекта и законом управления в функции векторов состояния или выходных координат так, что v = qkT Pqk  , qk = Нxk , qk = Н  ( xk ) , qk = cНyk , qk = Н  ( yk ) . Тогда образ кусочно-линейного проектора p  1 2 ( qk )    2  qkT Pqk  ( r 2 −  2 )  , qk = q ( xk ) , (5.а ). ограничивает квадратичную форму интервалом в (5.а), где проектор ( ) p  ( a ) = 0,5 v −  2 − v − ( r 2 −  2 ) + r 2   2 , r 2 −  2   , v = qkT Pqk , (5.б) реализует неотрицательность аргумента для квадратного корня. Лемма 1 доказана. Эта лемма, используемая при анализе условий сжатия разностных операторов (8.а) и (8.б), определяет условия устойчивости систем при смешанных ограничениях на координаты и управления. Условия устойчивости разностных операторов дискретных систем локально допустимого управления. Оператор ЛДУ синтезируется с учетом ограничений на переменные на основе модели [48] xk +1 = H м ( xk ) + Fм u ( xk ) , xk  n , uk  m , (6) где параметры модели и объекта совпадают, и могут быть заданы в произвольной форме или в форме Фробениуса так, что H м = H F , Fм = FF . Как отмечено в п. 3.1, модель объекта (6) учитывается линейным многообразием, а ограничения – шарами, аппроксимирующими гиперкуб в проекционных операторах ЛДУ и ЛОУ. Далее используются функции с регуляризацией. Определение 3. Оператор ЛДУ с регуляризацией (7.а) вида u ( xk ) = u ( xk , p ) ,  p [−1, 1], с числовым «параметром допустимости» или оператор ЛОУ с регуляризацией (7.б) вида u ( xk ) = u ( xk ) с функциональным «параметром допустимости»  p ( xk )  [−1, 1] и общей «функцией ограничения»  p1 2 ( xk ) определяют оператор управления ЛДУ с обратной связью u ( xk ) =  Tu P+ Hxk +   pTu P 0Ck  −1 2 1p 2 ( xk ) , (7.а) и оператор управления ЛОУ с обратной связью u ( xk ) =  Tu P+ Hxk +   p ( xk )Tu P 0C  −1 2 1p 2 ( xk ). Параметры (7.б) Параметры  p = 1 − 2 p ( 0 )  [−1, 1],  0  ,   ;  = P 0C , 2 2 и проекционные операторы имеют вид P 0 = En − PA A, P + = AT ( AAT ) . −1 «Функция ограничения» для операторов (7.а) и (7.б) равны  1p 2 ( xk ) = r 2 − p ( qkT qk ) , qk = PA H  ( xk ) , PAT PA = ( AAT ) −1 A. (8) Лемма 2. Оператор (7), (8) обладает свойствами: 1). «Параметр допустимости» линейным проектором p, регуляризованный кусочно- p (0 )  0, 1, p ( )  1, реализует «включение»:  p = 1 − 2 p (0 )   −1, 1,   , p (0 ) = 0,5 ( 0 − 0 − 1 + 1)  0, 1, как образ проектора для 0  , задает допустимый вектор управлений на основе выпуклости линейной комбинации граничных векторов. Параметр   , определяет интенсивность обратной связи. 2). Кусочно-линейный проектор p ( q ), q  , типа (5.б) в силу п. 2 леммы 1 обеспечивает регулярность «функции  1р 2 ( xk ) , ограничения» реализует ограниченное «включение» p ( qkT qk )  0,1r 2 ; 0,9r 2   , qk  где в (5.а) и (5.б)  = 0,1. Тогда функция квадратного операторов ЛДУ и ЛОУ имеет вид nx , 2  12 корня ( xk ) →  1p 2 ( xk ) =  r 2 − p ( qkT qk ) p 12 с регуляризацией  , qk = P + H  ( xk )  для nx , где функция квадратного корня, корректно определенная равенством p ( 1p 2 ( xk ) )   2 , r 2 −  2   , и удовлетворяет условию Липшица. Доказательство п. 1 леммы 2 следует из определения выпуклой комбинации векторов в силу кусочно-линейного проектора p ( ) для учета ограничения  p = p (0 )  0; 1. Доказательство п. 2 леммы 2 следует из комментариев, данных выше, поясняющих последовательные вычисления 12 q , постоянных Липшица по аргументу q  для функции p ( ) а  1p 2 ( xk ) p .  затем – для проектора При этом отделено от нуля  1p 2 ( xk ) ,  p−1 2 ( xk ). значений поэтому существует Лемма 2 доказана. Лемма 3, использующая условия Липшица операторов. x Пусть управления для состояний xk и * систем ЛДУ и ЛОУ определены в (7), (8), где «функции ограничения» имеют вид  1p2 ( xk ) =  r 2 − p ( qkT qk ) 12 , qk = PA H  ( xk ) ,  1p2 ( x ) =  r 2 − p ( qT q ) 12 , q = PA H  ( x ) . Тогда для «функций ограничения», общей для операторов систем ЛДУ и ЛОУ, имеют место оценки  p1 2 ( xk ) −  p1 2 ( x* )  2 r L L p Lx P + 2 H 2 xk − x 2 , (9) где L = 1, L p = 1 − постоянные Липшица для функции «квадратного корня» и кусочно-линейного проектора, соответственно. Доказательство. Оценки Липшица в левой части (9) выполняются в порядке, который определен структурой суперпозиции, начиная с внешней функции p ( qkT qk ) − p ( q*Т q ) . Тогда оценки имеют следующий вид  12 p ( xk ) −  ( x* ) 12 p  L p ( qkT qk ) − p ( q*Т q )  Lip Lip  L L p qkT qk − qT q  L L p qk = L L p (q k 2 + q 2 )( q k 2 2 2 − q − q 2 ), 2 2 = где qk = сН  ( xk ) , q = сН  ( x ) , L , L p − аргументы функции  1p 2 ( xk ) ,  1p 2 ( x* ) , соответственно, и постоянные Липшица для функции  1p 2 ( xk ) и проектора, используемого в этой функции для регуляризации квадратного корня (см. ранее). В силу известного неравенства qk − q 2 2  qk − q 2 , в силу оценок оценок qk 2  r , q 2  r, неравенства Коши-Буняковского следует неравенство (q + q k 2 2 )( q − q )  2r qk − q 2 ,  2 k При этом выполнены следующие неравенства def qk − q  P+ 2 H 2 2  P + H  ( xk ) − P + H  ( x )   ( xk ) −  ( x ) 2  P + 2 H 2 Lx xk − x 2 . Лемма 3 доказана. Следующая лемма справедлива для гильбертова пространства [1, т. 1, с. 8], однако далее в книге она используется в евклидовом пространстве. Лемма 4. Норма суммы двух векторов в евклидовом пространстве удовлетворяет неравенству треугольника для норм a+b 2  a 2 + b 2 . Доказательство. Квадрат евклидовой нормы можно представить равенством a+b 2 2 = a + 2a T b + b 2 2 2 2 , а из неравенства Коши-Буняковского: a  b  а 2  b 2 следует очевидная оценка a+b  a 2 2 +2 a  b + b 2 2 2 2  ( a + b 2 ), 2 2 из которой следует утверждение леммы. Лемма 4 доказана. Следствие. Из леммы 4 методом математической индукции по числу слагаемых в левой сумме можно доказать неравенство  s а i =1 i   i =1 ai n 2 2 . Далее доказаны условия сжатия и вычислены параметры ограниченных управлений систем ЛДУ в евклидовом пространстве. Утверждение 1. Пусть выполнены условия: 1). Динамика и стационарные состояния системы ЛДУ описываются разностным (8.а) и стационарным операторами типа (8.б): xk +1 = H ( x k ) +  FTu  P + H ( x k ) +  P 0C  −1 2 1р 2 ( x k )  , x 0  D, (10.а)   x* = H ( x * ) +  FTu  P + H  ( x * ) +  P0C  −1 2  1 2 ( x * )  . (10.б) 2). Разностный оператор с регуляризацией (10.а) удовлетворяет определению (7.а) и леммам 2 и 4. 3).Линейный объект управления устойчивый, т.е. H 2  1. 4). Выполнены условия: P0 2  1,  −1 2 = ( С Т P 0С ) −1 2 = P 0С −1 2 . Тогда имеют место следующие утверждения: 1). Для устойчивости нелинейной системы ЛОУ достаточно, чтобы оценка параметра сжатия s  для разностного оператора (10.а), получаемые по аналогии со свойствами геометрической прогрессии, будет иметь вид s H 2  Lx +   Т u  P +  H Lx + +2     Т u  P 0С  −1 2 rL L p Lx A 2  H 2  1, (11) где параметры (11) даны в леммах 1-3. и выполнены условия P 0 2  1,  −1 2 = ( С Т P 0С ) −1 2 = P 0С −1 2 . Доказательство следует из оценки евклидовой нормы разности числовых векторов состояний xk +1 − x 2 , где xk +1 задан в (10.а), а вектор x в – (10.б). Тогда в силу леммы 4 и (10) оценки метрики принимают вид  ( xk +1 , x )  H  ( xk ) −  ( x  ) xk +1 − x  2  ( ) +  F Т u P + H  ( xk ) −  F Т u P + H  x  2 ( ) +   F Т u P 0C  −1 2 1р 2 ( xk ) −   F Т u pC0  1р 2 x  2 + 2 , 2 где параметры операторов удовлетворяют условиям P 0С −1 2  = P 0С 2 2 P 0C −1 2 = pC0 2 = 1. Нормы разности нелинейных операторов по условию Липшица  ( xk ) −  ( x  ) 2  Lx xk − x  , 2 определяют оценки метрики неравенством  ( xk +1 , x  ) = xk +1 − x  2  H  Lx xk − x  2 +   F  Tu  P +  H Lx xk − x +  F Т u pC0  р1 2 ( xk ) −   FТ u pC0  р1 2 ( x ) . 2 2 2 + (12) 2 Тогда норма разности операторов в (12) оценивается следующим неравенством   Т u pC0 2  1р 2 ( xk ) −   Т u pC0 2  1р 2 ( x )      Тu 2  pC0 2  2  1р 2 ( xk ) −  1р 2 ( x ) . В силу леммы 3, соотношения (9.б), условия Липшица для  ( xk ) , данного выше, оценка модуля разности примет вид  1p 2 ( xk ) −  1p 2 ( x* )  2rL L p Lx A  H  xk − x 2 . (13) С учетом неравенства треугольника норма разности операторов в (11) оценивается неравенствами  ( xk +1 , x  ) = xk +1 − x   H Lx +   Tu  P +  H Lx xk − x + + 2r     Tu  pC0 L L p Lx A  H Lx xk − x . (14) 2 Тогда из оценки метрик (14) следует ограничение (11) на «оценку параметра сжатия» для разностного оператора системы ЛДУ. Из условий (13) и (14) следуют ограничения (11) на величину параметра обратной связи. Утверждение 1 доказано. Далее рассмотрено условие устойчивости для линейного разностного оператора и нелинейного оператора системы ЛДУ. Утверждение 2. Пусть выполнены условия: Линейный разностный оператор системы ЛДУ (10.а), имеющий вид ( ) xk +1 = H +  F Tu P + H xk , (13.а) учитывает линейный объект и линейную часть оператора ЛДУ. 2. Нелинейный оператор системы ЛДУ задан равенством ( ) xk +1 = Hxk +  F Tu P + Hxk +  p pC0  1p 2 ( xk )  ,  (13.б) где функции и параметры в (13.а) и (13.б), следующие из п. 3.1, равны:  ( xk ) =  r 2 − p ( qkT qk ) , 12 12 p  p = 1 − 2 p ( )   −1; 1 ,   , pC0 = P 0C  −1 2 2 2 = 1, T qk = P + H xk , C = Cx Cu   0ny +nu , Cx = TxC , Cu = TuC  0nu . Для анализа устойчивости линейной части оператора (13.а) можно использовать спектральный критерий, доказанный в п. 3.2. Тогда достаточные условия устойчивости как ограничения оценок параметров сжатия операторов (13.а) и (13.б) имеют вид ( 1). s1 = H (   1− H 2 2 +   F )( F u  Tu 2 2  Tu P 2 + 2  P+ H 2 2). s2 = H + 2r F  Tu     p  pC0 2 ) H 2 )  1, −1 2 , H 2  1, Tu (14.а) 2 = 1. L L p Lx P + H  1. (14.б) Тогда из (14.б) следует ограничение на параметр обратной связи   1 − H 2    2 F  2 −1 L L L P H  . (14.в) 2  p x 2 Tu 2 r   p  p + C Доказательство утверждения 2 содержит две части. 1). Анализ устойчивости разностного оператора (13.а) использует линейность оператора H и условие его сжатия в виде s1 = H (  ) 2 = ( H +  FT P H ) + u 2 (  H 2 +   F  Tu 2 2  P+ 2 H 2 )  1, (15) где в силу устойчивости объекта норма его матрицы ограничена: H 2  1. Тогда из (15) следует достаточное условие устойчивости оператора линейной системы ЛОУ (13.а) в виде условия (14.а). 2). Условие (14.б) для нелинейного оператора системы использует «запас устойчивости» (1 − H 2 )  0, который вычислен в соответствии с [12] для линейной части нелинейного разностного оператора. Доказательство устойчивости этого оператора основано на непустом пересечении шара (9.в) и линейного многообразия Azk = bk , zk = ( xk +1 uk ) , A T ( ) (E n − F ) , bk ( Hxk , ) Cx = 0nx , Cu  0nu  S 0nu , r 2 , Tu = 0nx nu Enu . Для оператора (13.б) исследуется устойчивость решения, заданного вектором стационарного состояния x , для которого при ограничениях на «составной вектор» ( ) z = x* u*  S ( 0n+m , r2 )  T n+ m справедливо соответствующее уравнение стационарного состояния ( ) x  = H x + F  Tu p pC0  1p 2 x *  .   Вычитание (16) из уравнения (13.б) определяет для отклонений (16) xk = xk − x  вектора координат от стационарного состояния соответствующее разностное уравнение xk +1 = H Lx xk + F  Tu  p pC0  p1 2 ( xk ) −  Tu  p pC0  p1 2 ( x )  , где «параметр допустимости»  p = 1 − 2 p ( ) L . и вектор xk заданы с учетом (13.б), p и постоянной Липшица  Оценки нормы разности векторов переходных и стационарных состояний системы имеют вид  ( xk +1 , x ) = xk +1  H  2 H xk 2 + F + 2r F 2 2    Tu    Tu 2 2   p  pC0    p p C 2 2 2    1p 2 ( xk ) −  1p 2 ( x* )  (17) 2 L L p P + 2 H 2 xk 2 , где оценка модуля разности в (17) дана леммой 3, а параметры определены равенствами  p = 1 − 2 p ( )  1, p ( )  0, 1, pC0 2 = P0C  −1 2 = 1. Таким образом, полученные оценки метрики определяют для оператора системы ЛДУ (13.б) ограничение (14.б) на параметр сжатия. При этом величина 1− H 2 определяет «запас устойчивости по норме», заданный этим оператором. Утверждение 2 доказано. 9. УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ СИСТЕМ ОПТИМАЛЬНОЙ СТАБИЛИЗАЦИИ ПРОГРАММНЫХ ДВИЖЕНИЙ НА ОСНОВЕ ЛОКАЛЬНО ДОПУСТИМЫХ УПРАВЛЕНИЙ Синтез нелинейных систем стабилизации программных движений выполнен на основе моделей с проекционными операторами локально допустимых (ЛДУ) и локально оптимальных (ЛОУ) управлений. Сходимость и условия сжатия операторов систем данного класса исследованы в евклидовом пространстве. Счетные последовательности образов нелинейных разностных операторов систем определяются нелинейными моделями, а также линейными моделями, введенными на прошлой лекции. Операторы систем учитывают нелинейности объекта и нелинейные особенности проекционных управлений. Устойчивость операторов исследуются на основе принципа сжимающих отображений, адекватных системам управления с адекватными проекционными проекторами для управлений. Полученные на первом этапе условия устойчивости операторов линейных систем ЛОУ (п. 3.2) определяют «запасы устойчивости», используемые при синтезе корректных нелинейных систем. На втором этапе исследуется устойчивость нелинейных систем ЛДУ и ЛОУ с вычислительной регуляризацией операторов управления. Регуляризация обеспечивает корректность операторов управления при различных состояниях объекта. В управлении также используются уравнения стационарных состояний объекта. Евклидова метрика для оценки норм возмущенного движения систем вычислена на основе разностных и стационарных уравнений. Условия устойчивости как условия сжатия разностных операторов систем ЛДУ и ЛОУ в областях притяжения учитывают смешанные ограничения-неравенства на координаты и управления. Для исследования устойчивости применяются элементы методов анализа операторных уравнений в банаховых пространствах [1, 2], представленные ранее. Как было отмечено, условия сжатия используют «запасы устойчивости» уравнений объекта или линейных частей операторов управления [1, 2]. При этом «обобщенные запасы устойчивости» включают «запасы объекта» или «запасы объекта и линейной части оператора управления». Устойчивость систем анализируется для операторов, которые реализуют статические законы управления. Единственные стационарные управления систем ЛДУ и ЛОУ принадлежат окрестности вектора определенного с учетом «фильтрующей матрицей» управлений. Состояния достижимы при наличии ресурсов управлений, определяющих общие для ЛДУ и ЛОУ «счетные условия совместности ограничений». Условия сжатия доказывают существование стабилизирующих управлений. Определение 1. Решение задачи Коши для операторов (3.1.19) и (3.1.20) является устойчивым (сходящимся) в некотором шаре D – области притяжения, если выполнены условия xk 0  D,   0  k0  :  k  k0  xk − x   . Определение 2. Решение задачи Коши для разностных операторов (3.1.19), (3.1.20) является асимптотически устойчивым (асимптотически сходящимся) в некотором шаре D, если выполнено условие  xk 0  D  n  xk − x → 0, k → . Выпуклая комбинация классических «граничных zk z экстремальных векторов» k  и с «параметром допустимости» в (1) и в силу (18) – (20) из п. 3.1 [1, 2], при одношаговом прогнозе и фильтрующей матрице Tu задает счетное семейство векторов локально-допустимых управлений (ЛДУ) ( ) uk ( xk ) =  Tu zk = Tu  1 −  zk  +  zk  = ( )   = Tu  PAbki ( xk ) + 1 − 2 P 0C  −1 2 1 2 ( xk )  ,    0, 1  ,   bk1 ( xk ) = Hxk , bk2 ( xk ) = H  x ( xk ) , (1.a) где граничные векторы как решения задач классической оптимизации zk ( xk ) = PAbki ( xk ) + P 0C  −1 2 1 2 ( xk ) , zk = PA bki ( xk ) − P 0C  −1 2 1 2 ( xk ). Тогда модель системы с локально допустимыми управлениями (ЛДУ) типа (1.а) представлена задачей Коши x k +1 = H  x ( xk ) + Fu  u  uk ( xk )  =   = H  x ( xk ) + Fu  u  Tu  PAcH  x ( xk ) +  P 0Ck  −1 2 k1 2 ( xk )  , yk = cxk , (1) с нелинейным объектом, следующим образом: где область притяжения определена xk 0 = x 0  D − область притяжения как множество начальных состояний, из которых система возвращается в положение равновесия. «параметр допустимости» ограничен  = (1 − 2 )   −1, + 1, «функция ограничений» для координат  1 2 ( xk ). Оператор u  uk ( xk ) задает ограничения на управления, вносимые нелинейностями объекта, которые учтены при синтезе. z Граничные (лагранжевы) векторы минимума k и векторы максимума zk для функционала  = zk − Ck 2 2 принадлежат пересечению линейного многообразия и сферы (п. 2.3). Вектор локально допустимых управлений u ( xk ) в (1) формирует управления при нежестком учете ограничений на управления целевым вектором C = ( Сn Cn y ) или C = ( 0 T u ) T ny Cnu а «функция ограничений» для координат равна  ( xk ) = r 2 − (bik ) ( AAT ) bik , bik = cHx k , 1 2 = (СТ P0C ) = P0C 2 , C  0nx +nu . T −1 12 2. Модель системы локально оптимального управления (ЛОУ) с  ( xk ) «функцией оптимальности» реализует минимальные отклонения выходов и управлений от вектора C = ( 0n Cu ) T y с «функцией ограничений»  1 2 ( xk ) , которая для координат состояний учтена в задаче Коши xk +1 = H  ( xk ) + F  uk  ( xk )  =   = H  x ( xk ) +  Fu  Tu  P + H  ( xk ) + 1 − 2 ( xk ) P 0C  −1 2  1 2 ( xk ) , (2) где xk 0 = x0  Dx , т.е. начальные отклонения принадлежат области притяжения системы (2). В силу п. 2.2 для разностного оператора дискретной системы ЛОУ «функция оптимальности»   ( xk ) = 1 − 2 p ( 0 k )   0, 1,  0 k = arg min  ( ) = (1 −  ) zk +  zk − C 2 2  , (3) определена проекцией на интервал [0, 1] прямой, принадлежащей счетному семейству пар граничных элементов для задач оптимизации, решаемых в реальном времени. Как отмечалось, «функция оптимальности» для оператора системы ЛОУ учитывает смешанные ограничения координат и управлений на основе одношагового прогноза. Для корректности управлений в (1) – (2) требуется отделимость от нуля вектора функционала, т. е. С может не быть нулевым вектором, а весьма малым по норме (длине) для задачи стабилизации программных движений, что очевидно следует из разностного оператора. Свойства «функции ограничения» параметров операторов (1) – (2) исследованы в лемме. Лемма 1. Пусть «функция ограничения» для систем ЛДУ и ЛОУ:  1 2  p ( qT Pq ) =  r 2 − p ( qT Pq ) 12 , (4) заданная в (1), (2) и (4) суперпозициями квадратного корня, преобразования сдвига, квадратичной формой и оператором проекции p ( vk ) на интервал  2  qkT Pqk  ( r 2 −  2 )  , 0    r , корректно определена. При этом структура векторов vk определяются моделью объекта и законом управления в функции векторов состояния или выходных координат так, что v = qkT Pqk  , qk = Нxk , qk = Н  ( xk ) , qk = cНyk , qk = Н  ( yk ) . Тогда образ кусочно-линейного проектора p  1 2 ( qk )    2  qkT Pqk  ( r 2 −  2 )  , qk = q ( xk ) , (5.а ). ограничивает квадратичную форму интервалом в (5.а), где проектор ( ) p  ( a ) = 0,5 v −  2 − v − ( r 2 −  2 ) + r 2   2 , r 2 −  2   , v = qkT Pqk , (5.б) реализует неотрицательность аргумента для квадратного корня. Лемма 1 доказана. Эта лемма, используемая при анализе условий сжатия разностных операторов (8.а) и (8.б), определяет условия устойчивости систем при смешанных ограничениях на координаты и управления. Условия устойчивости разностных операторов дискретных систем локально допустимого управления. Оператор ЛДУ синтезируется с учетом ограничений на переменные на основе модели [48] xk +1 = H м ( xk ) + Fм u ( xk ) , xk  n , uk  m , (6) где параметры модели и объекта совпадают, и могут быть заданы в произвольной форме или в форме Фробениуса так, что H м = H F , Fм = FF . Как отмечено в п. 3.1, модель объекта (6) учитывается линейным многообразием, а ограничения – шарами, аппроксимирующими гиперкуб в проекционных операторах ЛДУ и ЛОУ. Определение 3. Оператор ЛДУ с регуляризацией (7.а) вида u ( xk ) = u ( xk , p ) ,  p [−1, 1], с числовым «параметром допустимости» или оператор ЛОУ с регуляризацией (7.б) вида u ( xk ) = u ( xk ) с функциональным «параметром допустимости»  p ( xk )  [−1, 1] и общей «функцией ограничения»  p1 2 ( xk ) определяют оператор управления ЛДУ с обратной связью u ( xk ) =  Tu P + Hxk +   pTu P 0Ck  −1 2 1p 2 ( xk ) , (7.а) и оператор управления ЛОУ с обратной связью u ( xk ) =  Tu P+ Hxk +   p ( xk )Tu P 0C  −1 2 1p 2 ( xk ). Параметры (7.б)  p = 1 − 2 p ( 0 )  [−1, 1],  0  ,   ;  = P 0C , 2 2 и проекционные операторы имеют вид P 0 = En − PA A, P + = AT ( AAT ) . −1 «Функция ограничения» для операторов (7.а) и (7.б) равны  1p 2 ( xk ) = r 2 − p ( qkT qk ) , qk = PA H  ( xk ) , PAT PA = ( AAT ) −1 A. (8) Лемма 2. Оператор (7), (8) обладает свойствами: 1). «Параметр допустимости», регуляризованный кусочнолинейным проектором p (0 )  0, 1, p ( )  1, реализует «включение»:  p = 1 − 2 p (0 )   −1, 1,   , p (0 ) = 0,5 ( 0 − 0 − 1 + 1)  0, 1, как образ проектора для 0  , задает допустимый вектор управлений на основе выпуклости линейной комбинации граничных векторов. Параметр   , определяет интенсивность обратной связи. 2). Кусочно-линейный проектор p ( q ), q  , типа (5.б) в силу п. 2 леммы 1 обеспечивает регулярность «функции  1р 2 ( xk ) , ограничения» реализует ограниченное «включение» p ( qkT qk )  0,1r 2 ; 0,9r 2   , qk  nx , где в (5.а) и (5.б)  = 0,1. Тогда функция квадратного корня с регуляризацией для операторов ЛДУ и ЛОУ имеет вид 2  12 ( xk ) →  1p 2 ( xk ) = r 2 − p ( qkT qk ) p 12  , qk = P + H  ( xk )  nx , где функция квадратного корня, корректно определенная равенством p ( 1p 2 ( xk ) )   2 , r 2 −  2   , и удовлетворяет условию Липшица. Доказательство п. 1 леммы 2 следует из определения выпуклой комбинации векторов в силу кусочно-линейного проектора p ( ) для учета ограничения  p = p (0 )  0; 1. Доказательство п. 2 леммы 2 следует из комментариев, данных выше, поясняющих последовательные вычисления постоянных  p1 2 ( q ) , q  Липшица по аргументу для функции а затем – для проектора p . При этом значение  1p 2 ( xk ) отделено от нуля, поэтому существует  p−1 2 ( xk ). Лемма 2 доказана. x Лемма 3. Пусть управления для состояний xk и * систем ЛДУ и ЛОУ определены в (7), (8), где «функции ограничения» имеют вид  1p2 ( xk ) =  r 2 − p ( qkT qk ) 12 , qk = PA H  ( xk ) ,  1p2 ( x ) =  r 2 − p ( qT q ) 12 , q = PA H  ( x ) . Тогда для «функций ограничения», общей для операторов систем ЛДУ и ЛОУ, имеют место оценки  p1 2 ( xk ) −  p1 2 ( x* )  2 r L L p Lx P + 2 H 2 xk − x 2 , (9) где L = 1, L p = 1 − постоянные Липшица для функции «квадратного корня» и кусочно-линейного проектора, соответственно. Доказательство. Оценки Липшица в левой части (9) имеют вид  12 p  L p ( qkT qk ) − p ( q*Т q )  ( xk ) −  ( x* ) Lip 12 p Lip  L L p qkT qk − qT q  L L p qk = L L p где (q k 2 + q )( q k 2 2 − q 2 2 − q 2 2 2 = ), qk = сН  ( xk ) , q = сН  ( x ) , L , L p − аргументы функции  1p 2 ( xk ) ,  1p 2 ( x* ) , соответственно, и постоянные Липшица для функции  1p 2 ( xk ) и проектора, используемого в этой функции для регуляризации квадратного корня (см. ранее). В силу известного неравенства qk − q 2 2  qk − q 2 , в силу оценок оценок qk 2  r , q 2  r, неравенства Коши-Буняковского следует неравенство (q + q k 2 2 )( q − q )  2r qk − q 2 ,  2 k При этом выполнены следующие неравенства qk − q  P+ 2 H 2 def 2  P + H  ( xk ) − P + H  ( x )   ( xk ) −  ( x ) 2  P+ 2 H 2 Lx xk − x 2 . Лемма 3 доказана. Следующая лемма справедлива для гильбертова пространства [1, т. 1, с. 8], однако далее в книге она используется в евклидовом пространстве. Лемма 4. Норма суммы двух векторов в евклидовом пространстве удовлетворяет неравенству треугольника для норм a+b 2  a 2 + b 2 . Доказательство. Квадрат евклидовой нормы можно представить равенством a+b 2 2 = a + 2a T b + b 2 2 2 2 , а из неравенства Коши-Буняковского: a  b  а 2  b 2 следует очевидная оценка a+b 2 2  a 2 2 +2 a  b + b 2 2  (a 2 + b ), 2 2 из которой следует утверждение леммы. Лемма 4 доказана. Следствие. Из леммы 4 методом математической индукции по числу слагаемых в левой сумме можно доказать неравенство i=1 аi s   i =1 ai n 2 2 . Далее доказаны условия сжатия и вычислены параметры ограниченных управлений систем ЛДУ в евклидовом пространстве. Утверждение 1. Пусть выполнены условия: 1). Динамика и стационарные состояния системы ЛДУ описываются разностным (8.а) и стационарным операторами типа (8.б): xk +1 = H ( x k ) +  FTu  P + H ( x k ) +  P 0C  −1 2 1р 2 ( x k )  , x 0  D, (10.а)   x* = H ( x * ) +  FTu  P + H  ( x * ) +  P0C  −1 2  1 2 ( x * )  . (10.б) 2). Разностный оператор с регуляризацией (10.а) удовлетворяет определению (7.а) и леммам 2 и 4. 3).Линейный объект управления устойчивый, т.е. H 2  1. 4). Выполнены условия: P0 2  1,  −1 2 = ( С Т P 0С ) −1 2 = P 0С −1 2 . Тогда имеют место следующие утверждения: 1). Для устойчивости нелинейной системы ЛОУ достаточно, чтобы оценка параметра сжатия s  разностного оператора (10.а) удовлетворял неравенству s H 2  Lx +   Т u  P +  H Lx + +2     Т u  P 0С  −1 2 rL L p Lx A 2  H 2  1, (11) где параметры (11) даны в леммах 1-3. и выполнены условия P 0 2  1,  −1 2 = ( С Т P 0С ) −1 2 = P 0С −1 2 . Доказательство следует из оценки евклидовой нормы разности числовых векторов состояний xk +1 − x 2 , где xk +1, x определены в (10.а) и (10.б). Тогда в силу леммы 4 и (10) оценки метрики принимают вид  ( xk +1 , x )  H  ( xk ) −  ( x  ) xk +1 − x  2  ( ) +  F Т u P + H  ( xk ) −  F Т u P + H  x  2 ( ) +   F Т u P 0C  −1 2 1р 2 ( xk ) −   F Т u pC0  1р 2 x  2 + 2 , 2 где параметры операторов удовлетворяют условиям P 0С  −1 2 = P 0С 2 2 P 0C −1 2 = pC0 2 = 1. Нормы разности нелинейных операторов по условию Липшица  ( xk ) −  ( x  ) 2  Lx xk − x  , 2 определяют оценки метрики неравенством  ( xk +1 , x  ) = xk +1 − x  2  H  Lx xk − x  2 +   F  Tu  P +  H Lx xk − x +  F Т u pC0  р1 2 ( xk ) −   FТ u pC0  р1 2 ( x ) . 2 2 Тогда норма разности операторов в (12) оценивается неравенством      Тu 2  pC0 2 + (12) 2   Т u pC0 2  1р 2 ( xk ) −   Т u pC0 2  1р 2 ( x ) 2  2  1р 2 ( xk ) −  1р 2 ( x ) . В силу леммы 3, соотношения (9.б), условия Липшица для  ( xk ) , данного выше, оценка модуля разности примет вид  1p 2 ( xk ) −  1p 2 ( x* )  2rL L p Lx A  H  xk − x 2 . (13) С учетом неравенства треугольника норма разности операторов в (11) оценивается неравенствами  ( xk +1 , x  ) = xk +1 − x   H Lx +   Tu  P +  H Lx xk − x + + 2r     Tu  pC0 L L p Lx A  H Lx xk − x . 2 (14) Тогда из оценки метрик (14) следует ограничение (11) на «оценку параметра сжатия» для разностного оператора системы ЛДУ. Из условий (13) и (14) следуют ограничения (11) на величину параметра обратной связи. Утверждение 1 доказано. 10. ОПЕРАТОРЫ ЦИФРОВОЙ ДИНАМИКИ СИСТЕМ ОРГАНИЗАЦИОННОГО ОПТИМАЛЬНОГО УПРАВЛЕНИЯ В настоящее время актуальной задачей является создание ЦИФРОВЫХ МОДЕЛЕЙ в виде разностных операторов для описания динамики развития промышленности и экономики. В данной лекции сформулированы математические модели динамики развивающихся систем технического и организационного управления. Эти модели далее представлены в виде разностных нелинейных операторов оптимального управления. В связи с этим далее предложены канонические формулировки моделей и задач для синтеза оптимальных или допустимых управлений динамикой производства. Эти модели будут представлены совокупностью иерархических задач линейного программирования для математического задания стратегий цифрового управления, общая теория которых дана в [1 - 5]. Иерархические модели и стратегии могут быть реализованы на основе динамического программирования Р. Беллмана, принципа максимума Л.С. Понтрягина или методов математического программирования [3, 4], однако имеются ограничения на класс моделей, которые должны быть линейными. В данной работе предлагается иерархическая математическая программируемая среда, для которой в аналитической форме формируются управления, задающие оптимальные стратегии для различных уровней иерархии. Предполагаются различные уровни иерархии, однако изложение ведется с позиции управления предприятием с иллюстрацией внешней стратегии (требований по функционалу) как установочной в части функционала качества с возможностью моделей взаимодействия отдельных частей (производств). Эта стратегия может быть перенесена на уровень отраслей с соответствующими корректировками. Целевая сущность рассмотренных задач позволяет использовать модели управления для описания стратегии развития различных объектов на основе проекционных операторов квазианалитического класса [3, 4], поскольку рассмотренные модели имеют универсальный характер. 1. Постановки задач условной оптимизации для линейных функционалов. Пусть модели системы управления объектом управления в виде совокупности одно- или много продуктовых производств представлены обобщенным нелинейным разностным оператором xk +1 = H  ( xk ) + F  uk , yk = cxk , (1) где числовые матрицы: H  R nn , F  R nn , а координаты xk  R n определяют количество создаваемых ресурсов, требуемых для создания одного или нескольких продуктов (изделий). Внутренние ограничения на ресурсы отдельных предприятий и управления учитываются нелинейными операторами  ( xk )  Rn ,  uk   Rm . Операторы управлений uk  R m , (2.а) задают стратегии (алгоритмы) преобразования исходных ресурсов в модели результатов деятельности предприятий (отраслей) промышленности на основе оптимизации с помощью проекционных операторов. Операторы ограничений заданы координатными функциями интервальных ограничений вида  i ( xki ) ,  i uki  , i = 1,2,...,n, учитывающими ресурсы кусочно-линейными функциями [2, 3] ( )  i ( qki ) = sat ( qki ) = 0.5 qki + ai − qki − ai   −ai , ai   R, i = 1,2,...,n, (2.б) которые эквивалентны интервальным ограничениям-неравенствам на координаты и управления: −ai  zi  ai , i = 1, n. Если для моделей производства многих продуктов динамика объекта управления описана моделью (1) с диагональными или блочнодиагональными матрицами H = diag H i  R n n , F = diag Fi  R n m , i i i (3) i то это соответствует несвязанным производствам (отраслям). При необходимости связывания линейных моделей процессов требуется ввести недиагональные элементы блочных матриц. Пример 1. Трехблочные разностные уравнения процессов с линейными аддитивными связями между функциями от координат состояний и аддитивными связями между управлениями для подпроцессов:  H11 xk +1 =  0  0 H12 H 22 ( ) ( )   x1k  H13     F11  2 0   xk  +  0     H 33    x3   0  ( k ) F12 F22 ( ) ( )   u1k  F13     2   0  uk ,   F33    u 3   ( k ) yk = cxk . Пример 2. Трехблочные разностные уравнения процессов с билинейными связями между координатами состояний и аддитивными связями между управлениями трех подпроцессов:  diagH x    diagH x  11 1k 22 2 k    F11 + 0 xk +1 =  H 22 ( xk3 )    3    0 H 33 ( xk )   F12 F22 ( ) ( )   u1k  F13     2   0   uk , yk = cxk .    F33    u 3   ( k ) При этом диагональные матрицы могут отражать различные уровни иерархии с учетом упомянутых выше ограничений и стратегий управления производством. В этом случае управляющие воздействия принимают соответствующий иерархический смысл. 2. Математическая модель динамики одно- или много продуктовых систем с проекционными операторами управления. С учетом сказанного выше система управления объектом для производства многих продуктов описывается разностными нелинейными уравнениями [3, 4] xk +1 = H  x ( xk ) + F  uk  ( xk ) =   = H  x ( xk ) +  Fu  Tu  P + H  ( xk ) + 1 − 2 ( xk ) P 0C  −1 2  1 2 ( xk ) , (4) где матрицы в разностном нелинейном операторе системы (4) с учетом операторов ограничения ресурсов в объекте и в управлениях имеют вид Tu = ( 0nn Em ) , P + = A ( AAT ) , P0 = En+m − P + A. −1 Проекторы P + , P 0 определены матрицей, которая позволяет ввести в ограничения задач линейные многообразия, в которые погружаются модели процессов и требования к ним. Нелинейный «оператор ограничения»  1 2 ( xk ) и «параметр оптимальности»  ( xk )  R, используемые в проекционных операторах оптимизации будут определены далее. Оптимальный вектор z (x uk )  R n+m , характеризует прогнозы T k +1 произведенных продуктов xk +1  R n и управлений uk  R m , что определяет составной вектор z (x uk  )  R n+ m , используемый для вычисления T k +1, оптимальных управлений. Вектор управлений минимизирует общий функционал стоимости  ( z ) = C0T z с вектором «цен» на продукцию предприятий (отраслей) вида C0  R n+m , для стратегий производства, заданных операторами H , F и управлениями, вычисленными с помощью проекционного оператора оптимизации [3, 4] z (x   uk  ) = arg min  ( z ) = C0T z A0 z = b 0 , A0  T k +1,  arg min  ( z ) = C T0 z A0 z = b 0 , A0  mxn mxn , z −  z  z +   , ( z − d ) Q(z − d )  r2  T n , (5.а) откуда следует вектор управления uk  = Т u ( xk +1, uk  ) , Tu = ( 0mn Em ) . T (5.б) В этом случае происходит «погружение задачи вычисления управлений» в «задачу конечномерной оптимизации». В формулировке задачи (5.а) интервальные ограничения типа параллелепипеда z −  z  z +  Rn , (6) далее аппроксимированы эллипсоидом вида  D= z (z − d) T Q ( z − d )  1, Q = diag ( Qi )  0,  Qi = ( zi+ − zi− ) 2  , d = ( zi+ + zi− ) 2 . 12 (7) Для аналитического решения задачи (5) с учетом замен переменных типа (6) и (7) используется замена переменных z − d = Q −1 2 x, x = Q1 2 ( z − d ) , (8) которая преобразует эллипсоид в шар евклидова пространства (z − d) T Q ( z − d ) = ( z − d ) Q1 2Q1 2 ( z − d ) = xT x  r 2 . T (9) Это определяет вспомогательные задачи минимизации и максимизации, решения которых определяют граничные экстремальные векторы Лагранжа  = arg max  ( x ) = C Q  x = b = b − A d , x x = r . (10.б) x = arg min  ( x ) = C0T Q −1 2 x + c0d A0Q −1 2 x = b = b0 − A0d , xT x = r 2 , (10.а) x T −1 2 x + c0 d A0Q −1 2 T 2 Задачи (10.а) и (10.б) можно решить на основе метода проекции градиента и необходимых и достаточных условий теоремы Куна-Таккера о седловой точке функции Лагранжа, в которой достигается минимум по основным переменным и максимум по двойственным переменным, т.е. по множителям Лагранжа. Далее синтезированы операторы оптимизации на основе необходимых условий Лагранжа и принципов «экстремальных граничных векторов», «сужения допустимой области» и «одномерной оптимизации» [4, 5]. 2. Метод вычисления управлений на основе проекционных операторов минимизации линейных функционалов. Для решения применены «классические необходимые условия Лагранжа» для задач (5). В результате определена аналитическая структура проекционных операторов при ограничениях в виде пересечения линейного многообразия и шара, включающего «граничные экстремальные элементы» как решения классических задач математического программирования. Граничные экстремальные элементы Ж. Лагранжа использованы для задания выпуклого «однопараметрического сужения допустимого множества» в виде пересечения линейного многообразия и сферы, что позволяет обобщить метод Лагранжа для неклассических задач условной минимизации функционалов или для задания допустимых решений. Таким образом, проекционный оператор решения задачи оптимизации отображает параметры функционала и ограничений в оптимальное решение. Свойства ортогональных проекторов на многообразия и подпространства конечномерных пространств заданы в утверждении [4, 5]. Утверждение. Пусть выполнены условия: Невырожденные задачи условной оптимизации для линейных 1. функционалов типа определены в (1.б), (1.в). Тогда для оптимальности решений этих задач необходимо и достаточно выполнение условий:  1). x = arg min  ( x ) = C T x, С  0n Ax = b, A  mn  , rang A = m, xT x = r 2 = = P +b − P 0C ( 2  ) = P +b − 0,5P 0C ( −1 ) = x (   ) , 12  2). x = arg max  ( x ) = C T x, С  0n Ax = b, A  mn (11.а)  , rang A = m, xT x = r 2 = = x (   ) = P +b + P 0C ( 2  ) = P +b + 0,5P 0C ( −1 ) . 12 (11.б) 3). В равенствах (11.а) и (11.б) использованы обозначения: P 0 = En − P + A  nn , P0 P0 P0 −1 2 , P + = AT ( AAT )  −1 nm , −1 rang AT c = m + 1,  = 4 bT ( AAT ) b − r 2  .   4). Оптимальные множители Лагранжа в (11.а) и (11.б), равные  = + (   ) 12 ,  = − (   ) 12  , являются решениями квадратного уравнения 2  2 +  = 0,  = С T P 0С = P 0С 2 . 5). Ограничения задач (11.а), (11.б) совместны, если:   0. Таким образом, цифровые математические модели могут использоваться для синтеза управляющих стратегий при управлении одно- и много продуктовыми системами. Ограничения типа равенств и неравенств можно использовать как программируемую математическую среду для задания моделей объекта и различных тактик рыночных стратегий, используемых при производстве продукции. Достаточные условия устойчивости могут быть получены на основе методов, изложенных в [4, 5], которые разработаны для задач управления с линейными или квадратичными функционалами. Литература 1. Первозванский А.А. Математические модели в управлении производством. М.: Наука. 1995.- 450 с. 2. Месарович М., Такахара С., Мако Д. Теория многоуровневых иерархических систем управления. М.: Наука. 1973. 3. Robert F. Stengel. Optimal control and estimations. Dover Publications. INC. Nev York. 1994. 4. Козлов В.Н. Проекционный метод синтеза ограниченных оптимальных управлений динамических систем энергетики. СПб.: Изд-во Санкт-Петербургского Политехн. ун-та Петра Великого «ПОЛИТЕХ ПРЕСС». СПб. 2019. – 160 с. 5. Козлов В.Н. Негладкие системы, операторы оптимизации и устойчивость энергообъединений. СПб.: Изд-во Политехн. ун-та. 2012.-170 с. 6. Козлов В.Н., Куприянов. Вычислительные методы синтеза систем автоматического управления. Изд-во Ленинградского университета им. А.А. Жданова. Л.: 1989 г. – 220 с. ПРИЛОЖЕНИЯ: практические занятия по элементам синтеза систем управления движением ПРАКТИЧЕСКОЕ ЗАНЯТИЕ По дисциплине «ИССЛЕДОВАНИЕ ОПЕРАЦИЙ» 06.05.2020 16-00 – 17-40 ТЕМА: программирование маршрутов движения беспилотных автомобилей на прямой и плоскости ПРОГРАММИРОВАНИЕ МАРШРУТОВ ВОЗМОЖНО РАЗЛИЧНЫМИ СПОСОБАМИ. На занятии рассматривается один из вариантов решения задачи без учета ограничений на координаты и управления. В этом случае для синтеза управлений далее используется наиболее простой проектор, изученный на лекциях. Ограничения могут быть заданы дополнительными «условиями различия положений», например, дополнив исходную модель (1) «дополнительными условиями, например, заданным расстоянием между автомобилями, причем это требование должно быть введено в ограничения задачи оптимизации управлений. Эти условия могут быть реализованы математическим программированием «сдвигов по положению», предусмотрев их путем корректировки программного движения по продольным и боковым положениям АМ. Для этого можно математически программировать «СДВИГИ ПОЛОЖЕНИЙ АМ». Метод решения задачи синтеза систем программной стабилизации для отдельного АМ. Этот метод рассмотрен далее по шагам. Шаг 0: для описания движения группы АМ можно сформировать расширенную матрицу операции, в которой будут на диагоналях матриц представлены модели (уравнения) всех автомобилей, которые не связаны между собой с учетом того, что матрицы H и F будут расположены на диагонали. Итак, матрицы H и F – для различных АМ будут расположены на диагонали общей матрицы моделей, т.е. Аx 1    u1k +1 + u1   H1 x1k   H1     xk +1   − F1         H     xk2+1  +   − F2    uk2+1 + u 2  =  H 2 x1k  bk . (1) 2     3      H 3   xk +1     − F3  uk3+1 + u 3   H 3 x1k  В уравнения (1) введены управляющие воздействия, обеспечивающие движение, т.е. возможность изменения координат всех автомобилей за счет воздействия управлений на АМ. Функционал задачи может иметь стандартный вид квадрата нормы евклидова пространства  = xk +1 − Ck 2 , 2 (2) Будем решать задачу на основе поэтапного усложнения. Для этого начнем с простых задач, усложняющихся постепенно по шагам. Шаг 1: разделение модели группы АМ на модели отдельных АМ. Тогда группа автомобилей будет описана, например, по продольной оси X отдельными уравнениями состояния. Другими словами, модель (1) на первом этапе можно разделить на несколько частей. После разделения моделей динамика « i-го» автомобиля будет описана, например, по продольной оси X одномерными уравнениями «вход-состояния» i xki +1 = H i xki + Fu , i = 1,2,3,...,q. i k  i где подвекторы состояний xk +1 имеют единичный размер для простоты. В случае необходимости можно использовать модель «вход-состояниевыход» i 2 , у = сi Н i , i = 1,2,3,...,q. . xki +1 = H i xki + Fu i k  Шаг 2. Тогда в одномерном пространстве можно привести простой пример модели (без матриц, вместо которых имеются числа) вида xki +1 = 0,5 xki + 2uki , i = 1,2,3,...,q. Шаг 3. Рассмотрим пример модели АМ в двумерном пространстве  0,1 0,2 i 0  i 2 xki +1 =  x + 2 u  R , i = 1,2,3,...,q, k k    0,4 0, 3 1  где вектор xki =  x1k прод Т xk2поперечное   2 − двумерный . Поэтому можно рассматривать эту модель как содержащую две координаты состояния, описывающие движение АМ по продольной оси, т.е. «ВПЕРЕД ИЛИ НАЗАД», а также динамику бокового движения АМ, т.е. «НАЛЕВО ИЛИ НАПРАВО». Шаг 4: в общем случае модель состояний АМ как объекта системы управления может быть описано разностным уравнением xki +1 = H i xki + Fiuki , x0i = x0i , uki = u0i + kh u0i + Ck . i где векторы состояний xk +1 имеют конечный размер. Шаг 5: поскольку в модели, данной выше, определены все компоненты вектора оптимальных управлений, а также квадратичный функционал типа «евклидовой нормы», то можно вычислить вектор управления с помощью известного из лекций проекционного оператора оптимизации ( ) u *k = Т u P +bk + (1 − 2 *k ) P 0Ckk , Параметры оптимального оператора заданы равенствами   = p (0 ) = 0,5 ( 0 − 0 − 1 + 1)  0, 1, (2) 0 = 0,5 (1 −  −1 ) ,  =  −1 = (  ) , 12  = CT P 0C  0,  = r 2 − bT ( AAT ) b −1 Шаг 6: на первом этапе для простоты синтеза с учетом отсутствия ограничений-неравенств на координаты и управления можно использовать более простой проектор (также см. лекции), который имеет вид x  y *k = P +bk + P 0Ck , y *k  k +1  ,  uk  (2) где P + = АT ( AAT ) , P 0 = En − P + A, −1 а линейное многообразие Аy = bk определяет модель АМ в эквивалентной форме , что показано равенствами  xk +1   = Hxk u  k  Аy = ( En − F )   bk  объект xk +1 = H устойчива xk + Fuk , uk = kxk  система упр − я : xk +1 = Hxk + Fkxk = ( H + Fk ) xk . Эти уравнения модели в двух формах позволяют вычислить проекционные локально оптимальные управления поболее простым формулам . В результате «вектор или скаляр управления» требуется выделить из «составного вектора», что показано соотношениями x  y *k  k +1  ,  uk  Шаг 7: поскольку uk = Т u y *k = ( 0n x  Em )   k +1  = uk .  uk  ЗАДАВАЯ РАЗЛИЧНЫЕ ВЕКТОРЫ УПРАВЛЕНИЯ Ck , МОЖНО ФОРМИРОВАТЬ РАЗЛИЧНЫЕ НАПРАВЛЕНИЯ ДВИЖЕНИЯ И ВЕЛИЧИНЫ ПЕРЕМЕЩЕНИЯ АВТОМОБИЛЯ ПО ОДНОЙ КООРДИНАТЕ, УВЕЛИЧИВАЯ ИЛИ УМЕНЬШАЯ Ck , ЧТОБЫ l =k Ck = C1 + C2 + ... + Ck =  Cl , где Cl =  Cl . или Ck = R sin ( + k ) . l =0 НАПРИМЕР, ЗАДАНИЯ ВЕКТОРОМ Cl могут соответствовать движению «Вперед» или «назад» (по знаку ПРОДОЛЬНОЙ ИЛИ БОКОВОЙ КООРДИНАТАМ. приращения) ПО Для организации движения НА ПЛОСКОСТИ требуется ввести две координаты, движение по которым организуется аналогично. Можно далее увеличивать количество координат до трех, вводить ограничения и формировать требуемые траектории движения с помощью синтезированных управлений с учетом или без учета ограничений-неравенств. Таким образом, модель (1) на первом этапе разделена на несколько моделей. Тогда группа автомобилей будет описана, НАПРИМЕР, по продольной оси X уравнениями состояния i xki +1 = H i xki + Fu i k, с учетом начального положения и задания по программных управлений для движений, которые могут иметь вид x0i = x0i , uki = u0i + kh u0i + Ck . В этой модели мы ввели программное движение Ck , поэтому управление имеет вид uki = u0i + Ck , в силу которого автомобиль будет иметь изменяющуюся координату по оси Х, что соответствует движению по этой оси. Вариант 1 организации движения АМ по единому координирующему сигналу. Программное движение ведущего автомобиля (АМ) можно задать вектором С для случая плоского перемещения автомобилей. Далее можно координировать движение ведомых АМ путем передачи этого вектора всем или части ведомых АМ. Тогда задача управления будет состоять в обеспечении движения всех АМ по заданному маршруту с сохранением дистанций между ними. На первом этапе можно решить задачу движения одиночного автомобиля по прямой вдоль оси X. Тогда модель движения примет вид Вариант 2 организации движения группы БПАМ по траектории предыдущего автомобиля. Другими словами, этот вариант стабилизации АМ на основе применения в качестве программного вектора С в алгоритме траекторий предыдущих автомобилей. Эти две простые задачи могут иметь решение на основе проекционного оператора. При этом возникает вопрос: каким образом выполнить программирование движений и обеспечить движения всех участников свойством устойчивости. Последнее свойство требует применения такого метода и алгоритма, которые гарантируют устойчивость программных движений. Анализ проекционного метода и алгоритма показывает, что для описания программного и относительного движений можно использовать линейное многообразие, в которое можно «погружать» математические модели участников – АМ. Замечание. Сформулировав принцип программирования динамики с помощью матрицы А, размеры которой по строкам и столбцам могут быть выбраны достаточно большими в соответствии с требованиями задач управления. Тогда в эту матрицу можно «погрузить» модели динамики различных объектов, в том числе и модели всех АМ. Индивидуальные задания для студентов: синтезировать управления ДЛЯ ДВИЖЕНИЯ АМ «ВПЕРЕД» И «НАЗАД» ОТНОСИТЕЛЬНО НАЧАЛЬНОГО СОСТОЯНИЯ ДЛЯ РАЗНОСТНОГО УРАВНЕНИЯ ДИНАМИКИ В СООТВЕТСТИИ С ПРИВЕДЕННЫМ АЛГОРИТМОМ И построить ГРАФИК ДВИЖЕНИЯ ПО ОДНОЙ КООРДИНАТЕ. ВСЕ ПАРАМЕТРЫ АМ МОЖНО СВЯЗАТЬ С НОМЕРОМ СТУДЕНТА ПО ГРУППОВОМУ ЖУРНАЛУ. Объект должен быть устойчивым. Рекомендации приведены далее. Методические рекомендации к расчетному заданию Определение. Объект управления − неизменяемая часть САУ xki +1, прогноз = H i xki ,текущее + Fiuki ,синтези − состояние , где руемое воздейстие на объект xk 0 = x 0 − начальное состояние− задается, где H i , Fi − неизменяемые параметры. Если надо изменить xki +1 , то это можно сделать через управление и нет другого способа. Тогда в САУ управление должно зависетьот x, например, с помощью закона управления :    cxk − линейная обр. связь   Т u arg min ... = Т u z *k =  uk =  ( xk ) =   +   xk +1  = Т P b + P C , y , Т = E      u k k m *k  u  u   k      + T T −1 T T −1 +  P = А ( АА ) , P = Е − А ( АА ) А = Е − P А −  проектор на линейное многообразие Аx = b  В сложных задачах, когда нельзя изменять объект, синтезируются сложные управления. Проблема управления − синтез требуемых законов управления. . Модель объекта в виде разностных операторов «ПОГРУЖАЕТСЯ» в линейное многообразие задачи оптимизации. Мы можем ТАКЖЕ задать в этом многообразии требования к движению двух автомобилей для обеспечения «нестолкновений». Другими словами – в этом же многообразии мы можем задать «требования к дистанции между АМ по продольному и боковому движению в соответствующих уравнениях». Другими словами – мы должны математически (а не на языках программирования) запрограммировать такое движение, чтобы центры или границы автомобилей отличались на постоянный сдвиг. Как это сделать? – Ответ: если наш АМ имеет координату xk , а чужой АМ – координату xk , то условие «нестолкновения» (дистанции) будет иметь вид xk +1 − xk +1 =  xk +1. Для выполнения условия «дистанции» требуется в этой формуле иметь вектор xk +1 = Hxk + Fuk . Тогда для «нестолкновения» надо объединить эти уравнения. Тогда новое мноообразие будет иметь вид E Аzk = En − F  n  Еn ( ) x  − F 0   k +1   Hxk   u =  0 − Еn   k    xkзад +1   xk +1 bk   объект xk +1 = H устойчива xk + Fuk , uk = kxk . Вывод: для обеспечения «дистанции» можно использовать математическое программирование для прогнозирования положений автомобилей на один и более шагов на основе их моделей движения. ЗАДАЧА: сформулировать ограничения задачи математического программирования по «безопасному движению» и соответствующую задачу оптимизации для ее решения проекционным квазианалитическим методом. Разностные операторы объектов-АМ должны быть устойчивыми. РЕШЕНИЕ ЗАДАЧИ О КООРДИНИРОВАННОМ УПРАВЛЕНИИ ОПЕРАЦИЕЙ ДВИЖЕНИЯ ОБЪЕКТОВ С ДИСТАНЦИЯМИ ИСХОДНЫЕ ДАННЫЕ: пусть скорости автомобилей описываются уравнениями для «состояний и выходов» так, что исходные данные имеют следующий вид: Скорость АМ − 1 : s1k +1 = H1s1k + F1u1k , Путь АМ − 1: p1k = p1k −1 + s1k k . Начальная скорость s01 = s10 . Скорость АМ − 2 : sk2+1 = H1sk2 + F1uk2 , Начальная скорость s02 = s 20 . Начальный путь p01 = p10 . Путь АМ − 1: pk2 = pk2−1 + sk2 k . Начальный путь p02 = p 20 . ТРЕБУЕТСЯ.Вычислить координаты встречи АМ с заданной дистанцией p1k − pk2 = D12 = D. Скорость АМ − 1 : s1k +1 = H1s1k + F1u1k , Путь АМ − 1: p1k = p1k −1 + s1k k . Начальная скорость s01 = s10 . Начальный путь p01 = p10 . Скорость АМ − 2 : sk2+1 = H1sk2 + F1uk2 , Путь АМ − 1: pk2 = pk2−1 + sk2 k . Начальная скорость s02 = s 20 . Начальный путь p02 = p 20 . ТРЕБУЕТСЯ.Вычислить координаты встречи АМ с заданной дистанцией p1k − pk2 = D12 = D. РЕШЕНИЕ ЗАДАЧИ : Шаг 1: s1k +1 = H1s1k + F1u1k ,скорость sk2+1 = H1sk2 + F1uk2 , скорость p1k = p1k −1 + s1k k , путь pk2 = pk2−1 + sk2 k , путь Шаг 2 :дистанция p1k − pk2 = D. Шаг 3:выбрать управления, обеспечивающие минимм функционала суммарной стоимости :  k =0 C1 p1k + C2 pk2 . k ЛИТЕРАТУРА 1. Козлов В.Н. Метод нелинейных операторов в автоматизированном проектировании динамических систем. Л.: Изд-во Ленингр. гос. ун-та им. А. А. Жданова, 1986. – 166 с. 2. Kozlov V.N. The Metod of Minimization of Linear Functionals Based on th Compakt Sets. Proceedings of the 12 international workshop on computer science and information technologies (CSIT 2010), Russia, Moskov-SaintPetersburg, Russia, 2010. Volume 2. pp. 157–159. 3. Козлов В.Н. Негладкие системы, операторы оптимизации и устойчивость энергообъединений. Изд-во Санкт-Петербургского политехнического университета. СПб.: 2012. 177 с. 4. Козлов В.Н. Проекционный метод оптимизации оптимальных ограниченных управлений динамических систем. СПб.: Изд-во СанктПетербургского Политехн. ун-та. 2019.–190 с. 5. Козлов В.Н., Ефремов А.А. Введение в функциональный анализ. Издательско-полиграфическая ассоциация вузов. СПб.: 2018. – 79 с. ПРАКТИКА 8 ПО КУРСУ «ИССЛЕДОВАНИЕ ОПЕРАЦИЙ» 20.05.2020. Тема: программирование маршрутов движения беспилотных автомобилей на основе разностных уравнений динамики группы и операторов конечномерной оптимизации. Шаг 1: постановка задачи: имеется система управления тремя управляемыми АМ, динамика движения которой описана разностными нелинейными операторами управления (синий цвет) xk +1 = H  x ( xk ) + F u uk  ( xk ) = = H  x ( xk ) +  F u Tu z ( xk ) =   = H  x ( xk ) +  F u  P + H  ( xk ) + 1 − 2 ( xk )  P 0C  −1 2  1 2 ( xk )  . определяющими динамику системы с обратной связь по координатам состояния xk , что существенно сокращает проблемы анализа устойчивости. В связи с этим далее будет использовано «погружение» задачи синтеза управлений в задачу линейного программирования с вектором стоимости проезда в виде С = Сk − вектор-функция времени, а стоимость проезда равна С = nСk , n − длина пути. Шаг 2: математическая формулировки задачи о безопасном движении. Далее для формулировки задачи движения без столкновений требуется задать программу движения. Для этого воспользуемся «программируемой средой» в виде линейного многообразия Ax = b, A  Е 0   Е Е −Е −F −F 2 mn , rang A = m : ( )   x ( ) ,  x  x1k +1   H  x x1k   2      x k +1  =  H  x 2 x k   u1   k   2   2  u k  1 2     = x10   = x 20  ,   .   ( x ) = C T x, С  0n → min. Таким образом, заданы требования к динамике объектов и условия «безопасного относительного движения». Шаг 3: вычислить траектории безопасного движения на заданном интервале k   0, 4, при условии устойчивости матриц Н вида H  1, , используя результаты утверждения. Утверждение. Пусть выполнены условия: 1. Невырожденные задачи условной оптимизации для линейных функционалов типа определены в (1.б), (1.в). Тогда для оптимальности решений этих задач необходимо и достаточно выполнение условий:  1). x = arg min  ( x ) = C T x, С  0n Ax = b, A  mn  , rang A = m, xT x = r 2 = = P +b − P 0C ( 2  ) = P +b − 0,5P 0C ( −1 ) = x (   ) , 12  2). x = arg max  ( x ) = C T x, С  0n Ax = b, A  mn (11.а)  , rang A = m, xT x = r 2 = = x (   ) = P +b + P 0C ( 2  ) = P +b + 0,5P 0C ( −1 ) . 12 (11.б) 3). В равенствах (11.а) и (11.б) использованы обозначения: P 0 = En − P + A  nn , P0 P0 P0 −1 2 , P + = AT ( AAT )  −1 nm , −1 rang AT c = m + 1,  = 4 bT ( AAT ) b − r 2  .   4). Оптимальные множители Лагранжа в (11.а) и (11.б), равные  = + (   ) ,  = − (   ) 12 12  , являются решениями квадратного уравнения 2  2 +  = 0,  = С T P 0С = P 0С 2 . 5). Ограничения задач (11.а), (11.б) совместны, если:   0. ПРИЛОЖЕНИЕ. АЛГОРИТМ СИНТЕЗА ПРОСТЕЙШИХ ДВИЖЕНИЙ АВТОМОБИЛЯ: ПРАКТИЧЕСКОЕ ЗАНЯТИЕ По дисциплине «ИССЛЕДОВАНИЕ ОПЕРАЦИЙ» 06.05.2020 16-00 – 17-40 ПРОФ. В.Н.КОЗЛОВ ТЕМА: программирование маршрутов движения беспилотных автомобилей на прямой и плоскости ПРОГРАММИРОВАНИЕ МАРШРУТОВ ВОЗМОЖНО РАЗЛИЧНЫМИ СПОСОБАМИ. На занятии рассматривается один из вариантов решения задачи без учета ограничений на координаты и управления. В этом случае для синтеза управлений далее используется наиболее простой проектор, изученный на лекциях. Ограничения могут быть заданы дополнительными «условиями различия положений», например, дополнив исходную модель (1) «дополнительными условиями, например, заданным расстоянием между автомобилями, причем это требование должно быть записана в ограничениях задачи оптимизации управлений. Эти условия могут быть реализованы математическим программированием «сдвигов по положению», предусмотрев их путем корректировки программного движения по продольным и боковым положениям АМ. Для этого можно математически программировать «СДВИГИ ПОЛОЖЕНИЙ АМ». Метод решения задачи синтеза систем программной стабилизации для отдельного АМ. Этот метод рассмотрен далее по шагам. Шаг 0: для описания движения группы АМ можно сформировать расширенную матрицу операции, в которой будут на диагоналях матриц представлены модели (уравнения) всех автомобилей, которые не связаны между собой с учетом того, что матрицы H и F будут расположены на диагонали. Итак, матрицы H и F – для различных АМ будут расположены на диагонали общей матрицы моделей, т.е. 1    u1k +1 + u1   H1 x1k   H1     xk +1   − F1        Аx   H 2     xk2+1  +   − F2    uk2+1 + u 2  =  H 2 x1k  bk . (1)        H 3   xk3+1     − F3  uk3+1 + u 3   H 3 x1k  В уравнения (1) введены управляющие воздействия, обеспечивающие движение, т.е. возможность изменения координат всех автомобилей за счет воздействия управлений на АМ. Функционал задачи может иметь стандартный вид квадрата нормы евклидова пространства  = xk +1 − Ck 2 , 2 (2) Будем решать задачу на основе поэтапного усложнения. Для этого начнем с простых задач, усложняющихся постепенно по шагам. Шаг 1: разделение модели группы АМ на модели отдельных АМ. Тогда группа автомобилей будет описана, например, по продольной оси X отдельными уравнениями состояния. Другими словами, модель (1) на первом этапе можно разделить на несколько частей. После разделения моделей динамика « i-го» автомобиля будет описана, например, по продольной оси X одномерными уравнениями «вход-состояния» i xki +1 = H i xki + Fu i k  , i = 1,2,3,...,q. i где подвекторы состояний xk +1 имеют единичный размер для простоты. В случае необходимости можно использовать модель «вход-состояние-выход» i 2 , у = сi Н i , i = 1,2,3,...,q. . xki +1 = H i xki + Fu i k Шаг 2. Тогда в одномерном пространстве можно привести простой пример модели (без матриц, вместо которых имеются числа) вида xki +1 = 0,5 xki + 2uki , i = 1,2,3,...,q. Шаг 3. Рассмотрим пример модели АМ в двумерном пространстве i k +1 x  0,1 0,2 i 0  i = xk + 2   uk  R 2 , i = 1,2,3,...,q,  0,4 0, 3 1  где вектор xki =  x1k прод Т xk2поперечное   2 − двумерный . Поэтому можно рассматривать эту модель как содержащую две координаты состояния, описывающие движение АМ по продольной оси, т.е. «ВПЕРЕД ИЛИ НАЗАД», а также динамику бокового движения АМ, т.е. «НАЛЕВО ИЛИ НАПРАВО». Шаг 4: в общем случае модель состояний АМ как объекта системы управления может быть описано разностным уравнением xki +1 = H i xki + Fiuki , x0i = x0i , uki = u0i + kh u0i + Ck . i где подвекторы состояний xk +1 имеют конечный размер. Шаг 5: поскольку в модели, данной выше, определены все компоненты вектора оптимальных управлений, а также квадратичный функционал типа «евклидовой нормы», то можно вычислить вектор управления с помощью известного из лекций проекционного оператора оптимизации общего вида ( ) u *k = Т u P +bk + (1 − 2 *k ) P 0Ckk , (2) Параметры оптимального оператора заданы равенствами   = p (0 ) = 0,5 ( 0 − 0 − 1 + 1)  0, 1, 0 = 0,5 (1 −  −1 ) ,  =  −1 = (  ) , 12  = CT P 0C  0,  = r 2 − bT ( AAT ) b −1 Шаг 6: на первом этапе для простоты синтеза с учетом отсутствия ограничений-неравенств на координаты и управления можно использовать более простой проектор (также см. лекции), который имеет вид x  y *k = P +bk + P 0Ck , y *k  k +1  ,  uk  (2) где P + = АT ( AAT ) , P 0 = En − P + A, −1 а линейное многообразие Аy = bk определяет модель АМ в эквивалентной форме , что показано равенствами  xk +1   = Hxk u  k  Аy = ( En − F )   bk  объект xk +1 = H устойчива xk + Fuk , uk = kxk  система упр − я : xk +1 = Hxk + Fkxk = ( H + Fk ) xk . Эти уравнения модели в двух формах позволяют вычислить проекционные локально оптимальные управления поболее простым формулам . В результате «вектор или скаляр управления» требуется выделить из «составного вектора», что показано соотношениями x  y *k  k +1  ,  uk  Шаг 7: поскольку uk = Т u y *k = ( 0n x  Em )   k +1  = uk .  uk  ЗАДАВАЯ РАЗЛИЧНЫЕ ВЕКТОРЫ УПРАВЛЕНИЯ Ck , МОЖНО ФОРМИРОВАТЬ РАЗЛИЧНЫЕ НАПРАВЛЕНИЯ ДВИЖЕНИЯ И ВЕЛИЧИНЫ ПЕРЕМЕЩЕНИЯ АВТОМОБИЛЯ ПО ОДНОЙ КООРДИНАТЕ, УВЕЛИЧИВАЯ ИЛИ УМЕНЬШАЯ Ck , ЧТОБЫ l =k Ck = C1 + C2 + ... + Ck =  Cl , где Cl =  Cl . или Ck = R sin ( + k ) . l =0 НАПРИМЕР, ЗАДАНИЯ ВЕКТОРОМ Cl могут соответствовать движению «Вперед» или «назад» (по знаку приращения) ПО ПРОДОЛЬНОЙ ИЛИ БОКОВОЙ КООРДИНАТАМ. Для организации движения НА ПЛОСКОСТИ требуется ввести две координаты, движение по которым организуется аналогично. Можно далее увеличивать количество координат до трех, вводить ограничения и формировать требуемые траектории движения с помощью синтезированных управлений с учетом или без учета ограничений-неравенств. Таким образом, модель (1) на первом этапе разделена на несколько моделей. Тогда группа автомобилей будет описана, НАПРИМЕР, по продольной оси X уравнениями состояния i xki +1 = H i xki + Fu i k, с учетом начального положения и задания по программных управлений для движений, которые могут иметь вид x0i = x0i , uki = u0i + kh u0i + Ck . В этой модели мы ввели программное движение Ck , поэтому управление имеет вид uki = u0i + Ck , в силу которого автомобиль будет иметь изменяющуюся координату по оси Х, что соответствует движению по этой оси. Вариант 1 организации движения АМ по единому координирующему сигналу. Программное движение ведущего автомобиля (АМ) можно задать вектором С для случая плоского перемещения автомобилей. Далее можно координировать движение ведомых АМ путем передачи этого вектора всем или части ведомых АМ. Тогда задача управления будет состоять в обеспечении движения всех АМ по заданному маршруту с сохранением дистанций между ними. На первом этапе можно решить задачу движения одиночного автомобиля по прямой вдоль оси X. Тогда модель движения примет вид Вариант 2 организации движения группы БПАМ по траектории предыдущего автомобиля. Другими словами, этот вариант стабилизации АМ на основе применения в качестве программного вектора С в алгоритме траекторий предыдущих автомобилей. Эти две простые задачи могут иметь решение на основе проекционного оператора. При этом возникает вопрос: каким образом выполнить программирование движений и обеспечить движения всех участников свойством устойчивости. Последнее свойство требует применения такого метода и алгоритма, которые гарантируют устойчивость программных движений. Анализ проекционного метода и алгоритма показывает, что для описания программного и относительного движений можно использовать линейное многообразие, в которое можно «погружать» математические модели участников – АМ. Замечание. Сформулировав принцип программирования динамики с помощью матрицы А, размеры которой по строкам и столбцам могут быть выбраны достаточно большими в соответствии с требованиями задач управления. Тогда в эту матрицу можно «погрузить» модели динамики различных объектов, в том числе и модели всех АМ. Индивидуальные задания для студентов: синтезировать управления ДЛЯ ДВИЖЕНИЯ АМ «ВПЕРЕД» И «НАЗАД» ОТНОСИТЕЛЬНО НАЧАЛЬНОГО СОСТОЯНИЯ НА ОСНОВЕ РАЗНОСТНОГО УРАВНЕНИЯ ДИНАМИКИ В СООТВЕТСТИИ С ПРИВЕДЕННЫМ АЛГОРИТМОМ И ПОСТРОИТЬ ГРАФИК ДВИЖЕНИЯ ПО ОДНОЙ ИЛИ ДВУМ КООРДИНАТАМ. ВСЕ ПАРАМЕТРЫ АМ МОЖНО СВЯЗАТЬ С НОМЕРОМ СТУДЕНТА ПО ГРУППОВОМУ ЖУРНАЛУ. Объект должен быть устойчивым. Определение. Объект управления − неизменяемая часть САУ xki +1, прогноз = H i xki ,текущее + Fiuki ,синтези − состояние , руемое воздейстие на объект где xk 0 = x 0 − начальное состояние− задается, H i , Fi − неизменяемые параметры объекта управления. Если надо изменить xki +1 , то это требование выполнить, выбрав управление, и нет другого способа. Тогда в САУ движением объектов управление должно зависетьот x, например, с помощью закона управления, который синтезируется следующим образом : Определение. Объект управления − неизменяемая часть САУ xki +1, прогноз = H i xki ,текущее + Fiuki ,синтези − состояние , руемое воздейстие на объект где xk 0 = x 0 − начальное состояние− задается, H i , Fi − неизменяемые параметры объекта управления. Если надо изменить xki +1 , то это требование выполнить, выбрав управление, и нет другого способа. Тогда в САУ движением объектов управление должно зависетьот x, например, с помощью закона    cxk − линейная обр. связь   Т u arg min ... = Т u z *k =  uk =  ( xk ) =   +   xk +1  = Т P b + P C , y , Т = E  u k k m  *k  u  u    k       + T T −1 T T −1 +  P = А ( АА ) , P = Е − А ( АА ) А = Е − P А −  проектор на линейное многообразие Аx = b  В сложных задачах, когда нельзя изменять объект, синтезируются сложные управления. Проблема управления − синтез требуемых законов управления. . Задавая модель объекта в линейном многообразии, мы можем задать в этом многообразии требования к движению двух автомобилей для обеспечения «нестолкновений». Однако в этом же многообразии мы можем задать «требования нестолкновения». Другими словами – мы должны математически (а не на языках программирования) запрограммировать такое движение, чтобы центры автомобилей отличались на постоянный сдвиг-различие в положении двух АМ. Как это сделать? – Ответ: если наш АМ имеет координату xk , а чужой АМ – координату xk , то условие «нестолкновения» (отстояния) будет иметь вид xk +1 − xk +1 =  xk +1. Для выполнения «условий по дистанции» между АМ требуется в этой формуле иметь вектор xk +1 = Hxk + Fuk . Тогда для выполнения «условий по дистанции» («нестолкновения») надо объединить эти уравнения. Тогда новое многообразие будет иметь вид E Аzk = En − F  n  Еn ( ) x  − F 0   k +1   Hxk   u =  0 − Еn   k    xkзад +1   xk +1 bk  ()  объект xk +1 = H устойчива xk + Fuk , uk = kxk . Вывод: для обеспечения «условий по дистанции» («нестолкновения») можно использовать математическое программирование для положений автомобилей, используя прогнозирующие модели в виде разностных операторов динамики АМ, погруженные вместе с требованиями «по дистанции» в линейное многообразие (  ) задачи оптимизации с учетом ограничений. Домашнее задание: сформулировать ограничения задачи математического программирования «о безопасности движения» и соответствующую задачу для ее решения проекционным квазианалитическим методом. Объекты-АМ должны быть устойчивыми, т.е. H  1. Литература: 1. В.Н. Козлов «Проекционный метод синтеза ограниченных оптимальных управлений динамических систем энергетики». Изд-во Санкт-Петербургского Политехн. ун-та. СПб.: 2019.- 190 с. 2. Козлов В.Н. Негладкие системы, операторы оптимизации и устойчивость энергообъединений. Изд-во Санкт-Петербургского Политехн. ун-та. СПб.: 2019.- 160 с. 3. Козлов В.Н., Куприянов В.Е. Вычислительные методы синтеза САУ. Изд-во Ленингр. ун-та им. А.А. Жданова. Л.: 1989.190 с. 3. Козлов В.Н., Куприянов В.Е., Шашихин В.Н. Теория автоматического управления. Изд-во СПбПУ. Сб.: 2007. 170 с. 4. КОЗЛОВ В.Н., ЕФРЕМОВ А.А. ВВЕДЕНИЕ В ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ. СП. ИЗД-ВО СПБПУ.2018.-80 С. Литература: 1. В.Н. Козлов «Проекционный метод синтеза ограниченных оптимальных управлений динамических систем энергетики». Изд-во Санкт-Петербургского Политехн. ун-та. СПб.: 2019.190 с. 2. Козлов В.Н. Негладкие системы, операторы оптимизации и устойчивость энергообъединений. Изд-во Санкт-Петербургского Политехн. ун-та. СПб.: 2019.- 160 с. 3. Козлов В.Н., Куприянов В.Е. Вычислительные методы синтеза САУ. Изд-во Ленингр. ун-та им. А.А. Жданова. Л.: 1989.190 с. 4. Козлов В.Н., Куприянов В.Е., Шашихин В.Н. Теория автоматического управления. Изд-во СПбПУ. Сб.: 2007. 170 с. Литература 2. Первозванский А.А. Математические производством. М.: Наука. 1995.- 450 с. модели в управлении 3. Месарович М., Такахара С., Мако Д. Теория многоуровневых иерархических систем управления. М.: Наука. 1973. 4. Robert F. Stengel. Optimal control and estimations. Dover Publications. INC. Nev York. 1994. 5. Козлов В.Н. Проекционный метод синтеза ограниченных оптимальных управлений динамических систем энергетики. СПб.: Изд-во СанктПетербургского Политехн. ун-та Петра Великого «ПОЛИТЕХ ПРЕСС». СПб. 2019. – 160 с. 6. Козлов В.Н. Негладкие системы, операторы оптимизации и устойчивость энергообъединений. СПб.: Изд-во Политехн. ун-та. 2012.170 с. 5. КОЗЛОВ В.Н., ЕФРЕМОВ А.А. ВВЕДЕНИЕ В ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ. СП. ИЗД-ВО СПБПУ.2018.-80 С.

Авторы лекции