Структурные преобразования с помощью пакета MATLAB

👀 809 просмотров
📌 761 загрузка

Выбери формат для чтения

Конспект лекции по дисциплине «Структурные преобразования с помощью пакета MATLAB», pdf

Загружаем конспект в формате pdf

Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇

Конспект лекции по дисциплине «Структурные преобразования с помощью пакета MATLAB», Word формат

Лекция. 19 марта_Б. 3.4. Структурные преобразования с помощью пакета MATLAB В пакете MATLAB имеется ряд функций, с помощью которых можно выполнять структурные преобразования: – series(w1,w2) – последовательное соединение динамических звеньев; – parallel(w1,w2) – параллельное соединение динамических звеньев; – feedback(w1, w2) – включение звена w2 в контур отрицательной обратной связи к w1; – feedback(w1,w2,sign) – включение звена w2 в контур обратной связи звена w1 с указанием знака «+» или «-» (очевидно, feedback(w1,w2) = =feedback(w1,w2,-l)); Пример: »w=tf([1 2],[1 2 2]) Transfer function: s+2 -----------------s^2 + 2 s + 2 » w1=tf([1 2 3],[1 2 2]) Transfer function: s^2 + 2 s + 3 -----------------s^2 + 2 s + 2 » w2=series(w,w1) Transfer function: s^3 + 4 s^2 + 7 s + 6 ----------------------------------s^4 + 4s^3 + 8s^2 + 8s + 4 » w3=parallel(w,w1) Transfer function: s^4 + 5s^3 + 13s^2 + 16s + 10 ----------------------------------------s^4 + 4s^3 + 8s^2 + 8^s + 4 »w4=feedback(w,w1) Transfer function: s^3 + 4s^2 + 6s + 4 ---------------------------------------s^4 + 5s^3 + 12s^2 + 15s + 10 Для проверки правильности проведенных преобразований необходимо собрать схему исходной САУ и соответствующую ей эквивалентную схему в MATLAB Simulink. Задача считается решенной, если при подаче на вход обоих схем одинаковых тестовых воздействий наблюдаются одинаковые выходные сигналы. 3.5. Способы объединения подсистем в единую систему и уравнения ее состояния Во многих случаях возникает необходимость получить единые уравнения для системы, состоящей из нескольких соединенных между собой подсистем. Такие системы иногда называются "композитными". Рассмотрим, как выглядит решение этой задачи при описании моделей систем уравнениями состояния [47]. 3.5.1. Объединение независимых подсистем Рассмотрим вначале наиболее простой случай, когда композитная система состоит из двух независимых подсистем (рис. 3.7, а). Входом системы является вектор, полученный объединением входов каждой подсистемы, а выходом − объединение их выходов. Рис. 3.7. Структуры композитных систем Пусть системы Si, i = 1,2 описываются уравнениями состояния x i (t ) = Ai (t ) xi (t ) + Bi (t )u i (t ), y i (t ) = C i (t ) xi (t ) , в которых матрицы Ai(t), Bi(t), Ci(t) имеют размеры, соответственно, ni×ni, ni×mi, li×mi. Введем совокупные (общие) векторы: n1 + n2 состояния x(t ) = {x1 (t ), x2 (t )} ∈ R , m1 + m2 входа u (t ) = {u1 (t ), u 2 (t )} ∈ R l1 + l2 и выхода y (t ) = { y1 (t ), y 2 (t )} ∈ R . Объединив уравнения системы в одно, убеждаемся, что относительно введенных переменных это уравнение имеет вид (1.3) x (t ) = A(t ) x(t ) + B(t )u (t ), y (t ) = C (t ) x(t ) , в котором матрицы A(t), B(t), C(t) имеют следующую блочную структуру:  A1 (t ) 0 n1×n2  A(t ) =   0 n2 ×n1 A2 (t ) ,  B1 (t ) B(t ) =  0 n2 ×m1 0 n1×m2  B2 (t )  , C1 (t ) 0 l1×n2  C (t ) =    0 l2 ×n1 C 2 (t ) . 3.5.2. Последовательное соединение подсистем Пусть теперь входом системы S является вход подсистемы S1, u(t) = u1(t); выход системы образуется выходом подсистемы S2, y(t) = y2(t) и выход первой подсистемы S1 поступает на вход подсистемы S2 так, что их размерности совпадают, l1 = m2 и u2(t) = y1(t). Перепишем уравнения подсистем с учетом указанной связи между ними (рис. 3.7, б). Получим  x1 (t ) = A1 (t ) x1 (t ) + B1 (t )u1 (t ),   x 2 (t ) = A2 (t ) x2 (t ) + B2 (t )C1 (t ) x1 (t ) y1 (t ) = C1 (t ) x1 (t ) y 2 (t ) = C 2 (t ) x2 (t ) , откуда получаем матрицы уравнений в форме (1.3) вида 0 n1×n2   A1 (t ) A(t ) =    B2 (t )C1 (t ) A2 (t ) ,  B1 (t )  B(t ) =   n m ×  1 2 [ C (t ) = 0 l2 ×n1 C 2 (t ) ]. 3.5.3. Соединение подсистем с помощью обратной связи Пусть теперь подсистемы соединены с обратной связью, т.е. выход подсистемы S2 суммируется (или вычитается) со входом всей системы S и поступает на вход подсистемы S1. В качестве выхода системы S используем выход подсистемы S2 (рис. 3.7, в). Очевидно, здесь m1= l2, m2 = l1, m=m1, l = l2, n=n1+ n2, u1(t) = u(t)± y2(t), u2(t) = y1(t). C учетом связи между подсистемами их уравнения принимают вид  x1 (t ) = A1 (t ) x1 (t ) ± B1 (t )C 2 (t ) x2 (t ) + B1 (t )u (t ),   x 2 (t ) = A2 (t ) x2 (t ) + B2 (t )C1 (t ) x1 (t ) y1 (t ) = C1 (t ) x1 (t ) y 2 (t ) = C 2 (t ) xi (t ) и матрицы в (1.3) определяются выражениями ± B1 (t )C 2 (t )  A1 (t ) A(t ) =  A2 (t )   B2 (t )C1 (t ) ,  B1 (t )  B(t ) =   0 n1×m2  , [ C (t ) = C1 (t ) 0l1×n2 ] Аналогичным образом могут быть получены уравнения состояния при последовательном соединении, а также в других, более сложных случаях. Отметим, что хотя изложение этого параграфа касалось непрерывных систем, все полученные выше соотношения справедливы (после очевидных изменений в обозначениях) и для дискретных систем. 3.6. Задание на самостоятельную работу Для закрепления материала выполним с помощью MATLAB преобразования моделей, представленных в виде последовательного, параллельного соединений передаточных функций отдельных звеньев, а также при введении обратных связей. MATLAB содержит несколько функций, составляющих цифровой механизм, предназначенный для преобразования моделей передаточных функций в модели пространства состояний и наоборот. Мы начнем рассмотрение с составления файла sah1c.m, в котором производятся преобразования объектов в среде LTI. В первом разделе файла выполнены последовательное и параллельное соединения динамических звеньев; получено соединение с обратной связью. С этой целью применены операторы «series», «parallel» и «feedback». При этом соблюдены требования синтаксисов этих операторов. Во втором разделе файла представлен переход от модели в пространстве состояний к передаточным функциям по первому и второму входам (матрица B=[1 0;0 1]); нумерация входов приведена в функции преобразования ss2tf. Обратный переход [A1,B1,C1,D1] = tf2ss(num, den) для систем высокой размерности может быть неоднозначным. В третьем разделе определены переходные процессы в модели пространства состояний и интегрирующем звене, полином знаменателя которого равен den=[1 0]. Переходный процесс в LTI моделях реализован с использованием «step» и представлен как реакция на единичный входной сигнал при нулевых значениях элементов вектора начальных условий. Последнее означает, что в момент поступления входного сигнала (при t=0) запасы кинетической и потенциальной энергии (энергии магнитного поля катушек индуктивностей и энергии электрического поля конденсаторов) равны нулю. В четвертом разделе показано, как следует работать в LTI со стандартной функцией второго порядка, используя функцию ord2, которая позволяет однозначно определить числитель и знаменатель передаточной функции по двум параметрам: коэффициенту демпфирования и собственной частоте. В приведенном примере выбраны следующие показатели: частота wn=4 и коэффициент демпфирования damping_ratio=0.4. Для контроля работы файла после каждого решения с помощью pause вводится остановка решения, которое возобновляется путем нажатия любой клавиши. Это ограничение можно снять, используя знак %. % sah1c.m % Последовательное и параллельное соединения динамических звеньев. % Обратная связь. %--------------------------------------------------------------% Раздел 1. % Выполнение операции последовательного и параллельного % соединения звеньев num1=[10]; den1=[1 2 10]; num2=[5]; den2=[1 5]; [num,den]=series(num1,den1,num2,den2); printsys(num,den) pause [num,den]=parallel(num1,den1,num2,den2); printsys(num,den) pause % Включение второго звена в цепи обратной связи (связь отрицательная) [num,den]=feedback(num1,den1,num2,den2); printsys(num,den) pause %--------------------------------------------------% Раздел 2. % Преобразования при нескольких входах и выходах %(два входа и два выхода); модель в пространстве состояний: A=[0 1;-25 -4]; B=[1 0;0 1]; C=[1 0;0 1]; D=[0 0;0 0]; % Получение передаточной функции по первому входу [NUM1,den1]=ss2tf(A,B,C,D,1) % Получение передаточной функции по второму входу [NUM2,den2]=ss2tf(A,B,C,D,2) % Обратный переход [A1,B1,C1,D1] = tf2ss(NUM2,den2) pause % ------------------------------------------------------------------% Раздел 3. % Переходный процесс в системе (модель в пространстве состояний): A2=[-1 -1;6.5 0]; B2=[1 1;1 0]; C2=[1 0;0 1]; D2=[0 0;0 0]; step(A2,B2,C2,D2),grid pause % Переходный процесс в интегрирующем звене: num=[1]; den=[1 0]; step(num,den,15),grid title('переходный процесс в системе G(s)=1/s') pause % ------------------------------------------------------------------% Раздел 4. % Работа со стандартной функцией второго порядка: Wn=4; damping_ratio=0.4 [num0,den0]=ord2(Wn,damping_ratio); %num5=wn^2*num0 printsys(num0,den0,'s') pause numA=[wn^2]; denA=den0; sys=tf(numA,denA) step(numA,denA),grid %title('переходный процесс в системе G(s)=16/(s^2+3.2s+16)') % ПРОВЕРКА % 3.2=2*damping_ratio*Wn. Отсюда: damping_ratio=3.2/(2*Wn)=3.2/8=0.4, % что подтверждает корректность вычислений. Перерегулирование в % системе в этом случае составляет 25%. По завершении ознакомления с работой в представленном файле, студент может самостоятельно использовать для выполнения индивидуального задания как файл в целом, так и его отдельные разделы с введением соответствующих численных значений параметров динамических объектов и систем. 4. ХАРАКТЕРИСТИКИ ЛИНЕЙНЫХ СИСТЕМ 4.1. Коэффициент передачи (усиления) в установившемся режиме Одна из важнейших характеристик линейной системы – коэффициент усиления в установившемся режиме или статический коэффициент усилении (static gain, DC-gain). Его можно определить как установившееся значение сигнала выхода при постоянном входном сигнале, равном единице. Размерность этой величины равна отношению размерностей сигналов выхода и входа. Если коэффициент имеет размерность, его называют коэффициентом передачи. Безразмерный коэффициент – коэффициент усиления. Рассмотрим дифференциальное уравнение y + 2 y + 3 y = 4u + 5u . Полагая все производные (в установившемся режиме) равными нулю, получаем 5 3 y = 5u ⇒ y = u 3 . Статический коэффициент усиления равен ks=5/3. Если задана передаточная функции, для вычисления ks надо подставить в нее s=0, поскольку переменная s соответствует оператору дифференцирования. Рассмотренному выше уравнению можно сопоставить передаточную функцию W (s) = 4s + 5 s 2 + 2s + 3 . Тогда k s = limW ( s ) = s →0 5 3. Если система содержит интегрирующее звено (передаточная функция имеет полюс в точке s=0), этот предел равен бесконечности, то есть, при постоянном сигнале выход бесконечно увеличивается или уменьшается, не достигая установившегося режима. Тот же результат можно получить с помощью эквивалентной модели в пространстве состояний. С помощью среды MATLAB находим − 2 − 1.5  2 A= , B =  , C = [2 1.25], D = 0  0  2 0  . Полагая x = 0 , получаем модель, определяющую установившийся режим 0 = A x + Bu y = C x + Du ⇒ x = − A −1 B u −1 y = C x + Du ⇒ y = − C A B + D u , ( ) откуда следует ks = - CA-1B + D. Получим значение ks в среде MATLAB >> k=-C*inv(A)*B+D k= 1.6667. 5 Для той же системы, как и раньше, получаем ks = . Заметим, что для того, 3 чтобы статический коэффициент усиления был конечен, требуется обратимость матрицы A, то есть, отсутствие интегрирующих звеньев 1, а сама система должна быть устойчивой. 4.2. Импульсная характеристика Импульсной характеристикой (весовой функцией) w(t) называется реакция системы на единичный бесконечный импульс (дельта-функцию или функцию Дирака) при нулевых начальных условиях. Дельта-функция δ(t) определяется равенствами  0, t ≠ 0 δ (t ) =  ∞, t = 0 , ∞ ∫ δ (t ) dt = 1 −∞ . Это обобщенная функция – математический объект, представляющий собой идеальный сигнал. Никакое реальное устройство не способно его воспроизвести. Дельта-функцию можно рассматривать как предел Полюса передаточной функции являются собственными числами матрицы A . Таким образом, если у передаточной функции есть полюс в точке s = 0 , матрица A будет вырожденной. 1 прямоугольного импульса единичной площади с центром в точке t=0 при стремлении ширины импульса к нулю. Второе название – весовая функция – связано с тем, что для произвольного входного сигнала u(t) выход системы y(t) вычисляется как свертка y= (t ) t ∞ −∞ d τ ∫ u (t − τ) w(τ) d τ. . ∫ u (τ) w(t − τ) = Здесь функция w(t) как бы «взвешивает» входной сигнал в подынтегральном выражении. Импульсная характеристика отражает лишь вход-выходные соотношения при нулевых начальных условиях, то есть, не может полностью описывать динамику системы. Понятие импульсной характеристики используется главным образом для систем, передаточные функции которых строго правильные. Если передаточная функция правильная, но не строго правильная, коэффициент прямой передачи с входа на выход (матрица D модели в пространстве состояний) не равен нулю, поэтому бесконечный импульс на входе в момент t=0 передается на выход. Такую (бесконечную по величине) импульсную характеристику невозможно построить. Система MATLAB в этом случае строит импульсную характеристику для строго правильной части, принимая D=0. Это один из тех случаев, когда компьютер выдает качественно неверный результат. Покажем связь передаточной функции звена K(s) с его импульсной характеристикой. По определению K ( s) = W ( s) W ( s) = = W ( s ), поскольку δ(t ) ÷ 1. U ( s) 1 Таким образом, передаточная функция звена есть не что иное, как изображение по Лапласу функции веса и связана с ней интегральным преобразованием ∞ K ( s ) = W ( s ) = ∫ w(t )e − st dt . Импульсная переходная функция (ИПФ), как и передаточная функция, является исчерпывающей характеристикой САУ при нулевых начальных условиях. ИПФ имеет вид, представленный на рис. 4.1. Рис. 4.1. Импульсная переходная функция САУ Если система не содержит интеграторов, импульсная характеристика стремится к нулю. Это следует из теоремы о предельном значении: lim w(t ) = lim s W ( s ) t →∞ s →0 , где W(s) – передаточная функция системы, которая является преобразованием Лапласа для w(t). Импульсная характеристика системы с одним интегратором стремится к постоянной величине, равной статическому коэффициенту передачи системы без интегратора. Для системы с двумя интеграторами импульсная характеристика асимптотически стремится к прямой, а с тремя интеграторами – к параболе и т.д. 4.3. Переходная характеристика Переходной характеристикой (переходной функцией) h(t) называется реакция системы (при нулевых начальных условиях) на единичный ступенчатый сигнал (единичный скачок) 0, t < 0 1(t ) =  1, t ≥ 0 . Импульсная и переходная функции связаны выражениями dh(t ) w(t ) = dt , t h(t ) = ∫ w(τ ) dτ . Покажем связь передаточной функции звена K(s) с его переходной характеристикой h(t). По определению K ( s) = Отсюда 1 W (s) W (s) = = s ⋅ H ( s ), поскольку 1(t ) ÷ . 1 U (s) s s 1 1 1 H ( s ) = K ( s ) = W ( s ), h(t ) ÷ W ( s ). s s s Полученные соотношения позволяют найти переходную и импульсную характеристики звена по ее операторной передаточной функции K(s)=W(s). Для систем без интеграторов переходная характеристика стремится к постоянному значению ks. Рис. 4.2. График переходной функции в устойчивой САУ Переходная характеристика системы с дифференцирующим звеном (числитель передаточной функции имеет нуль в точке s=0) стремится к нулю. Если система содержит интегрирующие звенья, переходная характеристика асимптотически стремится к прямой, параболе и т.д., в зависимости от количества интеграторов. По определению предельное значение переходной функции h(t) при t→∞ есть статический коэффициент усиления (передачи): k s = lim h(t ) t →0 . Эта величина имеет смысл только для устойчивых систем, поскольку при неустойчивости переходный процесс не сходится к конечному значению. Если передаточная функция правильная, но не строго правильная (матрица D модели в пространстве состояний не равна нулю), скачкообразное изменение входного сигнала мгновенно приводит к скачкообразному изменению выхода. Рис. 4.3. Выходной сигнал системы при u(t)=1(t) и D≠0 Величина этого скачка равна отношению коэффициентов при старших степенях числителя и знаменателя передаточной функции (или матрице D модели в пространстве состояний). По переходной характеристике можно найти важнейшие показатели качества системы – перерегулирование (overshoot) и время переходного процесса (settling time). Перерегулирование определяется как σ= hmax − h уст h уст × 100% где hmax – максимальное значение функции h(t), установившееся значение выхода. , h уст = lim h(t ) t →∞ – Время переходного процесса – это время, после которого сигнал выхода отличается от установившегося значения не более, чем на заданную малую величину (в среде MATLAB по умолчанию используется пороговое значение 2%). 4.4. Частотные характеристики При подаче на вход линейной системы гармонического (синусоидального) сигнала u(t) = sinωt с частотой ω (с размерностью в радианах в секунду), на выходе будет также гармонический сигнал той же частоты, но другой амплитуды и фазы 2 y(t)=Asin(ωt+φ), где A – амплитуда и φ – сдвиг фазы. 4.4.1. Амплитудно-фазовая, амплитудная и фазовая частотные характеристики Частотная характеристика определяется как реакция системы на комплексный экспоненциальный сигнал ejωt=cosωt+jsinωt. Для ее построения надо использовать подстановку s=jω в передаточной функции W(s). Выражение W(jω) представляет собой амплитудно-фазовую частотную характеристику системы. Это комплексная функция. Ее можно представить следующим математическим выражением: jφ ( ω) W ( jω)= W (ω) e jφ ( ω) Y ( jω) e y = = P(ω) + jQ(ω) , U ( jω) e jφu ( ω) где P(ω) – вещественная часть; Q(ω) – мнимая часть; Зависимость модуля величины W(jω) от частоты называется амплитудной частотной характеристикой А(ω), а зависимость аргумента комплексного числа (фазы) W(jω) от частоты – фазовой частотной характеристикой φ(ω): A(ω) = W ( jω) , ϕ(ω) = argW ( jω) = arctg ImW ( jω) ReW ( jω) . Обозначим модули функций соответственно выхода и входа Y ( jω) = Ay (ω), U ( jω) = Au (ω) Получим отношение амплитуд выходного и входного сигналов и сдвиг по фазе выходной величины относительно входной: A(ω) = Ay (ω) Au (ω) = P(ω) 2 + Q(ω) 2 ; ϕ(ω) = arctg Q(ω) P(ω) . Реальные объекты имеют строго правильную передаточную функцию, поэтому их амплитудно-частотная характеристика убывает с ростом частоты и асимптотически стремится к нулю (рис. 4.5). 2 Для нелинейных систем это неверно. 1.6 Amax 1.4 ks 1.2 1 0.8 0.6 0.4 0.2 -1 10 ω c ωb 10 1 10 2 10 Рис. 4.5. АЧХ системы Максимум амплитудно-частотной характеристики соответствует частоте, на которой усиление наибольшее. Такой объект обладает свойством фильтра – фильтрует (не пропускает) высокочастотные сигналы (помехи, шумы измерений). Это свойство служит основой для использования метода гармонического баланса. Частота, после которой значение амплитудночастотной характеристики уменьшается ниже 0 дБ (коэффициент усиления меньше 1, сигнал ослабляется), называется частотой среза системы ωс. Частота, после которой значение амплитудно-частотной характеристики падает ниже -3 дБ (коэффициент усиления меньше, чем 0.708), определяет полосу пропускания системы ωb (от англ. bandwidth). Значение амплитудно-частотной характеристики при ω=0 равно усилению при постоянном сигнале, то есть, статическому коэффициенту усиления ks. Это следует и из равенства lim A(ω) = lim W ( jω) = lim W ( s ) = k s ω→0 ω→0 s →0 . Для систем с интегрирующими звеньями частотная характеристика стремится к бесконечности при ω→0. Это значит, что их выход бесконечно увеличивается или уменьшается при постоянном входном сигнале. Говорят, что такой объект обладает свойством фильтра – фильтрует (не пропускает) высокочастотные сигналы (помехи, шумы измерений). Это свойство служит основой для использования метода гармонического баланса. Если W(jω) изобразить вектором на комплексной плоскости, то при изменении ω от 0 до +∞ его конец будет вычерчивать кривую, называемую годографом вектора W(jω), или амплитудно-фазовую частотную характеристику (АФЧХ) (рис. 4.6). Рис. 4.6. Амплитудно-фазовая частотная характеристика Амплитудно-фазовая частотная характеристика представляет собой геометрическое место концов векторов (годограф), соответствующих частотной передаточной функции W ( jω ) = P(ω ) + jQ(ω ) при изменении частоты от нуля до бесконечности (рис. 4.6). По оси абсцисс откладывается вещественная часть P(ω)=ReW(jω) и по оси ординат – мнимая часть Q(ω)=ImW(jω). Для каждой частоты на комплексной плоскости наносится точка с надписью соответствующей ей частоты ω1, ω2, …. Полученные точки соединяются плавной кривой. Длина вектора, проведенного из начала координат в точку годографа, соответствующую какой-то выбранной частоте, равна модулю частотной передаточной функции. Угол между вектором и положительным направлением вещественной оси, отсчитываемый против часовой стрелки, равен аргументу или фазе частотной передаточной функции. Ветвь характеристики при изменении ω от -∞ до 0 можно получить зеркальным отображением данной кривой относительно вещественной оси. Частотные характеристики достаточно сложно строить вручную. В 60-е годы, когда развивалась классическая теория управления, не было мощных компьютеров, поэтому наибольшую популярность приобрели приближенные методы, с помощью которых можно было проектировать регуляторы с помощью ручных вычислений и построений. Один из таких подходов основа на использовании логарифмических частотных характеристик. 4.4.2. Логарифмические частотные характеристики Вместо А(ω) было предложено использовать логарифмическую амплитудную частотную характеристику (ЛАЧХ): график, на котором по оси абсцисс откладывается десятичный логарифм частоты lgω, а по оси ординат − величина Lm(ω) = 20lgА(ω), измеряемая в децибелах (дБ). При построении логарифмической фазовой частотной характеристики (ЛФЧХ) по оси абсцисс также откладывается логарифм частоты lgω (рис. 4. 7). В классической теории управления хорошо разработаны методы анализа и синтеза систем на основе ЛАХ (рис. 4. 7), которые представляют собой ломаные линии и легко строятся графически. Рис. 4.7. Логарифмические амплитудная (ЛАХ) и фазовая (ЛФХ) частотные характеристики C появлением компьютерных средств расчета практическая значимость характеристик несколько снизилась, однако они по сей день остаются простейшим инструментом оценочных расчетов для инженера. Как видно из рис. 4.7 равномерной единицей на оси абсцисс является декада, то есть единичным промежуткам по оси абсцисс соответствует изменение ω в 10 раз. Так как lg(0) = -∞, то ось ординат проводят произвольно. Частота ωср на которой L(ω) пересекается с осью абсцисс, называется частотой среза. Поскольку lg0=-∞, то начало координат можно брать в любой точке, в зависимости от интересующего диапазона частот. Важно иметь в виду, что ось абсцисс (L(ω) = 0) соответствует значение A(ω) = 1, т. е. прохождению амплитуды сигнала через звено в натуральную величину. Верхняя полуплоскость ЛАЧХ соответствует значениям A(ω) > 1 (усилению амплитуды), а нижняя полуплоскость – значениям A(ω) < 1 (ослабление амплитуды). Логарифмической фазовой частотной характеристикой называется график зависимости φ(ω)=ArgW(jω). При построении фазовых характеристик отсчет углов φ идет по оси ординат в обычном масштабе в угловых градусах или радианах. По оси абсцисс откладывается по-прежнему частота в логарифмическом масштабе. ЛФЧХ отличается от ФЧХ только масштабом по оси ω. Для элементарных звеньев она не выходит за пределы: -π≤ φ ≤+π. Вместе ЛАЧХ и ЛФЧХ называются логарифмической амплитуднофазовой частотной характеристикой (ЛАФЧХ) или диаграммами Боде. На верхнем рисунке 4.7 показаны точная (сплошная линия) и асимптотическая штриховая линии ЛАХ для звена первого порядка с передаточной функцией W (s) = 1 Ts + 1 при Т=1 с. Первая асимптота, определяющая поведение звена на низких частотах, имеет нулевой наклон, потому что звено относится к классу позиционных звеньев, имеющих постоянный ненулевой статический коэффициент усиления, то есть W(0) = 1 ≠ 0 . Если W(0)=0, передаточная функция содержит множитель sk (k > 0), который соответствует производной порядка k. В этом случае наклон ЛАХ на низких частотах равен k · 20 дБ/дек. Если W(0)=∞ звено содержит один или несколько интеграторов, то есть в знаменателе есть сомножитель sk. Тогда наклон ЛАХ на низких частотах равен – k ·20 дБ/дек. Наклон ЛАХ на высоких частотах определяется разностью степеней числителя и знаменателя передаточной функции. Если числитель имеет степень m, а знаменатель − степень n, то наклон последней асимптоты равен 20·(m-n) дБ/дек. В нашем примере m - n = 0 -1 = -1. Поэтому вторая асимптота, определяющая свойства звена на высоких частотах, имеет наклон -20 дБ/дек, то есть, за одну декаду значение уменьшается на 20 дБ (проверьте по графику!). Логарифмические характеристики обладают следующими ценными свойствами: • ЛАХ и ЛФХ для произведения W1(s)W2(s) вычисляются как суммы ЛАХ и ЛФХ отдельных звеньев: 20lgA(ω)=20lgA1(ω)+20lgA2(ω) φ(ω)=φ1(ω)+φ2(ω); • в области высоких и низких частот ЛАХ асимптотически приближаются к прямым, наклон которых составляет ± 20 дБ/дек (децибел на декаду), ± 40 дБ/дек и т.д. • изменение уровня сигнала на 10 дБ соответствует изменению его мощности в 10 раз. Так как мощность гармонического сигнала Р пропорциональна квадрату его амплитуды А, то изменению мощности сигнала в 10 раз соответствует изменению его уровня на 20дБ, поскольку 10lg(P2/P1) =10lg(A22/A12) = 20lg(A2/A1). Частотные характеристики несут полную информацию о динамике системы. По частотным характеристикам системы можно восстановить ее передаточную функцию и определить параметры. А по известной передаточной функции звена W(s) легко получить частотные характеристики. Для этого необходимо подставить в нее jω вместо s, что позволит получить комплексный коэффициент передачи W(jω). Затем надо выразить из него вещественную P(ω) и мнимую Q(ω) части. Показательная форма W(jω) содержит компоненты A(ω) и φ(ω), применение к которым операции логарифмирования позволяет найти ЛАХ L(ω) = 20lgA(ω) и ЛФХ, т. е. получить диаграмму Боде. 4.5. Построение частотных характеристик в среде MATLAB Частота, после которой амплитуда ЛАХ падает ниже -3 дБ (коэффициент усиления меньше, чем 0.708), называется полосой пропускания системы ωb. Для ее вычисления используют команду >> b=bandwidth(f) Чтобы построить частотные характеристики в MATLAB, надо сначала создать массив частот в нужном диапазоне. Для этого можно использовать функции linspace (равномерное распределение точек по линейной шкале) и (равномерное распределение точек по логарифмической шкале). Команда logspace >> w=linspace(0,10,100); возвращает массив из 100 точек с равномерным шагом в интервале от 0 до 10, а команда >> w=logspace(-1,2,100); – массив из 100 точек с равномерным шагом по логарифмической шкале в интервале от 10-1 до 10-2. Частотная характеристика на сетке w для линейной модели f (заданной как передаточная функция, модель в пространстве состояний или в форме «нули-полюса») вычисляется с помощью функции freqresp: >> r=freqresp(f,w); Функция freqresp возвращает трехмерный массив. Это связано с тем, что она применима и для многомерных моделей (с несколькими входами и выходами), передаточная функция которых представляет собой матрицу. Первые два индекса обозначают строку и столбец в этой матрице, а третий – номер точки частотной характеристики. Для системы с одним входом и одним выходом удобно преобразовать трехмерный массив в одномерный командой >> r=r(:); Для вывода графика АЧХ на экран можно использовать команды MATLAB >> plot(w,abs(r)); >> semilogx(w,abs(r)); >> loglog(w,abs(r)); В первом случае масштаб обеих осей координат – линейный, во втором случае используется логарифмический масштаб по оси абсцисс (частот), в последнем – логарифмический масштаб по обеим осям. Для вычисления фазы (в градусах) используется команда >> phi=angle(r)*180/pi; после чего можно строить ЛФХ, например: >> semilogx(w,phi); Полюса и нули. Многие динамические свойства системы (например, быстродействие, перерегулирование) определяются полюсами передаточной функции (или, что то же самое, собственными числами матрицы A модели в пространстве состояний, численные значения которых совпадают с корнями полиномов знаменателя передаточных функций). Передаточную функцию можно записать как произведение передаточных функций элементарных звеньев первого и второго порядков. Таким образом, множество полюсов передаточной функции устойчивой системы составляют полюса передаточных функций двух типов простейших звеньев: апериодических и колебательных. Для нахождения полюсов передаточной функции f можно использовать функцию >> p=pole(f) Вызов функции >> [w0,zeta,p]=damp(f) позволяет найти не только полюса p, но также соответствующие им собственные частоты w0 и коэффициенты демпфирования zeta в виде массивов. Нули передаточной функции f вычисляются как >> z=zero(f); Устойчивость системы не зависит от расположения нулей, но они существенно влияют на переходные процессы. Команда >> pzmap(f); строит карту расположения нулей (они обозначаются кружками) и полюсов (обозначены крестиками) системы на комплексной плоскости. Работа с объектами в LTI позволяет использовать стандартные способы построения частотных характеристик, определяемые функциями nyquist, bode, nichols, sigma и др. Покажем использование nyquist и bode, на простых примерах. Давайте создадим объект системы в виде передаточной функции со следующими полиномами числителя и знаменателя: >> num=[16], den=[1 3.2 16]. >> sys=tf(num,den) sys = 16 ---------------- s^2 + 3.2 s + 16 Continuous-time transfer function. Рис. 4.8. Переходная характеристика звена с передаточной функцией sys Переходный процесс получен с помощью функции step(sys), grid. Построение амплитудно-фазовой характеристики выполним с помощью команды nyquist(sys), grid. В результате получим график, представленный на рис. 4.9. Более точные значения для real=0.4 функции можно получить с помощью >> [re,im]=nyquist(sys,3.5347 В результате; re = 0.4000, im = -1.2906 на частоте W=3.5347 рад/с. Рис. 4.9. Годограф Найквиста для звена с передаточной функцией sys Теперь построим ЛАХ и ЛФХ с помощью команды bode (рис. 4.10). Bode Diagram Magnitude (dB) -20 System: sys Frequency (rad/s): 12.2 Magnitude (dB): -18.8 -40 -60 Phase (deg) -45 System: sys -90 Frequency (rad/s): 6.96 Phase (deg): -145 -135 -180 10 -1 10 10 1 10 2 Frequency (rad/s) Рис. 4.10. Диаграмма Боде для звена с передаточной функцией sys Используем bode(sys), grid, где grid служит для нанесения сетки. В результате будем иметь характеристики, где значения частоты и амплитуды могут определяться в любой точке ЛАХ (например, в выбранной точке на ЛАХ частота равна12.2 рад/c, амплитуда равна – 18.8 Дб.) Фаза определяется по ЛФХ. Из графика видно, что на частоте 6.96 рад /с фаза равна -1450. 5. ВРЕМЕННЫЕ ХАРАКТЕРИСТИКИ ТИПОВЫХ ДИНАМИЧЕСКИХ ЗВЕНЬЕВ Обычно система управления состоит из отдельных блоков, каждый из которых описывается уравнениями низкого порядка (чаще всего - первого или второго). Для понимания работы системы в целом желательно хорошо представлять, как ведут себя ее отдельные элементы. Кроме того, при построении ЛАФЧХ сложной системы передаточную функцию разбивают на простейшие сомножители W(s)=W1(s)·W2(s)·…·WN(s) и далее, воспользовавшись свойствами ЛАХ, строят характеристики для всей системы как суммы ЛАХ и ЛФХ отдельных звеньев. 5.1. Простейшие звенья 5.1.1. Пропорциональное звено (усилитель) Звенья, имеющие конечный ненулевой коэффициент усиления постоянного сигнала, то есть W(0) = k ≠ 0, называются позиционными. Это значит, что числитель и знаменатель передаточной функции имеют ненулевые свободные члены (постоянные слагаемые). Простейшее позиционное звено - идеальный (безынерционный) усилитель. Его передаточная функция W(s) = k . Строго говоря, он не является динамическим звеном, поскольку изменение выхода происходит мгновенно, сразу вслед за изменением входа. При действии на вход единичного ступенчатого сигнала 1(t) (или дельта-функции δ(t)) на выходе будет такой же сигнал, усиленный в k раз, поэтому переходная и импульсная характеристики звена равны h(t) = k 1(t > 0) и w(t) = k δ(t). а) б) Рис. 5.1. Временные характеристики пропорционального звена: а – переходная; б – весовая Примерами такого вена являются: делитель напряжения, усилитель постоянного тока, рычажная передача, редукторная передача. 5.1.2. Интегрирующее звено Простое интегрирующее звено – емкость, которая наполняется жидкостью. Примерами интегрирующих звеньев могут служить емкости для приема и расходования углеводородов и нефтепродуктов в нефтеналивных портах, танки на судах-танкерах, камеры шлюзов и др. Входной сигнал − это поток поступающей или расходуемой из емкости жидкости (воды, нефти, газоконденсата и др.), выход системы − уровень жидкости в емкости. При поступлении жидкости уровень растет, система «накапливает» (интегрирует) входной сигнал. Принципиальная схема интегратора представлена на рис. 1.3: Рис. 5.2. Интегрирующее звено на операционном усилителе Операционный усилитель спроектирован так, что его коэффициент усиления равен отношению сопротивления в обратной связи к входному сопротивлению Rвх. Поскольку емкостное сопротивление в обратной связи в операторной форме равно 1/(sC), то коэффициент усиления KИ=1/(sRC). Напомним, что произведение RC=T есть постоянная времени. Если С=10 мкФ и R=100 кОм, то постоянная времени T=1 с. Для получения переходных процессов в интегрирующих звеньях создадим три объекта, отличающиеся постоянными времени. С этой целью выберем параметры звеньев, используя различные сопротивления при одинаковой емкости: R1=2.0e05; R2=1.0e05; R3=0.5e05; C=10.0e-06. В результате передаточные функции будут иметь вид: sys1=tf(1,[1/(R1*C) 0]); sys2=tf(1,[1/(R2*C) 0]); sys3=tf(1,[1/(R3*C) 0]). Переходные процессы в звеньях получим с помощью функции step step(sys1,sys2,sys3,10),grid, где введено ограничение времени переходного процесса 10 секунд. Результаты моделирования представлены на рис. 5.3. Так как с уменьшением постоянной времени возрастает скорость интегрирования КИ, то за время 10 с при входном сигнале 1 вольт переходный процесс в sys1 достигает 5 В (T1=2), в sys2 – 10 В (T2=1), а в системе sys3 выходной сигнал равен 20 В (T3=0.5). Рис. 5.3. Переходные процессы в интегрирующих звеньях Интегрирующее звено описывается уравнением dy (t ) = k ⋅ x(t ) , dt которому соответствует передаточная функция W ( s ) = (5.1) k . s Решение уравнения (4.2) дает t y (t ) = y (0) + k ∫ x(τ)dτ . Используя это решение для единичного скачка (x(t) = 1 при t > 0) при нулевых начальных условиях (y(0) = 0), получаем линейно возрастающую переходную характеристику: h(t) = k · t. Для того, чтобы найти импульсную характеристику, вспомним, что интеграл от дельта-функции на любом интервале, включающем t = 0, равен 1. Поэтому w(t) = k (при t ≥ 0). Рис. 5.4. Переходная и импульсная характеристики интегрирующего звена Примерами интегрирующего звена являются гидравлический демпфер, операционный усилитель с конденсатором в цепи обратной связи. 5.1.3. Дифференцирующее звено Дифференцирующее звено дает на выходе производную входного сигнала. Уравнение идеального дифференцирующего звена y (t ) = k dx(t ) , dt его операторная запись y(t) = k · s x(t), а передаточная функция W(s) = k · s. Принципиальная схема дифференциатора представлена на рис. 5.5: Рис. 5.5. Дифференцирующее звено на операционном усилителе Известно, что производная единичного ступенчатого сигнала 1(t) в точке t = 0 − это дельта-функция δ(t). Поэтому переходная и весовая функции дифференцирующего звена h(t ) = k dh(t ) d [1(t )] = kδ(t ), w(t ) = = kδ' (t ) . dt dt Это физически нереализуемые функции, так как дельта-функцию и ее производную, имеющие бесконечные значения, невозможно получить на реальном устройстве. Поэтому идеальное дифференцирующее относится к физически нереализуемым звеньям. звено 5.1.4. Звено запаздывания Примерами таких звеньев могут служить: технологические конвейерные установки, системы магнитной записи и воспроизведения. Выходная величина звена воспроизводит входной сигнал с отставанием во времени на величину запаздывания τ. Звено запаздывания описывается уравнением: y(t)=ku(t-τ). Передаточная функция звена запаздывания W(s)=ke-τs, Если коэффициент звена запаздывания равен единице (k = 1), то такое звено получило название − звено чистого запаздывания. Временные характеристики звена чистого запаздывания (рис. 5.6) представлены переходной функцией: h(t)=1(t – τ), и весовой функцией w(t)=δ(t – τ). а) б) Рис. 5.6. Временные характеристики звена чистого запаздывания: а – переходная; б – весовая Для получения транспортного запаздывания в динамических системах используется аппроксимация Паде. Функция преобразования Паде в виде отношения двух полиномов определяется по выражению: [num,den]=pade(T,N), где T − время запаздывания и N – порядок полинома ряда аппроксимации. Пусть в рассматриваемом примере T=3 c и N=50. Тогда функция Паде: >> [num,den]=pade(3,50); Теперь образуем систему >> sys2=tf(num,den). Это фактически динамическое звено с размерностью полиномов числителя и знаменателя, равной N. Для получения запаздывания в системе соединим последовательно sys2 c ранее использованной (см. разд. 4.5) динамической системой второго порядка, числитель и знаменатель которой состоит из полиномов num1=16, den1=[1 3.2 16], а сама система sys3 имеет вид >> sys3=tf(16,[1 3.2 16]) или 16 sys3 = ---------------s^2 + 3.2 s + 16 Модель динамической системы с транспортным запаздыванием построим, используя последовательное соединение sys2 и sys3 >> sys4=series(sys2,sys3). Применение оператора step(sys4) позволило получить переходный процесс как реакцию на единичный ступенчатый сигнал (рис. 5.7) Рис.5.7. Переходный процесс в системе с запаздыванием Из рис. 5.7 следует, что транспортное запаздывание составляет 3 с. На рисунке также приведены передаточные функции всех объектов и их параметры. 5.2. Динамические звенья первого порядка 5.2.1. Апериодическое (инерционное) звено Одно из самых часто встречающихся звеньев − апериодическое, которое описывается дифференциальным уравнением T dy (t ) + y (t ) = k ⋅ u (t ) dt и имеет передаточную функцию W ( s ) = (5.2) k , где k –коэффициент передачи, а Ts + 1 T > 0 − постоянная, которая называется постоянной времени звена. В частности, примером такого уравнения динамики является дифференциальное уравнение u R + u L = i (t ) R + L di (t ) = u (t ) = E dt RL-цепи (рис.5.8), которое можно преобразовать к виду i (t ) + L i (t ) 1 = E. R dt R (5.3) Рис. 5.8. Астатическое звено на примере RL-цепи Уравнение (5.3) будет полностью соответствовать уравнению (5.2), если в уравнении (5.2) принять T=L/R, k=1/R, y(t)=i(t) и u(t)=E, где L − индуктивность цепи (Гн), R − сопротивление цепи (Ом), i(t) − ток через индуктивность (А) и E − ЭДС источника питания (В). Его решением при нулевых начальных условиях является i L (t ) = E  R  ⋅ 1 − exp(− ⋅ t )  . R  L  Ток iL(t) при подключении RL-цепи к источнику постоянной ЭДС определим при следующих параметрах: L=0.003 Гн, R=1000 Ом и E=61 В. Приведем формулы для расчета в среде MATLAB: >> L=0.003; R=1000; E=61; >> t=0:(5*L/R)/500:5*L/R; >> iL=E/R*(1-exp(-t/(L/R))); >> plot(t,iL),grid В результате получаем переходный процесс, приведенный на рис. 5.9 − ток, изменяющийся во времени по экспоненциальному закону. Переходный процесс в RL - цепи 0.07 0.06 IL(t), A 0.05 0.04 0.03 0.02 0.01 0.5 t,c 1 1.5 -5 x 10 Рис. 5.9. Изменение тока в цепи в переходном режиме Такой же закон получим для основной переменной состояния любой электрической цепи (неразветвленной или разветвленной) с одним накопителем энергии при подключении к источнику постоянной ЭДС или тока. Если ввести обозначения X(t) – основной переменной состояния (тока че-рез индуктивность или напряжения на конденсаторе); Xпр – принужденной составляющей; T − постоянной времени цепи и t − текущего времени, то можно записать решение без интегрирования, поскольку оно имеет стандартную форму t   X (t ) = X пр 1 − exp(− )  . T   Постоянная времени Т определяется по известным параметрам L, C и эквивалентному сопротивлению цепи RЭКВ. Эквивалентное сопротивление находится следующим образом: рассматривается двухполюсник, полученный отключением накопителя энергии от сети (клеммы 1 и 2); исключается из цепи источник тока или ЭДС, но сохраняется его внутреннее сопротивление (нуль для источника ЭДС и бесконечность – для источника тока); определяется входное сопротивление пассивного двухполюсника по клеммам 1, 2. Это и есть RЭКВ. Все цепи с одним накопителем энергии – хорошие примеры апериодических звеньев первого порядка. Заметим, что выражение W(s) легко получается из операторной формы представления, получаемого путем прямого преобразования Лапласа дифференциального уравнения (5.2) в виде TsY(s)+Y(s)=kU(s) или ( Ts)+1) Y(s)= kU(s) k Y (s) = W (s) = . Ts + 1 U (s) откуда Постоянная времени − размерная величина, она измеряется в секундах и характеризует инерционность объекта, то есть скорость его реакции на изменение входного сигнала. виду Весовую функцию w(t) найдем, преобразовав ее изображение W(s) к W ( s) = k k k k 1 1 = = ⋅ = ⋅ . 1 Ts + 1 T s + 1 T s+ 1 T ( ) [ s − (− )] T T T При обратном переходе от изображения W(s) к временной функции w(t) воспользуемся универсальной формулой перехода, имеющейся в таблице изображения основных элементарных функций e αt = 1 1 , где α = − . T s−α Отсюда импульсная (весовая) функция апериодического звена  t  k −  w(t ) = e  T  . T Переходную функцию h(t) найдем с учетом ее интегральной связи с весовой функцией w(t)  τ  τ  τ t  −  t −   −   k  − T  k 1 T h(t ) = ∫ w(τ) dτ = ∫ e dτ = ⋅ e   | = − k  e T − 1 = k 1 − e  T  .   T T  1     −  T   t t Таким образом, импульсная и переходная характеристики апериодического (инерционного) звена, представленные в виде w(t ) =  k  t  t  exp − , h(t ) = k 1 − exp −  , T  T  T   имеют следующие графические зависимости, показанные на рис. 5.10 а, б. Рис. 5.10. Переходная и весовая функции апериодического звена Обратите внимание, что предельное значение переходной характеристики равно k, а касательная к ней в точке t = 0 пересекается с линией установившегося значения при t = T. Переходная и импульсная характеристики выходят на установившееся значения (с ошибкой не более 5%) примерно за время 3T. Эти факты позволяют определять постоянную времени T экспериментально, по переходной характеристике звена. Примерами инерционных звеньев являются RC- и LR-цепи; генератор постоянного тока, входной координатой которого является напряжение возбуждения, а выходной – напряжение на якоре. 5.2.2. Инерционно-дифференцирующее звено 1. Уравнение звена: T dy (t ) du (t ) + y (t ) = k . dt dt 2. Передаточная функция звена: W (s) = Y (s) ks = . U ( s ) Ts + 1 3. Временные характеристики инерционно-дифференцирующего звена (рис. 5.11 а, б): t k −T h ( t ) = e ⋅ 1(t ). 3.1. Переходная функция: T t k −T k w t = δ − ( ) ( t ) e ⋅1(t ). 3.2. Весовая функция: T T2 а) б) Рис. 5.11. Временные характеристики инерционно-дифференцирующего звена: а – переходная; б – весовая 5.2.3. Форсирующее звено 1. Уравнение звена:  du (t )  y (t ) = k T + u (t ) . dt   Такое звено получается в результате параллельного соединения пропорционального и дифференцирующего звеньев. 2. Передаточная функция звена: W (s) = Y (s) = k (Ts + 1). U (s) 2. Временные характеристики форсирующего звена (рис. 5.12): а) б) Рис. 5.12. Временные характеристики форсирующего звена: а – переходная; б – весовая 3.1. Переходная функция: h(t)=k·1(t) + kTδ(t). 3.2. Весовая функция: w(t)=kδ(t)+kTδ’(t). 5.3. Динамические звенья второго порядка 5.3.1. Апериодическое (инерционное) звено второго порядка Примерами апериодических звеньев второго порядка можно назвать: двигатель постоянного тока, электромашинный усилитель, электрические RLC- цепи, пассивные RLC- фильтры и др. Уравнение звена: (T22s2 + T1s +1)y(t) = ku(t) при T1> 2T2. Если разложить дифференциальный оператор левой части уравнения на сомножители, то его можно записать в виде: (T3s + 1)(T4s +1)y(t) = ku(t) или [T3 T4 s2 + (T3 +T4)s + 1]y(t) = ku(t), где эквивалентные постоянные времени равны T3, 4 = T2 T2 ± 2 − T12 . 2 4 2 T2 = T3T4 ; T1 = (T3 + T4 ). При этом T3T4 = T2 ; Передаточная функция звена: k  W s = ( ) ; 2 2  T2 s + T1 s + 1   k ; W ( s ) = (T3 s + 1)(T4 s + 1)  k  W ( s ) при T1 = 2T2 = 2  ( Ts 1 ) +  3. Временные характеристики апериодического звена второго порядка (рис. 5.13): Рис. 5.13. Временные характеристики апериодического звена 2 порядка: а – переходная; б – весовая 5.3.2. Колебательное звено Уравнение динамики колебательного дифференциальным уравнением второго порядка звена d 2 y (t ) dy (t ) T + 2ξT + y (t ) = ku (t ) , 2 dt dt 2 описывается (5.4) где k – коэффициент усиления, ξ - параметр затухания (0 < ξ < 1). Чем больше ξ, тем быстрее затухают колебания. Если ξ = 0, то затухание отсутствует (консервативное звено – без потерь). Постоянная времени T (в секундах) определяет инерционность объекта, чем она больше, тем медленнее изменяется выход при изменении входа. Если в передаточной функции звена второго порядка вида W (s) = k , T2 s + T1 s + 1 2 знаменатель имеет комплексно-сопряженные корни (то есть, T12 – 4T2 < 0), то, как известно из теории дифференциальных уравнений, свободное движение такой системы содержит гармонические составляющие (синус, косинус), что дает колебания выхода при изменении входного сигнала. Несложно представить передаточную функцию колебательного звена в форме W (s) = k T s + 2Tξs + 1 2 2 При ξ = 0 имеем передаточную функцию консервативного звена, которое дает незатухающие колебания на выходе. Если ξ ≥ 1, модель (5.4) представляет апериодическое звено второго порядка, то есть последовательное соединение двух апериодических звеньев. Колебательное звено относится к позиционным звеньям, его статический коэффициент усиления равен W(0) = k. Изображения по Лапласу импульсной колебательного звена соответственно имеют вид W ( s) = k , (T s + 2ξTs + 1) H (s) = 2 2 и переходной функций 1 k . 2 2 s (T s + 2ξTs + 1) Обратный переход к оригиналам временных функций дает следующие выражения их для импульсной функции 1 − ξ2 t w(t ) = sin T T 1 − ξ2 kξ и переходной функции t T 1 − ξ2 1 − ξ2 ξ h(t ) = k[1 − e (cos t+ t )] . sin 2 T T 1− ξ − Графики переходной h(t) и импульсной w(t) характеристик приведены на рис. 5.14 а, б соответственно. Рис. 5.14. Переходная и импульсная характеристики колебательного звена Переходная и импульсная характеристики отличаются выраженной колебательностью, особенно при малых значениях параметра затухания ξ (см. графики на рис. 5.14). В разделе 4 мы уже рассматривали способ оценки коэффициентов полинома знаменателя системы второго порядка по двум параметрам. Его применение к изложенному материалу студентами и курсантами университета, безусловно, будет способствовать самостоятельному изучению цифровых технологий, применяемых в вычислительной среде MATLAB для решения практических задач. Лекция. 19 марта_А 1. ОБЩИЕ СВЕДЕНИЯ О СИСТЕМАХ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ И ИХ КЛАССИФИКАЦИЯ 1.1. Основные понятия и определения Теория автоматического управления (ТАУ) появилась во второй половине 19 века сначала как теория регулирования. Широкое применение паровых машин вызвало потребность в регуляторах, то есть в специальных устройствах, поддерживающих устойчивый режим работы паровой машины. Это дало начало научным исследованиям в области управления техническими объектами. Оказалось, что результаты и выводы данной теории могут быть применимы к управлению объектами различной природы с различными принципами действия. В настоящее время сфера ее влияния расширилась на анализ динамики таких систем, как экономические, социальные и т.п. Поэтому прежнее название “Теория автоматического регулирования” заменено на более широкое название − “Теория автоматического управления”. Управление каким-либо объектом (объект управления на схемах будем обозначать ОУ) есть воздействие на него в целях достижения требуемых состояний или процессов [1]. В качестве ОУ может служить самолет, станок, электродвигатель и т.п. Управление объектом с помощью технических средств без участия человека называется автоматическим управлением. Соответственно, автоматическая система - это система, работающая без участия человека. В автоматизированных системах рутинные операции (сбор и анализ информации) выполняет компьютер, но управляет всей системой человек-оператор, который и принимает решения. Мы будем далее изучать, в основном, только автоматические системы. Совокупность ОУ и средств автоматического управления называется системой автоматического управления (САУ). Задачи систем управления. Автоматические системы управления применяются для решения трех типов задач: • стабилизация, то есть поддержание заданного режима работы, который не меняется длительное время (задающий сигнал - постоянная, часто нуль); • программное управление - управление по заранее известной программе (задающий сигнал меняется, но заранее известен); • слежение за неизвестным задающим сигналом. К системам стабилизации относятся, например, авторулевые на кораблях и судах (поддержание заданного курса), системы регулирования частоты и напряжения генераторов электроэнергии на судах и береговых электростанциях и др. • • • • • Системы программного управления широко используются при управлении перегрузочными процессами в портах, выполнении грузовых операций в нефтеналивных терминалах. Системы программного управления находят также применение в бытовой технике, например, в стиральных машинах, кухонных комбайнах, программируемых мультиварках – скороварках и др. Следящие системы используются: в технических комплексах автоматизации судовождения, для автоматического движения судов по траекториям, заданным по электронным навигационным картам; в системах дистанционного управления режимами работы главных и вспомогательных двигателей на судах; в промышленных роботах для лазерной резки металлов; при изготовлении корпусных конструкций на судостроительных и судоремонтных заводах; в системах безэкипажного и беспилотного управления морскими подвижными объектами и летательными аппаратами и др. Широкое применение прецизионные следящие системы нашли применение в медицине. Они также применяются в приводах при передаче команд через линии связи, например, через internet. Особый класс следящих систем используется на мобильных объектах военной техники. 1.2. Основные элементы систем управления В задачах управления всегда есть два объекта – управляемый и управляющий. Управляемый объект обычно называют объектом управления или просто объектом, а управляющий объект – регулятором. Например, при управлении частотой вращения объект управления – это двигатель (электромотор, турбина); в задаче стабилизации курса корабля – корабль, погруженный в воду; в задаче поддержания уровня громкости – динамик. Регуляторы могут быть построены на разных принципах. Самый распространенный из первых механических регуляторов – центробежный регулятор Уатта, служащий для стабилизации частоты вращения паровой машины (на рис.1.1 справа). Рис. 1.1. Центробежный регулятор Уатта Как видно из рисунка, когда частота вращения вала турбины увеличивается, грузы расходятся под действием увеличивающейся центробежной силы. При этом через систему рычагов прикрывается заслонка, уменьшая поток пара на турбину (рис.1.1), что вызывает уменьшение частоты ее вращения. Регулятор температуры в бытовом холодильнике или термостат – это устройство, которое регулирует температуру в холодильной камере путем включения или отключения электродвигателя фреоновой установки, обеспечивающей режим охлаждения. Во многих современных системах используются цифровые регуляторы, построенные на микропроцессорах и специальных «бортовых» компьютерах. Они успешно управляют самолетами и космическими кораблями без участия человека. Современный автомобиль также буквально «напичкан» управляющей электроникой и компьютерной техникой, ориентированной на применение технологии беспилотного управления. Обычно регулятор действует на объект управления не прямо, а через исполнительные механизмы (приводы), которые могут усиливать и преобразовывать сигнал управления, например, электрический сигнал может «превращаться» в перемещение клапана, регулирующего расход топлива, или в поворот пера руля на некоторый заданный угол. Чтобы регулятор мог «правильно реагировать» на то, что фактически происходит с объектом, нужны датчики. С помощью», что фактически происходит с объектом, нужны датчики. С помощью датчиков чаще всего измеряются те характеристики объекта, которыми нужно управлять. Кроме того, качество управления можно улучшить, если получать дополнительную информацию – измерять «внутренние свойства» объекта. 1.3. Структура системы управления Итак, в типовую структурную схемы системы управления входят объект, регулятор, привод и датчики. Однако, набор этих элементов – еще не система. Для превращения в систему нужны каналы связи, через них идет обмен информацией между элементами. Для передачи информации могут использоваться электрический ток, сжатый воздух (пневматические системы), жидкость под давлением (гидравлические системы), компьютерные сети. Взаимосвязанные элементы – это уже система, которая обладает (за счет связей) особыми свойствами, которых нет у отдельных элементов и любой их комбинации. Основная сложность управления связана с тем, что на объект действует окружающая среда – внешние возмущения, которые «мешают» регулятору выполнять поставленную задачу. Большинство возмущений заранее непредсказуемы, то есть носят случайный характер. Кроме того, датчики измеряют параметры не точно, а с некоторой ошибкой, пусть и малой. В этом случае говорят о «шумах измерений» по аналогии с шумами в радиотехнике, которые искажают сигналы. Таким образом, обобщенная структурная схема системы управления примет вид [1]: Рис. 1.2. Упрощенная структурная схема управления курсом корабля Например, в системе управления курсом судна (рис. 1.2) • объект управления – это сам корабль, находящийся в воде; для управления его курсом используется руль, изменяющий направление потока воды; • регулятор – цифровая вычислительная машина (компьютер); • привод – рулевое устройство, которое усиливает управляющий электрический сигнал и преобразует его в поворот руля; • датчики – измерительная система, определяющая фактический курс; • внешние возмущения – это морское волнение и ветер, отклоняющие корабль от заданного курса; • шумы измерений – это ошибки датчиков. Информация в системе управления передается циклически: регулятор выдает сигнал управления на привод, который воздействует непосредственно на объект; затем информация об объекте через датчики возвращается обратно к регулятору и все начинается заново. Это стало возможным благодаря обратной связи, с помощью которой регулятор использует информацию о состоянии объекта для выработки управления. Системы с обратной связью называют замкнутыми, поскольку информация передается по замкнутому контуру. Регулятор сравнивает задающий сигнал («задание», «уставку» или «желаемое значение») с сигналами обратной связи от датчиков и определяет рассогласование (ошибку управления) – разницу между заданным и фактическим состояниями. Если оно равно нулю, никакого управления не требуется. Если разница есть, регулятор выдает управляющий сигнал, который стремится свести рассогласование к нулю. Поэтому схему регулятора во многих случаях можно изобразить так (рис. 1.3): Рис. 1.3. Схема регулятора с обратной связью Такая схема показывает управление по ошибке (или по отклонению). Это значит, что для того, чтобы регулятор начал действовать, нужно, чтобы управляемая величина отклонилась от заданного значения. В простейшем случае, сигнал рассогласования вырабатывается путем вычитания сигнала обратной связи (измеренное значение) из задающего сигнала. Можно ли управлять объектом так, чтобы не было ошибки? В реальных системах – нет. Прежде всего, из-за внешних воздействий и шумов, которые заранее неизвестны. Кроме того, объекты управления обладают инерционностью, то есть, не могут мгновенно перейти из одного состояния в другое. Возможности регулятора и приводов, определяемые мощностью сигнала управления всегда ограничены. Поэтому быстродействие системы управления (время перехода на новый режим) также ограничено. Например, при управлении судном угол перекладки руля обычно не превышает 30 − 35°, это ограничивает время изменения курса. Мы рассмотрели вербальное (словесное, без математического аппарата) описание режима работы системы, когда обратная связь используется для того, чтобы уменьшить ошибку между заданным и фактическим состоянием объекта управления. Такая обратная связь называется отрицательной, потому что сигнал обратной связи вычитается из задающего сигнала. Может ли быть наоборот? Оказывается, да. В этом случае обратная связь называется положительной, она увеличивает рассогласование, то есть, стремится «раскачать» систему. На практике положительная обратная связь применяется, например, в генераторах для поддержания незатухающих электрических колебаний, а также накопления энергии в системе. Разомкнутые системы управления. В отличие от замкнутых в разомкнутых системах регулятор не получает никакой информации о реальном состоянии объекта, поэтому должно быть точно известно, как этот объект себя ведет. Только тогда можно заранее рассчитать, как им нужно управлять (построить нужную программу управления). Однако при этом нельзя гарантировать, что задание будет выполнено. Такие системы называют системами программного управления или разомкнутыми системами, поскольку информация передается не по замкнутому контуру, а только в одном направлении (рис. 1.4). Отсюда ясно, что без обратной связи (информации с датчиков) невозможно учесть влияние неизвестных факторов, неполноту наших знаний. Рис. 1.4. Разомкнутая система управления Несмотря на эти недостатки, разомкнутые системы применяются на практике. Например, при перегрузке сыпучих материалов (песка, щебня, угля и др.) в порту с помощью крана оператор управляет электроприводами замыкания грейфера, его подъема и поворота стрелы, которые могут не содержать обратные связи. Поэтому «обратная связь» обеспечивается самим оператором, что позволяет ему перемещать грейфер по заданной траектории и реализовать циклическую работу крана. Такое управление возможно только в тех случаях, когда время пуска и торможения двигателей будет существенно меньше времени работы приводов в цикле. Другим примером может служить простейшая система управления двигателем, в которой не требуется очень точно поддерживать частоту вращения. На фоне современных систем управления разомкнутые системы являются самыми простыми. Контрольные вопросы по разделам 1.1 – 1.3. 1. Что называется управлением? 2. Что называется автоматическим управлением? 3. Что называется системой автоматического управления? 4. Что является основной задачей автоматического управления? 5. Что называется объектом управления? 6. Что называется управляемой величиной? 7. Что называется управляющим органом? 8. Что называется чувствительным элементом? 9. Что такое входная и выходная величины? 10. Что называется управляющим воздействием? 11. Что называется возмущением? 12. Что называется отклонением от заданной величины? 13. Что называется управляющим устройством? 14. Назвать основные элементы замкнутой системы управления. 15. В чем сущность обратной связи в системе управления объектом? 16. В чем преимущество замкнутых систем от разомкнутых? 1.4. Классификация систем автоматического управления Каждая автоматическая система состоит из целого ряда блоков или звеньев, различно соединенных между собой. Каждое отдельно взятое звено имеет вход и выход (рис. 1.5, а) в соответствии со стрелками на рис. 1.3, обозначающими воздействие или передачу информации с одного звена на другое. В общем случае звено может иметь несколько входов и выходов. Входная величинах x1, и выходная х2 могут иметь любую физическую природу (ток, напряжение, перемещение, температура, освещенность и т. п.). Рис. 1.5. Звено (а) и его статическая характеристика (б) В связи с этим по количеству входов и выходов различают • одномерные системы, у которых один вход и один выход (они рассматриваются в так называемой классической теории управления); • многомерные системы, имеющие несколько входов и./или выходов (главный предмет изучения современной теории управления). В данном разделе изучаются только одномерные системы, где и объект, и регулятор имеют один входной и один выходной сигнал. Например, при управлении кораблем по курсу можно считать, что есть одно управляющее воздействие (поворот руля) и одна регулируемая величина (курс судна). Однако, в действительности, это не совсем верно. Дело в том, что при изменении курса меняется также крен и дифферент корабля. В одномерной модели мы пренебрегаем этими изменениями, хотя они могут быть очень существенными. Например, при резком повороте крен может достигнуть недопустимого значения. С другой стороны, для управления можно использовать не только руль, но и различные подруливающие устройства, стабилизаторы качки и т.п., то есть объект имеет несколько входов. Таким образом, реальная система управления курсом – многомерная. Исследование многомерных систем – достаточно сложная задача и выходит за рамки этого пособия. Поэтому в инженерных расчетах стараются иногда упрощенно представить многомерную систему как несколько одномерных, и довольно часто такой метод приводит к успеху. В процессе работы автоматической системы величины x1 и х2 изменяются во времени. Динамика процесса преобразования сигнала в данном звене описывается, как правило, дифференциальным матричным уравнением (или экспериментально снятой характеристикой), связывающим выходную переменную х2 с входной переменной x1. Совокупность уравнений и характеристик всех звеньев определяет динамику системы в целом. Существуют различные характеристики звеньев: статические, переходные, импульсные, частотные и др. Далее все они будут изучены. Основными признаками деления автоматических систем на большие классы по характеру внутренних динамических процессов являются следующие: • непрерывность или дискретность (прерывистость) динамических процессов во времени; • линейность или нелинейность уравнений, описывающих динамику процессов управления. По первому признаку автоматические системы делятся на системы непрерывного действия, системы дискретного действия (импульсные и цифровые) и системы релейного действия. По второму признаку каждый из указанных классов, кроме релейного, делится на системы линейные и нелинейные. Системы же релейного действия относятся целиком к категории нелинейных систем. Дадим определение каждого класса автоматических систем. Системой непрерывного действия или непрерывной системой называется такая система, в каждом из звеньев которой непрерывному изменению входной величины во времени соответствует непрерывное изменение выходной величины. При этом закон изменения выходной величины во времени может быть различным, в зависимости от формы изменения входной величины и от вида уравнения динамики (или характеристики) звена. Чтобы автоматическая система в целом была непрерывной, необходимо, прежде всего, чтобы статические характеристики всех звеньев системы были непрерывными. Примеры непрерывных статических характеристик показаны на рис. 1.6. Рис. 1.6. Примеры непрерывных статических характеристик Системой дискретного действия, или дискретной системой называется такая система, в которой хотя бы в одном звене при непрерывном изменении входной величины выходная величина изменяется не непрерывно, а имеет вид отдельных импульсов, появляющихся через некоторые промежутки времени (рис. 1.7). Рис. 1.7. Графики изменения входной (а) и выходной (б) величин в дискретной системе Звено, преобразующее непрерывный входной сигнал в последовательность импульсов, называется импульсным элементом или импульсным модулятором. Если последующее звено системы тоже дискретное, то для него не только выходная, но и входная величина будет дискретной (импульсной). К дискретным автоматическим системам относятся импульсные системы (т.е. системы с импульсным элементом), а также системы с цифровыми вычислительными устройствами. Системой релейного действия или релейной системой называется такая система, и которой хотя бы в одном звене при непрерывном изменении входной величины выходная величина в некоторых точках процесса, зависящих от значения входной величины, изменяется скачком. Такое звено называется релейным звеном. Статическая характеристика релейного звена имеет точки разрыва, как показано в разных вариантах на рис. 1.8. Обратимся теперь ко второму признаку классификации автоматических систем. Линейной системой называется такая система, поведение всех звеньев которой вполне описывается линейными уравнениями (алгебраическими и дифференциальными или разностными). Для этого необходимо, прежде всего, чтобы статические характеристики всех звеньев системы были линейными, т. е. имели вид прямой линии (рис. 1.6, а и б). Рис. 1.8. Примеры релейных статических характеристик Если динамика всех звеньев системы описывается обыкновенными линейными дифференциальными (и линейными алгебраическими) уравнениями с постоянными коэффициентами, то систему называют обыкновенной линейной системой. Если в уравнении динамики какого-либо звена линейной системы имеется хотя бы один или несколько переменных во времени коэффициентов, то получается линейная система с переменными параметрами. Если какое-либо звено описывается линейным уравнением в частных производных (например, имеют место волновые процессы в трубопроводе или электрической липни), то система будет линейной системой с распределенными параметрами. В отличие от этого обыкновенная системой с сосредоточенными линейная система является параметрами. Если динамика какого-либо звена системы описывается линейным уравнением с запаздывающим аргументом, т. е. звено обладает чисто временным запаздыванием или временной задержкой τ передачи сигнала (рис. 1.9), то система называется линейной системой с запаздыванием. Динамика линейных импульсных систем описывается линейными разностными уравнениями. Рис. 1.9. Динамика линейной системы с временным запаздыванием Нелинейной системой называется такая система, в которой хотя бы в одном звене нарушается линейность статической характеристики или же имеет место любое другое нарушение линейности уравнений динамики звена (произведение переменных или их производных, корень, квадрат или более высокая степень переменной, любая другая нелинейная связь переменных и их производных). Следовательно, к нелинейным системам относятся, в частности, все системы, в звеньях которых имеются статические характеристики любого из многих видов, показанных на рис. 1. 6, в − 1. 6, е. К ним же относятся и все релейные характеристики (рис. 1.8). Нелинейными могут быть, разумеется, также системы с переменными параметрами, с распределенными параметрами, с запаздыванием, импульсные и цифровые системы, если в них где-либо нарушается линейность уравнений динамики. При исследовании, расчете и синтезе автоматических систем нужно иметь в виду, что наиболее полно разработаны теория и различные прикладные методы для обыкновенных линейных и линейных дискретных систем. Поэтому в интересах простоты расчета всегда желательно (там, где это допустимо) сводить задачу к такой форме, чтобы максимально использовать методы исследования таких систем. Обычно уравнения динамики всех звеньев системы стараются привести к обыкновенным линейным, и только для некоторых звеньев, где это недопустимо или где специально вводится особое линейное или нелинейное звено, учитываются эти особые их свойства. Стационарные и нестационарные системы. Для управления очень важен вопрос о том, изменяются ли характеристики объекта со временем. Системы, в которых все параметры остаются постоянными, называются стационарными, что значит «не изменяющиеся во времени». В этом пособии рассматриваются только стационарные системы. Системы, в которых параметры объекта или регулятора изменяются со временем, называются нестационарными. Например, летящая ракета расходует топливо и за счет этого ее масса изменяется. Таким образом, ракета – нестационарный объект. Хотя теория нестационарных систем существует, применить ее на практике не так просто. Детерминированные и стохастические системы. Самый простой вариант – считать, что все параметры объекта определены (заданы) точно, так же, как и внешние воздействия. В этом случае правильно говорить о детерминированных системах, которые рассматривались в классической теории управления. Тем не менее, в реальных задачах точных данных у нас нет. Прежде всего, это относится к внешним воздействиям. Например, для исследования качки судна на волнении можно считать, что волна имеет форму синусоиды, амплитуда и частота которой известна. Это детерминированная модель. Так ли это на практике? Естественно нет. С помощью такого подхода можно получить только приближенные, грубые результаты. По современным представлениям форма волны приближенно описывается как сумма синусоид, которые имеют случайные, то есть неизвестные заранее, частоты, амплитуды и фазы. Помехи, шум измерений – это тоже случайные сигналы. Системы, в которых действуют случайные возмущения или параметры объекта могут изменяться случайным образом, называются стохастическими (вероятностными). Теория стохастических систем позволяет получать только вероятностные результаты. Например, нельзя гарантировать, что отклонение судна от курса всегда будет составлять не более 2°, но можно попытаться обеспечить такое отклонение с некоторой вероятностью (вероятность 99% означает, что требование будет выполнено в 99 случаях из 100). Оптимальные системы. Часто требования к системе можно сформулировать в виде задачи оптимизации. В оптимальных системах регулятор строится так, чтобы обеспечить минимум или максимум какого-то критерия качества. Нужно помнить, что выражение «оптимальная система» не означает, что она действительно идеальная. Все определяется принятым критерием – если он выбран удачно, система получится хорошая, если нет – то наоборот. Адаптивные системы. Если параметры объекта или возмущений известны неточно или могут изменяться со временем (в нестационарных системах), применяют адаптивные или самонастраивающиеся регуляторы, в которых закон управления меняется при изменении условий. В простейшем случае (когда есть несколько заранее известных режимов работы) происходит простое переключение между несколькими законами управления. Часто в адаптивных системах регулятор оценивает параметры объекта в реальном времени и соответственно изменяет закон управления по заданному правилу. Самонастраивающаяся система, которая пытается настроить регулятор так, чтобы «найти» максимум или минимум какого-то критерия качества, называется экстремальной (от слова экстремум, обозначающего максимум или минимум). К интеллектуальным системам можно отнести системы, построенные на цифровых технологиях с использованием нейронных сетей, систем нечеткого вывода (FUZZY-систем), адаптивных сетей ANFIS, а также инструментов численной оптимизации производственных и технологических процессов. Интеллектуальные системы позволяют управлять объектами на качественно новом уровне, поскольку они основаны на применении механизмов хранения и обработки знаний, что позволяет учитывать изменение целей в условиях случайных внешних возмущений, обеспечивать обработку накопленного опыта и пополнение на этой платформе знаний, осуществлять прогноз развития событий и др. В настоящее время интеллектуальные системы создаются для управления крупными промышленными объектами, применяются для интеллектуального управления подвижными объектами и транспортными системами, используются при создании средств и методов управления интеллектуальными роботами в медицине, на транспорте, в агропромышленном комплексе, при разработке бытовой техники. 2. ЛИНЕЙНЫЕ НЕПРЕРЫВНЫЕ МОДЕЛИ САУ 2.1. Модели линейных систем Для описания линейных систем могут применяться несколько способов представления моделей, основанных на дифференциальных уравнениях во временной, либо частотной областях: • модели в пространстве состояний; • модели в форме передаточных функций, составленных с помощью преобразования Лапласа; • модели вида «нули-полюса». Модели в пространстве состояний предназначены для описания поведения систем во временной области. Передаточные функции и модели вида «нули-полюса» относятся к частотным способам описания, так как непосредственно связаны с частотными характеристиками системы. Частотные методы позволяют применять для анализа и синтеза алгебраические методы, что значительно упрощает расчеты. С другой стороны, для автоматических вычислений более пригодны методы, основанные на моделях в пространстве состояний, поскольку для инвариантных во времени систем они приводятся к стандартной форме, допускающей применение объектно-ориентированного программирования в современных вычислительных средах, упрощающего работу с динамическими моделями высокой размерности. 2.1.1. Дифференциальные уравнения динамики Исходные уравнения динамики объектов строятся на основе законов физики и имеют вид нелинейных дифференциальных уравнений, порядок производных у которых выше первого. Для приближенного анализа и синтеза обычно проводят их линеаризацию в окрестности установившегося режима и получают линейные дифференциальные уравнения. Обыкновенное дифференциальное уравнение n-го порядка можно записать в следующей форме d n y (t ) d n −1 y (t ) d m u (t ) d m −1u (t ) an + a n −1 + ... + a0 y (t ) = bm + bm −1 + ...b0 u (t ) , (2.1) dt n dt n −1 dt m dt m −1 где u(t) – входной сигнал, y(t) – сигнал выхода, а a i , b j , ( i = 0, 1, ..., n; j = 0, 1, ..., m ) − параметры модели, подлежащие идентификации. Для большинства реальных физически реализуемых систем управления m ≤ n . Для описания конкретного переходного процесса к дифференциальному уравнению (2.1) добавляются условия однозначности − начальные условия, задающие значения выходной величины и ее (n -1) производных d i y (0) , i = 0, 1,…, n-1 dt i в нулевой момент времени. Если ввести обозначение s для оператора дифференцирования s=d/dt, то можно записать (3.1) в операторной форме для нулевых начальных условий: (an s n + an−1 s n−1 + ... + a1 s + a0 ) y (t ) = (bm s m + bm−1 s m−1 + ...b1 s + b0 )u (t ) или A(s)y(t) = B(s)u(t), (2.2) где A(s)=ansn+an-1sn-1+ …+a1s + a0, B(s)=bnsn+bn-1sn-1+ …+b1s + b0 − операторные полиномы. виде Например, уравнение y + 2 y + 3 y = 4u + 5u может быть представлено в (s2+2s+3)y = (4s+5)u или A(s)y(s)=B(s)u(s), где A(s)=s2+2s+3 и B(s)=4s+5. Запись sy(s) внешне выглядит как «умножение» оператора s на сигнал y(s), но на самом деле соответствует дифференцированию сигнала, выполняемому в операторной форме (в области изображений). 2.1.2. Передаточные функции Из выражения (2.2) можно получить операторное выражение y (t ) B ( s ) = = W (s) u (t ) A( s ) в виде отношения двух полиномов, представленных в форме изображений по Лапласу. Это отношение является передаточной функцией системы (ПФ). Согласно определению, передаточная функция W(s) линейной стационарной системы представляет собой отношение выходного сигнала к входному в операторной форме при нулевых начальных условиях W ( s) = ∞ где Y (s) , U (s) (2.3) ∞ Y ( s ) = ∫ y (t )e dt , U ( s ) = ∫ u (t )e − st dt . − st Передаточная функция звена, которое описывается выше приведенным в примере уравнением, равна W (s) = 4s + 5 , s + 2s + 3 2 то есть, совпадает с отношением операторных полиномов B(s)/A(s) при переходе к комплексной переменной s. Передаточная функция в среде MATLAB вводится в виде отношения двух многочленов (полиномов) от комплексной переменной s. Полиномы хранятся как массивы коэффициентов, записанных по убыванию степеней. Например, передаточная функция W ( s) = вводится следующим образом >> num=[2 4] 2s + 4 s 3 + 1.5 s 2 + 1.5 s + 1 num = 2 4 >> den=[1 1.5 1.5 1] d= 1.0000 1.5000 1.5000 1.0000 >> w=tf(num,den) Transfer function: 2s+4 ------------------------s^3 + 1.5 s^2 + 1.5 s + 1 или сразу, без предварительного построения числителя и знаменателя: >> w=tf([2 4],[1 1.5 1.5 1]); В памяти создается объект класса tf, описывающий передаточную функцию. Точка с запятой в конце команды подавляет вывод на экран. 2.1.3. Модели вида «нули-полюса» По передаточной функции можно легко построить модель в форме «нули-полюса» >> w_zpk = zpk(w) Zero/pole/gain: 2 (s+2) ----------------------(s+1) (s^2 + 0.5s + 1) Нулями называются корни числителя, полюсами – корни знаменателя. Эта функция имеет один нуль в точке s =−2 и три полюса в точках s =−1 и s =-0.25±0.968i. Покажем это >> pole(w) ans = -1.0000 + 0.0000i -0.2500 + 0.9682i -0.2500 - 0.9682i >> zero(w) ans = -2 Как видно из полученных результатов, квадратному трехчлену соответствует пара комплексных полюсов. При известной модели передаточной функции w статический коэффициент усиления (gain) ks вычисляется в MATLAB с помощью команды >> k=dcgain(w) 2.1.4. Модели в пространстве состояний Динамические процессы, наряду с дифференциальным уравнением n-го порядка (3.1), также можно описать совокупностью n дифференциальных уравнений первого порядка: n m dy i = ∑ aij y j + ∑ bij u j , i=1, 2,…n. (2.4) dt j =1 j =1 Введем в рассмотрение n независимых переменных x1, x2, …, xn, из множества x(t ) ∈ R n , называемых переменными состояния и представим уравнение (2.4) в виде системы дифференциальных уравнений первого порядка x= a11 x1 + a12 x2 + ... + a1n xn + b11u1 + b12u2 + ... + b1mum 1 x= a21 x1 + a22 x2 + ... + a2 n xn + b21u1 + b22u2 + ... + b2 mum 2 . ...... ... ... ... ... ... ... x= an1 x1 + an 2 x2 + ... + ann xn + bn1u1 + bn 2u2 + ... + bnmum n (2.5) Эти уравнения, как и уравнение (2.1), полностью характеризуют состояние объекта в любой момент времени и называются уравнениями состояния. Связь между переменными состояния системы при наличии одного выхода y(t) и отсутствии влияния входа непосредственно на выход, т.е. в простейшем случае, определяется алгебраически уравнением (2.6) y=c1x1 + c2x2 +…+ cnxn . Обычно уравнения (2.5) и (2.6) записываются в стандартной векторноматричной форме Коши: dX (t ) = AX (t ) + BU (t ), x(t 0 ) = x0 , t ≥ t 0 dt (2.7) Y (t ) = CX (t ) + DU (t ) где: X(t)=[x1(t) x2(t) … xn(t)]T − вектор-столбец переменных состояния размерностью [n×1]; A – матрица состояния размерностью [n×n]; U(t)=[u1(t) u2(t) … um(t)] − вектор входов размерностью [m×1]; B – матрица входов размерностью [n×m]; Y(t)=[y1(t) y2(t) … yk(t)]T – вектор-столбец выходов размерностью [k×1]; C – матрица выходов (наблюдений) размерностью [k×n]; D − матрица связи «вход-выход» размерностью [ k × m]. Представление системы (2.7) в пространстве состояний называется моделью системы, в которой первое уравнение (матричное дифференциальное) задает поведение системы во времени и называется уравнением динамики, второе (алгебраическое) устанавливает связь выходной величины с вектором состояний и со входом и называется уравнением наблюдения. В динамических моделях с одним входом и одним выходом или SISO (Single Input Single Output) уравнения состояния SISO-системы по форме ничем не отличаются от уравнений многомерных систем (2.7). Различие их состоит только в размерности переменных и матриц. В таких моделях вектор Х(t) имеет размерность [п×1], матрица А – размерность [п×n], матрица В – размерность [n×1]; U(t) представляет собой скалярный сигнал u(t) управления (входной сигнал); вектор Y(t) имеет размерность [k×1]; матрица С – размерность [1×n]; матрица D – размерность [n×1] (часто полагают D = 0). Уравнения в пространстве состояний модели SISO-системы в матричной форме можно записать::  x1 (t )   a11 a12 ... a1n   x1   b1          d  x 2 (t )  a 21 a 22 ... a 2 n   x 2  b2  = ⋅ + u (t ) dt  ...   ... ... ... ...   ...   ...           x n (t ) a n1 a n 2 ... a nn   x n  bn   x1  x  Y (t ) = [c1 c 2 ... c n ] 2  .  ...     xn  С учетом воздействия внешней среды, при наличии входной аддитивной помехи v(t) и погрешностей измерения η ( t ) базовая формулировка модели имеет вид: dX (t ) = AX (t ) + Bu (t ) + V (t )v(t ), x(t 0 ) = x0 , t ≥ t 0 dt (2.8) Y (t ) = CX (t ) + Du (t ) + η(t ) где, помимо рассмотренных ранее величин, также присутствуют: v(t) ‒ k мерный вектор случайных воздействий − помех; V ( t ) − матрица размерностью [n×k ], описывающая канал прохождения помехи; η ( t ) − p -мерный вектор шумов измерения. Воздействия v(t) и η(t) часто полагаются гауссовскими случайными процессами. Рассмотренная модель (2.8) может быть представлена следующей структурной схемой в пространстве состояний: Рис. 2.1. Структура модели динамической системы в пространстве состояний; ∫ - матричный интегратор Если матрицы A(t), B(t), C(t), D(t) не зависят от времени t, то система называется стационарной. В вычислительной среде MATLAB такие системы отнесены к классу LTI-систем (Time Invariant Systems), что в переводе означает «инвариантные во времени системы», т.е. системы с постоянными численными значениями элементов матриц. В динамических системах практически всегда D(t)=0. Такая система называется собственной или строго реализуемой. Для преобразования передаточной функции в модель в пространстве состояний используется команда >> w_ss=ss(w) a= x1 x1 x2 x3 -1.5 -0.1875 -0.03125 x2 8 x3 4 b= u1 x1 0.5 x2 0 x3 0 c= x1 x2 x3 y1 0 0.5 0.25 d= u1 y1 0 Это означает, что матрицы модели имеют вид − 1.5 − 0.1875 − 0.03125 0.5  B= 0  A =  8 ,   , C = [0 0.5 0.25] , D = 0 .   0  4  0 Переход в MATLAB в режим среды LTI с помощью оператора ss позволяет динамическую модель представить инвариантным во времени объектом. Для того чтобы создать в MATLAB объект, заданный структурой (2.7) в пространстве состояний, воспользуемся оператором ss (от State Space – пространство состояний). Его входными параметрами служат матрицы А, B, C, D системы. Пример. Объект второго порядка описывается уравнениями x1 = −2 x1 + x2 , x 2 = 3 x1 − 5 x2 + 4u , y = x1 + 7 x2 Им соответствуют следующие матрицы модели в пространстве состояний: − 2 1  A= ,  3 − 5 0  B= ,  4 C = [1 7] , D=0. Чтобы создать объект модели sys, согласно требованиям синтаксиса ss, следует записать: >>A=[-2, 1;3, -5]; B=[0;4]; C=[1,7]; D=0; sys=ss(A,B,C,D). Модель в пространстве состояний можно построить не для всех передаточных функций, а только для правильных функций, у которых степень числителя не выше, чем степень знаменателя. Например, передаточная функция 2s 2 + 3s + 1 W (s) = s+5 – неправильная, она не может быть преобразована в модель в пространстве состояний поскольку модель технически не может быть реализована.. Используют также понятие строго правильной функции, у которой степень числителя меньше, чем степень знаменателя. Если построить модель в пространстве состояний для такой функции, матрица D будет равна нулю, то есть, прямая передача сигнала входа на выход будет отсутствовать. 2.2. Взаимосвязь передаточной функции объекта с его моделью в пространстве состояний Используя преобразование Лапласа, можно построить передаточную функцию для модели объекта в пространстве состояний x (t ) = A ⋅ x(t ) + B ⋅ u (t ) y (t ) = C ⋅ x(t ) + D ⋅ u (t ). Напомним, что здесь u(t), y(t) и x(t) обозначают, соответственно, вектор входа, выхода и состояния объекта. Преобразуя левые и правые части каждого уравнения по Лапласу (переходя к изображениям сигналов по Лапласу при нулевых начальных условиях), получаем s ⋅X(s) = A⋅X(s) + B⋅U(s) Y(s) = C⋅X(s) + D⋅U(s) . Так как уравнения в операторной форме становятся алгебраическими, то в первом уравнении можно перенести все члены, зависящие от X(s), в левую часть: (s⋅I – A) ⋅X(s) = B⋅U(s), где I − единичная матрица, элементы на главной диагонали которой равны единицам, а все остальные элементы − нули. Умножая обе части последнего равенства на (s∙I - A)-1, получим выражение для X(s): X(s) = (s⋅I – A)-1 ⋅ B⋅U(s). Чтобы определить передаточную функцию, изображений выхода и входа, используя (2.3): W ( s) = Y ( s) = C ⋅ ( s ⋅ I − A) −1 ⋅ B + D . U ( s) найдем отношение (2.9) Обратный переход от передаточной функции к модели в пространстве состояний в среде MATLAB производится с помощью оператора ss2tf в такой последовательности: 1. Воспользуемся примером, приведенным в предыдущем разделе, передаточной функцией 2s + 4 W (s) = 3 s + 1.5 s 2 + 1.5 s + 1 с Для создания объекта w_ss в пространстве состояний на основе числителя и знаменателя приведенной передаточной функции применим оператор ss: W_ss=ss(w); в результате получим: W_ss = A= x1 x2 x3 x1 -1.5 -1.5 -1 x2 1 x3 1 B= u1 x1 2 x2 0 x3 0 C= x1 x2 x3 y1 0 1 2 D= u1 y1 0 >> 2. Теперь извлечем матрицы a, b, c, d из объекта w_ss в пространстве состояний в режиме прямых вычислений: >> a=w_ss.A a= -1.5000 -1.5000 -1.0000 1.0000 0 1.0000 >> b=w_ss.B b= 2 >> c=w_ss.C c= 1 2 >> d=w_ss.D d= 3. Наконец, соблюдая синтаксис оператора ss2tf, получим полиномы числителя num1 и знаменателя den1 передаточной функции новой модели, эквивалентной по динамическим свойствам w_ss: >> [num1, den1] = ss2tf(a,b,c,d,1) num1 = 2 4 den1 = 1.0000 1.5000 1.5000 1.0000 Нетрудно видеть, что элементы полиномов равны полиномам числителя и знаменателя исходной передаточной функции. Обратный переход, от передаточной функции к модели в пространстве состояний, более сложен и неоднозначен. Дело в том, что каждой передаточной функции соответствует бесчисленное множество моделей в пространстве состояний. Одну из них можно найти следующим образом. Для передаточной функции a2 s 2 + a1 s + a0 W (s) = d + 3 , s + b2 s 2 + b1 s + b0 где d, ai (i = 0,1,2) и bi (i = 0,1,2) − постоянные коэффициенты, модель в пространстве состояний задается матрицами  0 A =  0 − b0 1 − b1 1  ,  − b2  0  B = 0 , 1 C = [a0 a1 a2 ] , D = d. (2.10) При увеличении порядка передаточной функции (степени ее знаменателя), эти матрицы расширяются. В нижней строке матрицы A записываются коэффициенты знаменателя с обратным знаком, над главной диагональю − единицы, а остальные элементы − нули. В матрице B только самый последний элемент − единица, а остальные − нули. Наконец, матрица С строится из коэффициентов числителя передаточной функции. Отметим, что модель, заданную неправильной передаточной функцией (у которой степень числителя больше степени знаменателя) нельзя представить в пространстве состояний. Рассмотрим простой объект, модель которого задана в пространстве состояний матрицами 3 − 0.5 A= , 0  4 1 B= , 0  C = [1 0.25], D=0. Используя формулу (2.9), мы можем получить −1   s 0 3 − 0.5  1 s +1   = 2 − W ( s ) = C ( sI − A) B + D = [1 0.25]  .   0   0 s − 3s + 2  0 s   4 Данный результат можно получить в среде MATLAB, используя в качестве аргумента передаточной функции tf(sysA) модель sysA данного объекта, заданной с помощью оператора ss в пространстве состояний: >> A=[3 -0.5;4 0]; B=[1;0]; C=[1 0.25]; D=0; >> sysA=ss(A,B,C,D) sysA = A= x1 x2 x1 3 -0.5 x2 4 B= u1 x1 1 x2 0 C= x1 x2 y1 1 0.25 D= u1 y1 0 Continuous-time state-space model. >> W=tf(sysA) W= s+1 ------------s^2 - 3 s + 2 Continuous-time transfer function. Теперь выполним обратный переход. По формулам (2.10) сразу находим матрицы 1 ~ 0 A= , − 2 − 3 ~ 0  B =  , 1 ~ C = [1 1] , ~ D =0. Заметим, что эти матрицы отличаются от исходных, однако если найти передаточную функцию по формулам (2.9), мы получим тот же самый результат. Это говорит о том, что одной и той же передаточной функции могут соответствовать разные модели в пространстве состояний. Если известна одна такая модель с матрицами A, B, C и D, то все остальные модели могут быть получены по формулам ~ A = PAP −1 , ~ ~ B = PB, C = CP −1 , ~ D = D, где P − некоторая обратимая матрица (ее определитель должен быть ненулевым). При таком преобразовании передаточная функция не меняется. Фактически мы переходим к другому вектору состояния x'(t), который связан с исходным зависимостью x'(t) = P ∙ x(t). Легко проверить, что в данном случае нужное линейное преобразование выполняет матрица 0 0.25 P= . 0  1 Внимательно посмотрев на функцию W(s), можно заметить, что ее числитель и знаменатель имеют одинаковый множитель s+1, который можно сократить. Таким образом, W (s) = 1 . s+2 Для этой передаточной функции модель в пространстве состояний выглядит так: A = -2, B = 1, C = 1, D = 0. Вместо исходной модели второго порядка (два уравнения, две переменные состояния) мы получили модель первого порядка. Что же произошло? Оказалось, что при нулевых начальных условиях состояние объекта определяется одной переменной, а зависимость между входом и выходом системы − одним уравнением первого порядка. Поэтому произошло сокращение числителя и знаменателя передаточной функции. Если нас интересует только связь входа и выхода (а не внутренние сигналы в объекте) и начальные условия нулевые, можно использовать модель первого порядка. Однако при ненулевых начальных условиях нужно использовать исходную модель в пространстве состояний, потому что передаточная функция дает неполную информацию. Это особенно важно при анализе устойчивости системы. 2.3. Применение MATLAB для определения изображений и оригиналов функций в операторном методе Выше было отмечено, что операторный метод позволяет перевести решение поставленной задачи из области функций во временной области f(t)оригиналов – в область их изображений F(s). Благодаря получению алгебраических уравнений, обеспечиваемого путем перехода к их изображениям, решение становится более простым. Алгебраические уравнения, содержащие также начальные условия, затем решаются относительно искомых переменных. Полученное решение в области изображений затем вновь переводится в область оригиналов, т. е. во временную область. Основная трудность в использовании операторного метода расчета переходных процессов состоит в необходимости решения уравнения ∞ F ( s ) = ∫ f (t ) ⋅ e − st dt для широкого класса функций f(t). Обычно такие решения представляются таблицами преобразований Лапласа. Конечно, для ряда простых функций интеграл может быть определен обычными методами интегрирования, изучаемыми в учебных курсах интегрального исчисления. Однако такое решение может быть получено не всегда. К тому же оно, как правило, связано с необходимостью проведения громоздких преобразований и других рутинных операций. Не всегда могут оказаться под рукой таблицы преобразований Лапласа. Во всех ситуациях при наличии компьютера и системы MATLAB для расчета переходных процессов операторным методом целесообразно использовать пакет символьной математики. Таким образом, исключается потребность в применении таблиц преобразования Лапласа. В пакете символьной математики для нахождения преобразования Лапласа функции f(t) необходимо использовать оператор laplace (f), где f − математическое выражение функции во временной области. Для перехода от изображений к оригиналам применяется оператор ilaplace (F(s)). Получим с помощью пакета символьной математики операторные соотношения на основе преобразования Лапласа для некоторых наиболее часто встречающихся функций. В таблице 2.1. приведены решения для изображений и оригиналов четырнадцати различных функций f(t), при t ≥ 0. Таблица 2.1. № п/п Символьные функции преобразования Лапласа Операторная форма и оригинал функции syms alf fi t A a n b w 1. 2. 3. 4. 5. 6. F1=A*laplace(t^0) F1 = A/s f1=ilaplace(F1) f1 = A F2=laplace(t) F2 = 1/s^2 f2=ilaplace(F2) f2 = t F3=laplace(t^5)/prod([1:5]) F3 = 1/s^6 f3=ilaplace(F3) f3 = 1/120*t^5 F4=laplace(exp(-a*t)) F4 = 1/(s+a) f4=ilaplace(F4) f4 = exp(-a*t) F5=laplace(t*exp(-a*t)) F5 = 1/(s+a)^2 f5=ilaplace(F5) f5= t*exp(-a*t) F6=laplace(1/2*t^2*exp(-a*t)) F6 = 1/(s+a)^3 f6=ilaplace(F6) f6 = 1/2*t^2*exp(-a*t) F7=laplace(1/(b-a)*(exp(-a*t)-exp(-b*t))) Fa7=simplify(F7) 7. pretty(Fa7) F7 = 1/(b-a)*(1/(s+a)-1/(s+b)) Fa7 = 1/(s+a)/(s+b) 1 --------------(s + a) (s + b) f7=ilaplace(F7) f7 = 1/(b-a)*(exp(-a*t)-exp(-b*t)) F8=laplace((1-a*t)*exp(-a*t)) F8 = 1/(s+a)-a/(s+a)^2 8. Fa8=simplify(F8) Fa8 = s/(s+a)^2 8=ilaplace(Fa8) f8 = (1-a*t)*exp(-a*t) F9=laplace(1/(b-a)*(b*exp(-b*t)- F9 = 1/(b-a)*(b/(s+b)-a/(s+a)) - a*exp(-a*t))) Fa9=simplify(F9) Fa9 = s/(s+b)/(s+a) s pretty(Fa9) 9. 10. 11. --------------(s + b) (s + a) f9=ilaplace(Fa9) f9 =1/(b-a)*(b*exp(-b*t)-a*exp(a*t)) F10=laplace(sin(w*t)) F10 = w/(s^2+w^2) Fa10=simplify(F10) Fa10 = w/(s^2+w^2) f10=ilaplace(Fa10) f10 = w/(w^2)^(1/2)*sin((w^2)^(1/2)*t) F11=laplace(cos(w*t)) F11 = s/(s^2+w^2) f11=ilaplace(F11) F12=laplace(exp(-a*t)*sin(w*t+0.1)) f11 =cos((w^2)^(1/2)*t) F12 = ((s+a)*sin(1/10)+ + w*cos(1/10))/((s+a)^2+w^2) f12=ilaplace(F12) 12. f12 = exp(-a*t)*cos(1/10)*sin(w*t)+ +exp(-a*t)*sin(1/10)*cos(w*t) fa12=simplify(f12) fa12 = exp(-*t)*cos(1/10)*sin(w*t)+ +exp(-a*t)*sin(1/10)*cos(w*t) 13. 14. F13=laplace(cosh(a*t)) F13 = s/(s^2-a^2) f13=ilaplace(F13) f13 =cos((-a^2)^(1/2)*t) F14=laplace(1/sqrt(pi*t)) F14 = 1/s^(1/2) f14=ilaplace(F14) f14 = 1/(pi*t)^(1/2) В первом столбце таблицы указан порядковый номер функции. Во втором столбце содержится оператор syms, который используется для объявления символьных величин. Изображения получаются с помощью функции laplace, а переход от изображений к оригиналам осуществляется посредством ilaplace. Результаты вычислений, выполненных в среде MATLAB, представлены в соответствующих строках третьего столбца таблицы. Кроме функций перехода от оригиналов к изображениям и обратно, в некоторых позициях использованы simplify, pretty и другие операторы, о назначении которых упоминалось ранее. Результаты выполненных преобразований с помощью этих функций также представлены в соответствующих строках третьего столбца. Например, под порядковым номером 9 (первый столбец) следует функция f (t ) = 1 ⋅ b ⋅ e −bt − a ⋅ e − at , b−a ( ) которая, согласно синтаксису оператора laplace, записана в круглых скобках искомого изображения F9 (второй столбец)  1  F 9 = laplace ⋅ (b ⋅ exp(− b ⋅ t ) − a ⋅ exp(− a ⋅ t )) .  (b − a )  Компьютерный вариант преобразования F9 представлен в этой же строке (третий столбец): F9 = 1  b a  ⋅ − . b−a s+b s+a Чтобы упростить эти выражения, введена функция Fa9 (второй столбец): Fa9 = simply(F9). Результат упрощений приведен в той же строке (третий столбец): Fa9 = s/((s+b)/(s+a). Наконец, применение функции pretty (второй столбец): pretty(Fa9) позволило получить (см. третий столбец) s . ( s + b)( s + a ) Для самостоятельного изучения пакета символьной математики с рассмотренными примерами расчета переходных процессов в электрических цепях мы рекомендуем учебное пособие: Королев В.И., Сахаров В.В., Шергина О.В. Оценка параметров, моделирование динамических систем и электрических цепей в среде MatLAB: Учеб. пособие. – СПб.: СПГУВК, 2006. – 272 c. 3. СТРУКТУРНЫЕ СХЕМЫ САУ И СПОСОБЫ ИХ ПРЕОБРАЗОВАНИЯ 3.1. Основные теоретические положения Для наглядного представления сложной системы как совокупности элементов и связей между ними используются структурные схемы. Структурной схемой называется схема САУ, изображенная в виде соединения динамических звеньев с заданными передаточными функциями. Структурная схема представляет построение автоматической системы, наличие внешних воздействий и точки их приложения, пути распространения воздействий и выходную величину. Для изображения элементов и связей схемы используются стандартные представления. Каждое динамическое звено изображается прямоугольником, в котором указывается передаточная функция звена или ее математическое выражение. Воздействия на систему и влияние звеньев друг на друга (сигналы) изображаются стрелками. В каждом звене воздействие передается только от входа звена к его выходу. Поскольку на динамическое звено может воздействовать лишь одна входная величина, то используются блоки суммирования и сравнения сигналов (принадлежащих одной и той же физической природе). Структурная схема может быть составлена по уравнению системы в пространстве состояний или по дифференциальным уравнениям системы. При составлении структурной схемы удобно начинать с изображения задающего воздействия и располагать динамические звенья, составляющие прямую цепь системы, слева направо до регулируемой величины. Тогда основная обратная связь и местные обратные связи будут направлены справа налево. Различные способы преобразования структурных схем облегчают определение передаточных функций сложных САУ и дают возможность привести многоконтурную систему к эквивалентной ей одноконтурной схеме. 3.2. Основные правила преобразования структурных схем Преобразование структурной схемы должно осуществляться на основании правил. Правила преобразования структурных схем можно найти в справочной литературе [1,2], основные из них приведены в табл. 3.1. Таблица 3.1. Основные правила преобразования структурных схем Преобразование Свертывание последовательного соединения Свертывание параллельного соединения Свертывание обратной связи Перенос узла через звено вперед Перенос узла через звено назад Перенос сумматора через звено вперед Перенос сумматора через звено назад Структурная схема Исходная Эквивалентная W=W1W2…Wn W=W1 + W2 +… +Wn W = W1 1 ± W1W2 Перенос прямой связи через звено Перенос узла через сумматор вперед Перенос узла через сумматор вперед При выполнении преобразований следует каждое имеющееся в схеме типовое соединение заменить эквивалентным звеном. Затем можно выполнить перенос точек разветвления и сумматоров, чтобы в преобразованной схеме образовались новые типовые соединения звеньев. Эти соединения опять заменяются эквивалентными звеньями, затем вновь может потребоваться перенос точек разветвления и сумматоров и т. д. В электромеханике преобразование структурных схем широко используется для построения систем подчиненного регулирования в электроприводах различного назначения. Пример 3.1. Пусть необходимо получить эквивалентное представление для структуры, приведенной на рис. 3.1. Рис. 3.1. Исходная структура САУ Приведем исходную схему к эквивалентному представлению через поэтапное ее упрощение с использованием правил преобразования структурных схем (см. рис. 3.2 – рис. 3.5). Рис. 3.2. Перенос узла через сумматор Рис. 3.3. Свертывание обратной связи и последовательного соединения Рис. 3.4. Свертывание обратной связи и параллельного соединения Рис. 3.5. Свертывание последовательного соединения Таким образом, первый способ преобразования структурных схем заключается в непосредственном использовании правил, приведенных в табл. 3.1. Неудобство использования этого подхода заключается в том, что порядок применения формул здесь достаточно произволен, возможны ошибочные шаги, усложняющие поиск решения. Чтобы исключить ошибки при выполнении структурных преобразований, мы будем использовать функции MATLAB (см. раздел 3.4). Лекция. 24 марта_А. 6. ЧАСТОТНЫЕ ХАРАКТЕРИСТИКИ ДИНАМИЧЕСКИХ ЗВЕНЬЕВ 6.1. Частотные характеристики простейших звеньев 6.1.1. Пропорциональное звено (усилитель) Передаточная функция: W(p) = k. Частотные характеристики: • Амплитудно-фазовая частотная характеристика (АФЧХ): W(j ) = k; • Вещественная часть частотной характеристики: P(ω) = k; • Мнимая часть частотной характеристики: Q(ω) = 0; • Амплитудно-частотная характеристика (АЧХ): A(ω) = k; • Фазочастотная характеристика (ФЧХ): φ(ω) = 0; • Логарифмическая АЧХ (ЛАЧХ): L(ω) = 20lgk. Некоторые ЧХ показаны на рис. 6.1. Рис. 6.1 АФЧХ и ЛАЧХ безынерционного звена Звено пропускает все частоты одинаково c увеличением амплитуды в k раз и без сдвига по фазе. В качестве характерных примеров безынерционного звена можно привести такие элементы как делитель напряжения, редуктор, усилитель. 6.1.2. Интегрирующее звено Передаточная функция: W (s) = k . s Рассмотрим частный случай, когда k = 1, то есть W(s) = 1/s. АФЧХ: W ( jω) = 1 1 1 = − j = e − jπ / 2 . ω ω jω Вещественная и мнимая части ЧХ соответственно равны: P(ω) = 0; Q(ω) = - 1/ω; АЧХ: A(ω) = W ( jω) = 1/ ω ; ФЧХ: ϕ(ω) = arg W ( jω) = −π / 2 . ЛАЧХ: L(ω) = 20lg(1/ω) = - 20lg(ω). Частотные характеристики показаны на рис. 6.2. Все частоты звено пропускает с запаздыванием по фазе на 90о. Амплитуда выходного сигнала увеличивается при уменьшении частоты, и уменьшается до нуля при росте частоты (звено "заваливает" высокие частоты). Рис. 6.2. АФЧХ и ЛЧХ интегрирующего звена График логарифмической амплитудно-частотной характеристики представляет собой прямую, пересекающую ось абсцисс L(ω) = 0 на частоте ω=1. При увеличении частоты на декаду ордината уменьшается на 20lg10=20дБ, то есть наклон ЛАЧХ равен -20 дБ/дек (децибел на декаду). 6.1.3. Дифференцирующее звено Передаточная функция: W(s) = ks. АФЧХ: π 2 W ( jω) = jkω = kω ⋅ e . Вещественная и мнимая части ЧХ соответственно равны: P(ω) = 0; Q(ω) = kω; АЧХ: A(ω) = kω; ФЧХ: φ(ω) = π/2. ЛАЧХ: ЛФЧХ: L(ω) = 20lg(kω); φ(ω) = π/2. Частотные характеристики показаны на рис. 6.3. Рис. 6.3. АФЧХ и ЛЧХ дифференцирующего звена Все частоты звено пропускает с опережением по фазе на 90о. Логарифмическая амплитудная частотная характеристика дифференцирующего звена − прямая с наклоном 20 дБ/дек, пересекающая ось 1 абсцисс Lm(ω) = 0 на частоте ω = . При ω = 1 ЛАЧХ равна Lm(1) = 20lg k . k Дифференцирующее звено подавляет низкие частоты (производная от постоянного сигнала равна нулю) и бесконечно усиливает высокочастотные сигналы, что требует бесконечной энергии, которую невозможно получить в физически реализуемых системах. Фазовая характеристика не зависит от частоты, звено дает положительный сдвиг фазы на 90°. Действительно, при дифференцировании сигнала x(t)=sin(ωt) получаем y(t) = cos(ωt) = sin(ωt + 90°) . Дифференцирующее звено реагирует не на изменение самой входной величины, а на изменение ее производной, то есть на тенденцию развития событий. Поэтому говорят, что дифференцирующее звено обладает упреждающим, прогнозирующим действием. С его помощью можно ускорить реакцию системы. 6.2. Частотные характеристики звеньев первого порядка 6.2.1. Апериодическое (инерционное) звено Передаточная функция: W ( s ) = k . Ts + 1 При k = 1 получаем следующие выражения ЧХ: W (s) = 1 ; Ts + 1 W ( jω) = ωT 1 − j ωT 1 1 = = −j ; 2 2 j ω T + 1 1 + ( j ωT ) 1 + ( ωT ) 1 + (ωT ) 2 Вещественная и мнимая части ЧХ соответственно равны: P(ω) = 1 ; 1 + ( ωT ) 2 Q(ω) = − ωT ; 1 + ( ωT ) 2 АЧХ и ФЧХ соответственно равны: A(ω) = A1 1 = ; A2 1 + ( ωT ) 2 φ(ω) =φ1-φ2 = - arctg(ωT); L(ω) = 20lgA(ω) = - 10lg(1 + (ωT)2). Здесь: A1 и A2 – амплитуды (модули) числителя и знаменателя W(jω); φ1 и φ2 − аргументы числителя и знаменателя W(jω). Графики АФЧХ и ЛЧХ показаны на рис. 6.4. Для каждой частоты ω значение W(jω) − это точка на комплексной плоскости. При изменении ω от 0 до ∞, графиком W(jω) является кривая, которая называется годографом (диаграммой) Найквиста (рис. 6.4, а). а) б) Рис. 6.4. АФЧХ и ЛЧХ апериодического звена первого порядка Годограф начинается (на нулевой частоте ω=0) в точке (1; j0) и заканчивается в начале координат при ω→∞. АФЧХ есть полуокружность радиусом 1/2 с центром в точке P=1/2. При построении асимптотической ЛАЧХ считают, что при ω<ω1=1/T можно пренебречь (ωT)2 выражении для L(ω), то есть L(ω) ≈-10lg1=0. При ω>ω1 пренебрегают единицей в выражении в скобках, то есть L(ω) ≈ 20lg(ωT). Поэтому ЛАЧХ проходит вдоль оси абсцисс до сопрягающей частоты, затем − под наклоном -20 дБ/дек. Частота ω1 называется сопрягающей частотой. Максимальное отличие L(ω) реальных ЛАЧХ от L(ω) асимптотических ЛАЧХ не превышает 3 дБ при ω = ω1. ЛФЧХ асимптотически стремится к нулю при уменьшении ω до нуля (чем меньше частота, тем меньше искажения сигнала по фазе) и к φ(ω)=-π/2 при возрастании ω до бесконечности. Перегиб в точке ω=ω1 при φ(ω) = -π/4. Частотные характеристики всех апериодических звеньев имеют одинаковую форму и могут быть построены по типовой кривой с параллельным сдвигом, как вдоль оси частот, так и вдоль оси амплитуд. В частности, если k>1, то АФЧХ и ЛЧХ примут вид (рис. 6.5): Рис. 6.5. АФЧХ и ЛЧХ апериодического звена с усилением k Здесь годограф начинается (на нулевой частоте) в точке (k; 0) и заканчивается в начале координат, где ω→∞. На низких частотах ЛАЧХ имеет нулевой наклон (так как звено позиционное), причем в этой области Lm ≈ 20 lgk. На высоких частотах наклон ЛАЧХ равен -20 дБ/дек, так как степень знаменателя передаточной функции на единицу больше степени ее числителя. Фазовая характеристика меняется от 0 до - 90°, причем на сопрягающей частоте ос она равна -45°. Поскольку ЛАЧХ уменьшается на высоких частотах, апериодическое звено подавляет высокочастотные шумы, то есть обладает свойством фильтра низких частот. 6.2.2. Инерционно-дифференцирующее звено В технике не могут использоваться физически нереализуемые звенья. Поэтому важно рассмотреть аналогичное звено, которое выполняет дифференцирование низкочастотных сигналов и одновременно имеет ограниченное усиление на высоких частотах. Инерционное дифференцирующее звено или реальное дифференцирующее звено имеет передаточную функцию W (s) = ks . Ts + 1 При k = 1 получаем следующие выражения ЧХ: s W (s) = ; Ts + 1 ω 2T ω jω jω(1 − jωT ) = = +j W ( jω) = ; 2 2 jωT + 1 ( jωT ) + 1 (ωT ) + 1 (ωT ) 2 + 1 Вещественная и мнимая части ЧХ соответственно равны: ω ω 2T Q(ω) = P(ω) = ; 2 ; 1 + ( ωT ) 2 1 + (ωT ) АЧХ и ФЧХ соответственно равны: A(ω) = A1 ω = ; A2 1 + ( ωT ) 2 ϕ(ω) = ϕ1 − ϕ 2 = π − arctg (ωT ) ; 2 L(ω) = 20lg(A(ω)) = 20lg(ω) − 10lg(1+(ωT)2). Фактически оно представляет последовательное соединение идеального дифференцирующего и апериодического звеньев. Апериодическое звено добавляет инерционность: обладая свойствами фильтра низких частот, оно ограничивает усиление на высоких частотах. Поскольку передаточная функция имеет равные степени числителя и знаменателя, на высоких частотах (выше сопрягающей частоты ωс=1/T) ЛАЧХ имеет нулевой наклон, поэтому неограниченного роста коэффициента усиления не происходит (рис. 6.6). Одновременно теряется точность дифференцирования, так как фазовая характеристика изменяется от 90° до нуля. Графики АФЧХ и ЛЧХ реального дифференцирующего звена представлены на рис. 6.6 а, б соответственно. а) б) Рис. 6.6. Логарифмические частотные характеристики реального дифференцирующего звена При внешней схожести годографов реального дифференцирующего и инерционного звеньев их отличие состоит в том, что начало (на нулевой частоте) и конец (при ω→ω) годографа реального дифференцирующего звена соответствует теперь концу и началу годографа инерционного звена (см. рис. 6.4 и рис. 6.6). 6.3. Частотные характеристики звеньев второго порядка 6.3.1. Апериодическое звено второго порядка Апериодическое звено 2-го порядка имеет уравнение динамики в операторной форме (T22s2 + T1s + l)y = kx при T1 ≥ 2T2. Физический смысл последнего неравенства заключается в том, что потери энергии в звене очень велики и колебания в нем не возникают. Апериодическое звено может быть представлено как два последовательно включенных звена первого порядка. Уравнения передаточной фазочастотные характеристики записываются выражениями: W (s) = АЧХ: ФЧХ: ЛАЧХ: функции, а также амплитудно- и апериодического звена 2-го порядка k . T s + T1 s + 1 A(ω) = 2 2 2 k (1 − ω 2T22 ) 2 + ω 2T12 , ωT1 1   − arctg 1 − ω 2T 2 , ω ≤ T 1 2 ϕ(ω) ωT1 1 . − π + arctg ω ≥ ,  T1 1 − ω 2T22 L(ω) = 20 lg A(ω) = 20 lg [ k (1 − ω2T22 ) 2 + (ωT1 ) 2 = ] = 20 lg k − 10 lg (1 − ω2T22 ) 2 + (ωT1 ) 2 . Графики АФЧХ и ЛАЧХ апериодического звена второго порядка представлены на рис. 6.7 а, б соответственно. а) б) Рис. 6.7. Графики АФЧХ (а) и ЛАЧХ (б) апериодического звена второго порядка К апериодическому звену второго порядка относится нагревательные установки, отопительные печи, сушильные агрегаты, теплицы, животноводческие помещения и т.п. 6.3.2. Колебательное звено Колебательное звено - это звено второго порядка с передаточной функцией вида W (s) = k , T s + 2Tξs + 1 2 2 (6.1) где k - коэффициент, T − постоянная времени (в секундах), ξ − параметр затухания (0 < ξ < 1). Постоянная времени определяет инерционность объекта, чем она больше, тем медленнее изменяется выход при изменении входа. Чем больше ξ, тем быстрее затухают колебания. Если ξ ≥ 1, модель (6.1) представляет апериодическое звено второго порядка, то есть последовательное соединение двух апериодических звеньев. Колебательное звено относится к позиционным звеньям, его статический коэффициент усиления равен W(0) = k . Асимптотическая ЛАЧХ колебательного звена до сопрягающей частоты ω1 = 1/T1 совпадает с осью абсцисс, при дальнейшем увеличении частоты идет с наклоном - 40 дБ/дек, так как степень знаменателя передаточной функции на два больше степени ее числителя (рис. 6.7). То есть высокие частоты колебательное звено "заваливает" сильнее, чем апериодическое звено. На низких частотах она имеет нулевой наклон (так как звено позиционное), причем в этой области Lm = 20 lg k. Фазовая характеристика меняется от 0 до -180°, причем на сопрягающей частоте ωс она равна - 90°. Рис. 6.8. АФЧХ и ЛАЧХ колебательного звена При значениях ξ < 0,5 ЛАЧХ имеет так называемый «горб» в районе сопрягающей частоты, причем его высота увеличивается с уменьшением ξ. Это означает, что при частоте входного сигнала, равной ωс, наблюдается резонанс, то есть частота возмущения совпадает с частотой собственных колебаний системы. Точную кривую можно построить, воспользовавшись кривыми отклонений, которые приводятся в справочниках. Рассмотрим пример построения ЛАЧХ колебательного звена в стандартной форме с передаточной функцией, полученной по двум параметрам: частоте ω=4 рад/с и коэффициенту ξ=0.4. Коэффициенты полиномов передаточной функции >> num=16; den=[1 3.2 16]; % передаточная функция >> sys1=tf(num,den) sys1 = 16 ---------------s^2 + 3.2 s + 16 Построение амплитудной и выполним с помощью функции bode: фазовой частотных характеристик >> bode(sys1),grid. Рис. 6.9. Логарифмические частотные характеристики На рис. 6.9 представлены характеристики системы sys1, полиномы которой получены с помощью функции [num, den] = ord2(Wn,Z) , где Wn=4 и Z=0.4. Полином числителя увеличен до значения Wn2 =16, чтобы в установившемся режиме коэффициент передачи был равен единице. В предельном случае ξ=0 получаем консервативное звено, у которого при ω ≈ ω1 амплитуда выходных колебаний стремится к бесконечности (рис. 6.10). Рис. 6.10. Графики АФЧХ и ЛАЧХ консервативного звена При уменьшении коэффициента затухания (демпфирования) АФЧХ приближается к оси абсцисс и в пределе у консервативного звена она вырождается в два луча по оси абсцисс, при этом фаза выходных колебаний скачком меняется от нуля до -180o при переходе через сопрягающую частоту (рис. 6.10). Покажем это на конкретном примере. Для преобразования колебательной системы sys1 в консервативную положим ξ=0. Тогда система преобразуется к виду >> sys2=tf(16,[1 0 16]), sys2 = 16 -------s^2 + 16 В результате, получим консервативную непрерывную во времени систему. Характеристики sys2 построены с помощью функции >> bode(sys2), grid и представлены на рис. 6.11. Образование импульса объясняется тем, что в системе sys2 на частоте ω=4 рад/с возникает резонанс, при котором (j*4)^2= 16. Знаменатель комплексного коэффициента передачи стремится к нулю, а амплитуда выходного сигнала − к бесконечности. На резонансной частоте фаза выходного сигнала изменяется скачком. Bode Diagram 150 Magnitude (dB) 100 50 -50 Логарифмическая амплитудная характеристика -100 Phase (deg) -45 -90 Логарифмическая фазовая характеристика -135 -180 10 -1 10 10 1 10 2 Frequency (rad/s) Рис. 6.11. Логарифмические амплитудная и фазовая частотные характеристики консервативной системы Если на вход консервативной системы никакие сигналы не подаются, то в системе устанавливаются гармонические колебания; обмен между накопителями производится лишь той энергией, которая определяется только ненулевыми начальными условиями. Выполняется условие сохранения (консервации) энергии. Название «консервативное» означает, что в звене не рассеивается и не накапливается энергия. 6.4. Правила построения частотных характеристик элементарных звеньев При построении ЧХ некоторых звеньев можно использовать “правило зеркала”: при k = 1 ЛАЧХ и ЛФЧХ звеньев с обратными передаточными функциями зеркальны относительно горизонтальной оси. Так на рис. 6.12 изображены ЧХ идеального дифференцирующего и идеального форсирующего звеньев. Рис. 6.12. Иллюстрация «правило зеркала» Если k ≠ 1, то передаточную функцию звена можно рассматривать как произведение W = k∙W1, где W1 - передаточная функция с k = 1. При этом амплитуда вектора АФЧХ W(jω) при всех значениях φ должна быть увеличена в k раз, то есть A(ω) = kA1(ω). Поэтому, например, центр полуокружности АФЧХ апериодического звена будет находиться не в точке P = 1/2, а в точке k/2. ЛАЧХ также изменится: L(ω) = 20lgA(ω) = 20lgkA1(ω) = 20lgk + 20lgA1(ω). Поэтому при k ≠ 1 ЛАЧХ звена нужно поднять по оси ординат не меняя ее формы на 20lgk. На ЛФЧХ изменение k никак не отразится. Рис. 6.13. ЛАЧХ апериодического звена с усилением Для примера на рис. 6.13 приведены частотные характеристики апериодического звена при k =10 и T = 1c. При этом ЛАЧХ апериодического звена с k=1 поднята вверх на 20lg10 = 20. Контрольные вопросы по разделу 6 1. Что называется частотными характеристиками? 2. Как получить частотные характеристики опытным путем? 3. Как получить частотные характеристики теоретическим путем по известной передаточной функции звена? 4. Что такое и как получить АФЧХ? 5. Что такое и как получить ВЧХ? 6. Что такое и как получить МЧХ? 7. Что такое и как получить АЧХ? 8. Что такое и как получить ФЧХ? 9. Что такое и как получить ЛАЧХ? 10. Что такое и как получить ЛФЧХ? 11. Как построить годограф АФЧХ? 12. Постройте АФЧХ, ЛАЧХ и ЛФЧХ безынерционного звена. 13. Постройте АФЧХ, ЛАЧХ и ЛФЧХ интегрирующего звена. 14. Постройте АФЧХ, ЛАЧХ и ЛФЧХ апериодического звена. 15. Постройте АФЧХ, ЛАЧХ и ЛФЧХ колебательного звена. 16. Постройте АФЧХ, ЛАЧХ и ЛФЧХ консервативного звена. 17. Постройте ЛАЧХ и ЛФЧХ идеального дифференцирующего звена. 18. Постройте ЛАЧХ и ЛФЧХ идеального форсирующего звена. 19. Как изменятся ЛАЧХ и ЛФЧХ звена, если коэффициент усиления возрастет в 100 раз? 20. Для чего служит правило зеркала. 7. УСТОЙЧИВОСТЬ СИСТЕМ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 7.1. Основные понятия и определения устойчивости системы Под устойчивостью системы понимается способность ее возвращаться к состоянию установившегося равновесия после снятия возмущения, нарушившего это равновесие. Система, которая сама возвращается в исходное положение равновесия, называется устойчивой. Неустойчивая система непрерывно удаляется от равновесного состояния или совершает вокруг него колебания с возрастающей амплитудой. Как видно из рис. 7.1 возможны следующие состояния равновесия: • Устойчивое равновесие, когда шарик находится в положении А: если немного сдвинуть его с места, он скатится обратно в ямку. • Неустойчивое равновесие, когда положение шарика на любой из вершин Б или В является неустойчивым, так как при малейшем сдвиге в сторону шарик скатывается с вершины. • Нейтральное равновесие, когда шарик находится в положениях Г и Д − при небольшом смещении он остается в новом положении (но не удаляется непрерывно). При этом говорят, что система нейтрально устойчива, то есть, находится на границе устойчивости. Рис. 7.1. Иллюстрация возможных состояний системы Известно несколько определений устойчивости, которые отличаются некоторыми деталями. Если рассматривается только выход системы при различных ограниченных входах, говорят об устойчивости «вход-выход». Чтобы система не «пошла вразнос», управляемая (выходная) величина не должна расти неограниченно при ограниченных входных сигналах. Если это так, говорят, что система обладает устойчивостью «вход-выход» (при ограниченном входе выход также ограничен). Кроме того, часто изучают устойчивость автономной системы, на которую не действуют внешние сигналы (все входы нулевые). В этом случае положением равновесия называют состояние системы, которая находится в покое, то есть, сигнал выхода y(t) − постоянная величина, и все его производные равны нулю. Предполагается, что систему вывели из положения равновесия (задали ненулевые начальные условия) и «отпустили». Система, которая сама возвращается в исходное положение равновесия, называется устойчивой. Если выходная координата остается ограниченной (не уходит в бесконечность), система называется нейтрально устойчивой, а если выход становится бесконечным − неустойчивой. Если при этом рассматривается только выход системы (а не ее внутренние сигналы), говорят о «технической устойчивости» (или устойчивости по выходу). Говоря о внутренней устойчивости, рассматривают не только выход, но и все внутренние переменные, описывающие состояние системы. Эти переменные, иначе, вектор состояния x(t) можно найти как решение уравнения движения системы dx(t ) = f ( x, t ) dt (7.1) при заданных начальных условиях x0 = x(0). Формальное определение внутренней устойчивости было введено в работах русского математика и механика А.М. Ляпунова (1857-1918), поэтому такое понятие устойчивости принято называть устойчивостью по Ляпунову. Для простоты рассмотрим систему первого порядка, с одной переменной состояния x(t). Система называется устойчивой по Ляпунову в положении равновесия x*, если при начальном отклонении x0 от положения равновесия x* не более, чем на δ, траектория движения отклоняется от x* не более, чем на ε (рис. 7.2), причем для каждого ε можно найти соответствующее ему δ(ε): |x0 – x*| < δ → |x(t) – x*| < ε при всех t > 0. (7.2) Фактически это означает, что чем меньше начальное отклонение, тем меньше траектория движения отклоняется от положения равновесия. x(t) x0 δ ε x* t Рис. 7.2. Устойчивость по Ляпунову Если кроме того вектор состояния стремится к положению равновесия, то есть, |x(t) - x*| → 0 при t →∞ , (7.3) система называется асимптотически устойчивой в положении равновесия x*. Заметим, что выполнение условия сходимости (7.3) не гарантирует устойчивость по Ляпунову, например, в сложных нелинейных системах, в которых несмотря даже на большой «выброс» в траектории движения, эта траектория сходится к точке равновесия. Очевидно, что асимптотическая устойчивость – более строгое требование. Положения равновесия, которые устойчивы по Ляпунову, но не асимптотически устойчивы, иногда называются нейтрально устойчивыми (маятник без трения, ванна с водой). Положение равновесия неустойчиво, если для него не выполняется условие устойчивости Ляпунова. Это значит, что существует такое ε > 0, что траектория x(t) выходит за границы области x(t) − x* > ε при сколь угодно малом отклонении начального состояния x0 от положения равновесия x*. Например, система переходит в другое положение равновесия, или x(t) неограниченно возрастает. 7.2. Свободная и вынужденная составляющие уравнения динамики В соответствии с классическим методом решение дифференциального уравнения (7.1) ищется в виде: y(t) = yвын(t) + yсв(t). (7.4) Здесь yсв(t) − общее решение однородного дифференциального уравнения, то есть уравнения с нулевой правой частью: any(n) + an-1y(n-1) + ... + a)y + a0 = 0. Физически это означает, что все внешние воздействия сняты и система абсолютно свободна, ее движения определяются лишь собственной структурой. Поэтому решение данного уравнения называется свободной составляющей общего решения. Составляющая yвын(t) в (7.4) представляет собой частное решение неоднородного дифференциального уравнения, под которым понимается уравнение с ненулевой правой частью. Физически это означает, что к системе приложено внешнее воздействие u(t). Поэтому вторая составляющая общего решения называется вынужденной. Она определяет вынужденный установившийся режим работы системы после окончания переходного процесса. Можно провести аналогию между САУ и пружиной, колебания которой описываются аналогичным дифференциальным уравнением (рис. 7.3). Рис. 7.3. Пружина с аналогичным САУ дифференциальным уравнением Оттянем пружину, а затем отпустим, предоставив ее самой себе. Пружина будет колебаться в соответствии со свободной составляющей решения уравнения, то есть характер колебаний будет определяться только упругими свойствами самой пружины. Если в момент времени t=0 подвесить к пружине груз, то на свободные колебания наложится внешняя сила Р. После затухания колебаний, описываемых только свободной составляющей общего решения, система перейдет в новый установившийся режим, характеризуемый вынужденной составляющей yвын=y(t→ ∞). Если внешнее воздействие само будет изменяться по синусоидальному закону P = P0sin(ωt + φ), то после затухания переходного процесса система будет совершать вынужденные колебания с той же частотой, что и вынуждающая сила, то есть yвын = ymaxsin(ωt + φ). Каждая составляющая общего решения уравнения динамики ищется отдельно. Вынужденная составляющая ищется на основе решения уравнения статики для данной системы для времени t → ∞. Свободная составляющая представляет собой сумму из n отдельных составляющих: n yсв (t ) = ∑ Ai e pi ⋅t , i =1 (7.5) где pi корни характеристического уравнения D(p) = anpn + an-1pn-1 +…+ a1p + a0 = 0. Корни могут быть либо вещественными pi = αi, либо комплексно сопряженными pi = αi ± jωi. Поскольку все коэффициенты характеристического полинома – вещественные, то комплексные корни будут парными, т.е. вместе с корнем αi + jωi всегда будет αi − jωi. Постоянные интегрирования Аi определяются исходя из начальных и конечных условий, подставляя в общее решение значения u, y и их производные в моменты времени t = 0 и t → ∞. Каждому отрицательному вещественному корню соответствует экспоненциально затухающая во времени составляющая yсв(t), каждому положительному − экспоненциально расходящаяся, каждому нулевому корню соответствует yсв(t) = const (рис. 7.4). Рис. 7.4. Вид свободных составляющих переходного процесса Пара комплексно сопряженных корней с отрицательной вещественной частью определяет затухающие колебания с частотой ωi, с положительной вещественной частью − расходящиеся колебания, а с нулевой − незатухающие (рис. 7.5). Рис. 7.5. Колебания в системе с комплексно-сопряженными корнями Так как после снятия возмущения yвын(t) = 0, то устойчивость системы определяется только характером свободной составляющей yсв(t). Поэтому условие устойчивости систем по Ляпунову формулируется так: в устойчивой системе свободная составляющая решения уравнения динамики, записанному в отклонениях, должна стремиться к нулю, то есть затухать. 7.3. Условия устойчивости линейной системы по виду корней характеристического уравнения Покажем, как влияют значения корней характеристического уравнения на устойчивость САУ, на которую не действуют возмущения. Пусть W(s) – ее передаточная функция. Будем считать, что она имеет только простые (не кратные) полюса pi (i = 1,..., n), являющиеся корнями знаменателя: W ( s) = nW ( s ) nW ( s ) = , dW ( s ) ( s − p1 )( s − p2 )...( s − pn ) где nw(s) и dw(s) – полиномы числителя и знаменателя. Из теории линейных дифференциальных уравнений известно, что при отсутствии возмущений выход такой системы может быть представлен только одной составляющей переходного процесса – свободной составляющей (7.3). Таким образом, процесс y(t) затухает при любых начальных условиях тогда и только тогда, когда все корни pi (i =1, ..., n) имеют отрицательные вещественные части. В этом случае система асимптотически устойчива. Поскольку устойчивость линейной системы определяют корни полинома dw(s) – знаменателя передаточной функции W(s), этот полином называется характеристическим полиномом системы и обозначается − Δ(s). Если показать корни характеристического полинома (в общем случае комплексные числа) на комплексной плоскости, то слева от мнимой оси будут устойчивые корни (с отрицательной вещественной частью), а справа неустойчивые. Таким образом, область устойчивости − это левая полуплоскость. Если хотя бы один корень правый, то система неустойчива. Если один из корней равен нулю (в системах, где an = 0), а остальные левые, то система находится на границе апериодической устойчивости. Если равны нулю вещественные части одной или нескольких пар комплексно сопряженных корней, то система находится на границе колебательной устойчивости. Рис. 7.6. Расположение корней характеристического уравнения на комплексной плоскости Предположим, что один из корней полинома характеристического уравнения равен нулю (скажем, p1 = 0), а остальные устойчивы, то есть, их вещественные части отрицательные. Это значит, что система содержит pt интегрирующее звено. Учитывая, что e 1 = e = 1 при всех t, получаем y (t ) = a1 + a2 e p2t + ... + an e pnt . Здесь все слагаемые в правой части, кроме первого, затухают с течением времени, а постоянная составляющая a1 остается. С другой стороны, выход не возрастает неограниченно, поэтому система нейтрально устойчива. Теперь допустим, что характеристический полином имеет пару чисто мнимых корней: p1= jω ( α1 = 0) и p2= - jω (α2 = 0). Это значит, что система содержит консервативное звено − генератор колебаний. При этом процесс (7.2) на выходе системы содержит слагаемые a1ejωt и a2e-jωt, которые могут быть (с помощью формулы Эйлера) представлены в виде a1ejωt = a1(cosωt + jsinωt), a2e-jωt = a2(cosωt - jsinωt). Пусть постоянные а1 и a2 − комплексно-сопряженные, то есть, если a1=b+jc, то a2=b-jc. Тогда сумма a1ejωt + a2e-jωt = 2bcosωt - 2csinωt не содержит мнимой части. Эти составляющие дают незатухающие колебания (по крайней мере, для некоторых начальных условий), поэтому система находится на границе устойчивости (нейтрально устойчива). Правила, позволяющие судить о знаках корней характеристического уравнения без его решения, называются критериями устойчивости. Их можно разделить на алгебраические и частотные критерии. Алгебраические критерии основаны на исследовании характеристического уравнения по определенным правилам алгебраических выражений, позволяющим судить об устойчивости САУ, а частотные основаны на исследовании частотных характеристик САУ. 7.4. Определение условий устойчивости системы по уравнениям ее состояния Определим внутреннюю устойчивость линейной системы, то есть, устойчивость внутренних процессов. Поскольку выход системы нас пока не интересует, используем модель «вход-состояние»: x (t ) = Ax(t ) + Bu (t ) , где x(t) − вектор состояния, u(t) − входной сигнал, A и B − постоянные матрицы. Если вход равен нулю (нет возмущений), уравнение упрощается x (t ) = Ax(t ) . (7.6) Таким образом, свободное движение определяется только свойствами матрицы A. Сначала для простоты будем считать, что матрица A имеет вид 0 α A= 1 .  0 α2  Тогда уравнение (7.6) распадается на два независимых уравнения (две подсистемы): x1 (t ) = α1 x(t ) , x 2 (t ) = α 2 x(t ) . Здесь устойчивость определяется значениями α1 и α2. Если они оба отрицательны, то система асимптотически устойчива. Если одно из них − нуль, а второе отрицательно (или оба нулевых), то система нейтрально устойчива. В общем случае внутренняя устойчивость зависит от собственных чисел матрицы A, то есть, от корней характеристического уравнения det(λI - A) = 0, где I - единичная матрица, а «det» обозначает определитель квадратной матрицы. Полином det(λI − A) от переменной λ называют характеристическим полиномом. Например, для рассмотренной выше диагональной матрицы A  1 0 α1 0   0  λ − α1  − det(λI − A) = det λ  det =     = (λ − α1 )(λ − α 2 ) .   α λ − α 1   2 2    Очевидно, что корни этого полинома − это α1 и α2. Если все корни характеристического полинома устойчивы (имеют отрицательные вещественные части, расположены в левой полуплоскости), то система асимптотически устойчива. Если есть неустойчивые корни (с положительной вещественной частью), то система неустойчива. Если характеристический полином имеет один нулевой корень или пару комплексно-сопряженных корней на мнимой оси, система нейтрально устойчива. Внутренняя устойчивость − более сильное требование, чем техническая устойчивость, потому что определяет ограниченность не только выхода, но и всех внутренних переменных при любых начальных условиях. Рассмотрим, например, такую модель в пространстве состояний 1 0  1 x (t ) =  x(t ) +  u (t )  0 − 1 0  y (t ) = [0 1]x(t ) 1 0  Здесь матрица A =   имеет собственные числа 1 и -1, причем первое из 0 − 1 них − неустойчиво, поэтому система внутренне неустойчива. Теперь найдем передаточную функцию: Y ( s) = C ⋅ ( s ⋅ I − A) −1 ⋅ B + D = U ( s) −1 −1  1 0 1 0   0   s − 1 0   0  = [0 1] ⋅  s   − 0 − 1  ⋅ 1 = [0 1] ⋅   0   ⋅ 1 = + s 1 1            W ( s) = s +1   ( s − 1)( s + 1) = [0 1] ⋅    1 0  1 = ⋅  = . s + 1 1 s + 1 T   1  0   ( s − 1)  ⋅   = [0 1] ⋅  s −1  1  0  ( s − 1)( s + 1)    0  = ⋅ 1  1 ( s + 1)  Ее знаменатель (характеристический полином) Δ(s) = s+1 устойчив, так как имеет единственный устойчивый корень -1, хотя система внутренне неустойчива! Обратите внимание, что система имеет порядок 2, а знаменатель передаточной функции − порядок 1. В данном случае это означает, что некоторые внутренние движения системы не наблюдаемы на выходе, не влияют на него. Вспомним, что передаточная функция описывает свойства системы только при нулевых начальных условиях. Поэтому выводы об устойчивости внутренних процессов в системе, сделанные по передаточной функции, могут оказаться неверными, если степень ее знаменателя меньше порядка исходного дифференциального уравнения. 7.5. Необходимое условие устойчивости САУ Характеристическое уравнение системы с помощью теоремы Виета может быть записано в виде D(p) = aosn + a1sn-1 + a2sn-2 + ... + an = ao(s-p1)(s-p2)...(s-pn) = 0, где p1, p2, ..., pn − корни этого уравнения. Если система устойчива, значит все корни левые, то есть вещественные части всех корней отрицательны, что можно записать как ai = -|ai| < 0, i=1, …n. Подставим их в уравнение: a0 (s + |a1|)·(s + |a2| - jω2)·(s + |a2| + jω2) ... = 0. Перемножая комплексно сопряженные выражения, получим: a0·(s + |a1|)·((s + |a2|)2 + (ω2)2) ... = 0. После раскрытия скобок должно получиться выражение a0·sn + a1·sn-1 + a2·sn-2 + ... + an = 0. Так как в скобках нет ни одного отрицательного числа, то ни один из коэффициентов a0, a1,..., an не будет отрицательным. Поэтому необходимым условием устойчивости САУ является положительность всех коэффициентов характеристического уравнения: a0 > 0, a1 > 0, ... , an > 0. В дальнейшем будем рассматривать только уравнения, где a0 > 0. В противном случае уравнение домножается на -1. Рассмотренное условие является необходимым, но не достаточным условием. Поэтому были разработаны необходимые и достаточные условия (критерии) устойчивости линейных систем. Рассмотренное условие является необходимым, но не достаточным условием. Необходимые и достаточные условия дают алгебраические критерии Рауса и Гурвица. 8. КРИТЕРИИ УСТОЙЧИВОСТИ ЛИНЕЙНЫХ СИСТЕМ Итак, для исследования устойчивости линейной системы достаточно найти корни ее характеристического полинома. Если все корни имеют отрицательные вещественные части (находятся в левой полуплоскости, слева от мнимой оси), такой полином называется устойчивым, потому что соответствующая линейная система устойчива. Полиномы, имеющие хотя бы один корень с положительной вещественной частью (в правой полуплоскости) называются неустойчивыми. На ранней стадии развития теории управления актуальной была задача определения устойчивости полинома без вычисления его корней. Конечно, сейчас легко найти корни характеристического полинома с помощью компьютерных программ, однако такой подход дает нам только количественные (а не качественные) результаты и не позволяет исследовать устойчивость теоретически, например, определять границы областей устойчивости. 8.1. Алгебраический критерий Гурвица Существует несколько устойчивость полинома алгоритмов, позволяющих проверить ∆( s ) = a 0 s n + a1 s n −1 + ... + a n −1 s + a n , не вычисляя его корни. Прежде всего, для устойчивости все коэффициенты ai(i= 0, ..., n) должны быть одного знака, обычно считают, что они положительные. Это необходимое условие устойчивости полинома. Однако при n > 2 это условие недостаточно, если полином имеет комплексно-сопряженные корни. Поэтому были разработаны необходимые и достаточные условия (критерии) устойчивости полиномов. Один из самых известных критериев − критерий Гурвица − использует матрицу Нn размером n×n, составленную из коэффициентов полинома Δ(s) следующим образом: • первая строка содержит коэффициенты a1, a3, a5, ... (все с нечетными номерами), оставшиеся элементы заполняются нулями; • вторая строка содержит коэффициенты a0, a2, a4, ... (все с четными номерами); • третья и четвертая строки получаются сдвигом первой и второй строк на 1 позицию вправо, и т. д. Например, для полинома пятого порядка (n = 5) эта матрица имеет вид a1 a  0 H 5 = 0  0 0 a3 a2 a1 a0 a5 a4 a3 a2 a1 a5 a4 a3     (a 0 > 0) .   a5  Критерий Гурвица: “Все корни полинома Δ(s) имеют отрицательные вещественные части тогда и только тогда, когда все n главных миноров матрицы Hn (определителей Гурвица) положительны”. Вспомним, что для устойчивости полинома необходимо, чтобы все его коэффициенты были положительными. Поэтому достаточно проверить только (n -1) первых определителей Гурвица. Например, для n = 5 речь идет об определителях D1 = a1 , D2 = a1 a0 a1 a3 > 0, d 3 = a 0 a3 a3 a2 a1 a1 a5 a a 4 > 0, D4 = 0 a3 a3 a2 a1 a0 a5 a4 a3 a2 a5 a4 > 0. Раскрывая определитель матрицы Н5 по последнему столбцу, получаем D5 = detH5 = a5⋅D4. Так как a5>0, из условия D4>0 сразу следует D5 > 0 . Таким образом, условия устойчивости сводятся к нескольким неравенствам. Это очень удобно для систем низкого порядка. Например, для n = 2 необходимое и достаточное условие устойчивости − положительность всех коэффициентов полинома. Для n=3 характеристический полином имеет вид Δ(s) = a0s3 + a1s2 + a2s + a3, поэтому условия Гурвица определяются матрицей  a1 H 3 = a 0  0 a3 a2 a1 0 0 , (a 0 > 0) . a3  Полином устойчив, если все коэффициенты положительны и a D2 =  1 a 0 a3  = a1 a 2 − a 0 a3 > 0 . a 2  (8.1) Рассмотрим систему (рис. 8.1), в которой объект и регулятор задаются передаточными функциями: P( s) = 1 K , C ( s) = . (T1 s + 1)(T2 s + 1) s Рис. 8.1. Регулятор и объект в замкнутом контуре управления С помощью критерия Гурвица можно определить, при каких значениях K замкнутая система (с отрицательной обратной связью) устойчива. Передаточная функция замкнутой системы равна W ( s) = C ( s) P( s) K = , 1 + C ( s) P( s) ∆( s) где характеристический полином имеет вид ∆(s) = (T1s+1)(T2s + 1)s + K = T1T2s3+(T1 + T2)s2 + s + K. Необходимое условие устойчивости дает K> 0. Применяя критерий Гурвица для системы третьего порядка (8.1), получаем T1 + T2 > KT1T2 ⇒ K< 1 1 + . T1 T2 Таким образом, система устойчива при 0 0 – годограф начинает поворачиваться против часовой стрелки и пересекает мнимую ось Im; 3) Im = 0 ⇒ 13⋅ω – 2⋅ω3 = 0; ω⋅(13–2ω2) = 0; ω1 = 0; ω 2,3 = 6,5 = ±2,52 ; при ω=2,52 Re=6–9⋅2,522=–52,2<0 – годограф продолжает поворачивается против часовой стрелки, пересекает действительную ось Re, проходит 3 квадранта и при ω → ∞ остается в третьем квадранте, что соответствует порядку характеристического полинома, т.е. ω → ∞, Re → – ∞, Im → ∞. Im 9,2 ω = 2,52 ω = 0,82 ω=0 –52,5 6 Re ω→∞ Рис. 8.15. Построение годографа Михайлова Для построения годографа Михайлова в среде MATLAB и отображения его на комплексной плоскости приводится ниже следующий фрагмент программы: %Файл "primer4gm.m" w=0:0.01:4; p=-9*w.^2+6; q=-2*w.^3+13*w; plot(p,q) grid Результатом ее выполнения будет годограф Михайлова, представленный на рис. 8.16. 20 10 -10 -20 -30 -40 -50 -60 -70 -80 -140 -120 -100 -80 -60 -40 -20 20 Рис. 8.16. Годограф Михайлова, полученный в среде MATLAB Вывод. Все условия критерия Михайлова соблюдены, замкнутая система устойчива. Полученная в результате автоматизированного вычисления кривая Михайлова полностью отображает ту же кривую, построенную ранее графически по контрольным точкам. 8.4. Анализ устойчивости САУ по ЛЧХ Оценку устойчивости по критерию Найквиста удобнее производить по ЛЧХ разомкнутой САУ. Очевидно, что каждой точке АФЧХ будут соответствовать определенные точки ЛАЧХ и ЛФЧХ. Проиллюстрируем это на примере ЛЧХ разомкнутых систем, приведенных на рис. 8.17. Сначала предположим, что передаточная функция разомкнутой системы не имеет неустойчивых полюсов. Как мы уже знаем, для анализа устойчивости наиболее важно поведение частотной характеристики в районе частоты среза ωс, где А(ωс) = 1 и Lm(ωс) = 20lgА(ωс) = 0. Для устойчивой системы значение фазы на частоте среза должно быть больше, чем -180°. На графике представлены три фазовых характеристики устойчивых систем. Кривая 1 соответствует случаю, когда в разомкнутой системе нет интеграторов (и фазовая характеристика начинается с нуля), кривая 2 - системе с одним интегратором, а кривая 3 - с двумя. Рис. 8.17. Логарифмические характеристики разомкнутых систем Если разомкнутая система имеет неустойчивые звенья, нужно считать переходы фазовой характеристики через линию φ(ω) = -180° левее частоты среза. Здесь положительным считается переход снизу вверх, а отрицательным − сверху вниз. Если фазовая характеристика начинается на линии φ(ω) = -180° (на нулевой частоте), это считается за половину перехода. Для устойчивой системы разность между числом положительных и отрицательных переходов должна быть равна l/2, где l − число неустойчивых полюсов передаточной функции L(s). Сформулируем основные требования к ЛЧХ разомкнутых систем для обеспечения устойчивости их замкнутых систем. Пусть известны частотные характеристики двух разомкнутых САУ (1 и 2), отличающихся друг от друга только коэффициентом передачи K1< K2. Пусть первая САУ устойчива в замкнутом состоянии, вторая нет (рис. 8.18). Рис. 8.18. Частотные характеристики двух разомкнутых САУ: устойчивой (1) и неустойчивой (2) Если W1(p) − передаточная функция первой САУ, то передаточная функция второй САУ W2(p) = K∙W1(p), где K = K2/K1. Вторую САУ можно представить последовательной цепочкой из двух звеньев с передаточными функциями K (безынерционное звено) и W1(p), поэтому, результирующие ЛЧХ строятся как сумма ЛЧХ каждого из звеньев. Отсюда ЛАЧХ второй САУ: L2(ω) = 20lgK + L1(ω), а ЛФЧХ: φ2(ω) =φ1(ω). Пересечениям АФЧХ вещественной оси соответствует значение фазы φ=-π. Это соответствует точке пересечения ЛФЧХ линии координатной сетки φ= -π. При этом, как видно на АФЧХ, амплитуды A1(ω) < 1, A2(ω) > 1, что соответствует на ЛАЧХ значениям L1(ω) = 20lgA1(ω) < 0 и L2(ω) > 0. Сравнивая АФЧХ и ЛФЧХ можно заключить, что система в замкнутом состоянии будет устойчива, если значению ЛФЧХ φ= -π будут соответствовать отрицательные значения ЛАЧХ и наоборот. Запасам устойчивости по модулю h1 и h2, определенным по АФЧХ соответствуют расстояния от оси абсцисс до ЛАЧХ в точках, где φ= -π, но в логарифмическом масштабе. Особыми точками являются точки пересечения АФЧХ с единичной окружностью. Частоты ωc1 и ωc2, соответствующие этим особым точкам называют частотами среза. На этих частотах, соответствующих A(ωс) = 1, ЛАЧХ пересекает горизонтальную ось, так как L(ωс) =20lgA(ω)=0. Если при частоте среза ωс1 фаза АФЧХ φ1 > -π (рис. 8.18, б кривая 1), то замкнутая САУ устойчива. В этом случае пересечению ЛАЧХ горизонтальной оси соответствует точка ЛФЧХ, расположенная выше линии φ= -π. И, наоборот, для неустойчивой замкнутой САУ (рис. 8.18, б кривая 2) φ2 < -π, потому что при ω= ωc2 ее ЛФЧХ проходит ниже линии φ= -π. Таким образом, угол φ1>-π, соответствующий расстоянию от линии φ=π до ЛФЧХ первой САУ, характеризует ее запас устойчивости по фазе. Исходя из сказанного, критерий устойчивости Найквиста по логарифмическим частотным характеристикам, в случаях, когда АФЧХ только один раз пересекает отрезок вещественной оси [-∞; -1], можно сформулировать так: для того, чтобы замкнутая САУ была устойчива необходимо и достаточно, чтобы частота, при которой ЛФЧХ пересекает линию φ= -π, была больше частоты среза. 9. МЕТОДЫ СИНТЕЗА РЕГУЛЯТОРОВ ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ СИСТЕМ 9.1. Постановка задачи синтеза корректирующих устройств Задача системы управления состоит в том, чтобы подавить действие внешнего возмущения g и обеспечить быстрые и качественные переходные процессы. К сожалению, эти задачи часто противоречивы. Фактически нам нужно скорректировать систему так, чтобы она имела нужные передаточные функции по возмущению и по задающему воздействию. Покажем это на примере классической схемы системы управления, в которой регулятор включается перед объектом, как показано на схеме (рис. 9.1): Рис. 9.1. Классическая схема системы управления Тогда передаточные функции по возмущению Wg(s) (от входа g к выходу y) и задающему воздействию W(s) (от входа х к выходу y) имеют вид: Wg ( s ) = P( s) , 1 + C ( s) R( s) P( s) W ( s) = C ( s) R( s) P( s) . 1 + C ( s) R( s) P( s) Если в системе управления используется только один регулятор C(s), то такая система называется системой с одной степенью свободы. Легко проверить, что в такой системе эти две передаточные функции связаны равенством Wg(s) = [1 - W(s)] P(s). Поэтому, изменяя одну из передаточных функций, мы автоматически меняем и вторую. Таким образом, их невозможно сформировать независимо друг от друга и решение всегда будет некоторым компромиссом. Посмотрим, можно ли в такой системе обеспечить нулевую ошибку, то есть, абсолютно точное отслеживание входного сигнала. Передаточная функция по ошибке (от входа x(t) к ошибке e(t)) равна We ( s ) = 1 . 1 + C ( s) R( s) P( s) Для того, чтобы ошибка всегда была нулевой, требуется, чтобы эта передаточная функция была равна нулю. Поскольку ее числитель − не нуль, сразу получаем, что знаменатель должен обращаться в бесконечность. Но мы можем влиять только на регулятор C(s) (остальные элементы заданы заранее), поэтому получаем C(s)→∞. Таким образом, для уменьшения ошибки нужно увеличивать коэффициент усиления регулятора. Это так называемый принцип глубокой обратной связи. В этом случае передаточную функцию замкнутой системы по ошибке можно представить в виде We ( s ) = 1 , 1 + KW1 ( s ) где C(s) = K; W1(s) = R(s)P(s) – передаточная функция разомкнутой системы (без регулятора), которая в пределе должна быть равна единице lim W1 ( s ) = 1 . s →0 Тогда установившееся значение ошибки при постоянном входном сигнале x(t)=x0, имеющем изображение по Лапласу X(s) =x0/s, может быть вычислено по теореме о конечном значении оригинала ε ∞ = lim ε (t ) = lim s Φ ε ( s ) X ( s ) = t →∞ s →0 x0 . 1+ K Отсюда следует, что нельзя увеличивать усиление до бесконечности. Во-первых, все реальные устройства имеют предельно допустимые значения входных и выходных сигналов. Во-вторых, при большом усилении контура ухудшается качество переходных процессов, усиливается влияние возмущений и шумов, система может потерять устойчивость. Поэтому в схеме с одной степенью свободы обеспечить нулевую ошибку слежения невозможно. Посмотрим на задачу с точки зрения частотных характеристик. С одной стороны, для качественного отслеживания задающего сигнала x(t) желательно, чтобы частотная характеристика W(jω) была примерно равна единице (в этом случае y(t) ≈ x(t)). С другой стороны, с точки зрения робастной устойчивости нужно обеспечить W(jω) ≈ 0 на высоких частотах, где ошибка моделирования велика. Кроме того, передаточная функция по возмущению должна быть такой, чтобы эти возмущения подавлялись, то есть в идеале мы должны обеспечить Wg (jω) ≈ 0. Выбирая компромиссное решение, поступают следующим образом: 1) на низких частотах добиваются выполнения условия W(jω) ≈ 1, что обеспечивает хорошее слежение за низкочастотными сигналами; при этом Wg(jω) ≈ 0, то есть, низкочастотные возмущения подавляются; 2) на высоких частотах стремятся сделать W(jω) ≈ 0, чтобы обеспечить робастную устойчивость и подавление шума измерений; при этом Wg(jω) ≈ P(jω), то есть система фактически работает как разомкнутая, регулятор не реагирует на высокочастотные помехи. 9.2. ПИД-регуляторы Несмотря на развитые современные методы проектирования сложных регуляторов, подавляющее большинство промышленных систем управления основаны на регуляторах первого и второго порядка. Эти регуляторы во многих случаях могут обеспечить приемлемое управление, легко настраиваются и дешевы при массовом изготовлении. Простейший регулятор − пропорциональный или П-регулятор − это простой усилитель с передаточной функцией C(s) = K. Его выход − это ошибка управления e(t), умноженная на коэффициент K, т.е. u(t) = Ke(t). С помощью Прегулятора можно управлять любым устойчивым объектом, однако он дает относительно медленные переходные процессы и ненулевую статическую ошибку. Чтобы убрать статическую ошибку в установившемся режиме, в регулятор вводят интегральный канал с коэффициентом усиления KI, так что K C (s) = K + I , s t u (t ) = Ke(t ) + K I ∫ e(τ)dτ . Такой регулятор называется пропорционально-интегральным или ПИрегулятором. Интегратор выдает сигнал, пропорциональный накопленной ошибке, поэтому переходный процесс несколько замедляется. Однако за счет интегрального канала обеспечивается нулевая ошибка в установившемся состоянии при ступенчатом возмущении и ступенчатом изменении задающего сигнала − уставки. Для ускорения переходных процессов добавляют дифференциальный канал с коэффициентом усиления KD: K C ( s) = K + I + K D s , s t u (t ) = Ke(t ) + K I ∫ e(τ)dτ + K D de(t ) . dt Такой регулятор называется ПИД-регулятором (пропорциональноинтегрально- дифференциальный). ПИД-регулятор формирует управляющий сигнал, являющийся суммой трёх слагаемых, первое из которых пропорционально разности входного сигнала и сигнала обратной связи (сигнал рассогласования), второе − интегралу сигнала рассогласования, третье − производной сигнала рассогласования. Регуляторы этого типа очень хорошо зарекомендовали себя в практических задачах. Кроме того, иногда используются ПД-регуляторы (пропорционально-дифференциальные), у которых нет интегрального канала. Управление по производной − это быстрый способ управления. Сигнал дифференциального канала наиболее важен при изменениях входов и исчезает в установившемся режиме. Он позволяет реагировать не на само увеличение ошибки, а на тенденцию ее изменения, и принять «превентивные меры». Главный недостаток дифференциального канала − большое влияние высокочастотных помех, например, шумов измерений. Для того, чтобы сделать регулятор физически реализуемым, вместо чистого дифференцирования используют инерционное дифференцирующее звено: C (s) = K + KI KDs + , s TD s + 1 где TD − малая постоянная времени. Чем меньше TD, тем в большем частотном диапазоне выполняется точное дифференцирование, но сильнее влияют высокочастотные помехи. Для устойчивого объекта можно выбрать коэффициенты регулятора опытным путем, выполняя эксперименты с реальным объектом. Предложено несколько методов решения этой задачи, например, правила Зиглера-Никольса или Коэна-Куна. Можно показать, что любой регулятор второго порядка с интегратором может быть представлен в форме ПИД-регулятора: a2 s 2 + a1s + a0 K K s C (s) = ⇔ C (s) = K + I + D . s (b1s + b0 ) s TD s + 1 9.3. Метод размещения полюсов Один из простых методов синтеза регулятора − размещение полюсов передаточной функции замкнутой системы, которые во многом определяют ее динамику, например, быстродействие и степень затухания колебаний. Смысл в том, чтобы разместить эти полюса в заданных точках комплексной плоскости с помощью специально выбранного регулятора. Эта задача сводится к решению системы линейных уравнений. Пусть передаточная функция объекта задана в виде отношения полиномов P( s) = n s + n0 n( s ) = 2 1 . d ( s ) s + d1 s + d 0 Выберем регулятор вида C (s) = nC ( s ) a1s + a0 = , d C ( s ) b1s + b0 где a0, a1, b0 и b1 - неизвестные коэффициенты, которые нужно определить. Характеристический полином замкнутой системы равен Δ(s) = n(s)nC(s) + d(s)dC(s) = (n1s + n0)(a1s + a0) + (s2 + d1s + d0)(b1s + b0)= = b1s3 + (n1a1 + d1b1 + b0)s2 + (n0a1 + n1a0 + d0b1 + d1b0)s + n0a0 + d0b0 . Предположим, что мы хотим выбрать регулятор так, чтобы разместить корни полинома Δ(s) в заданных точках, то есть добиться выполнения равенства Δ(s) = s3 + δ2s2 + δ1s + δ0, где δi (i = 0,...,2) − заданные числа. Приравнивая коэффициенты при одинаковых степенях s в последних двух равенствах, получаем s3 : b1=1 s2 : n1a1 + d1b1 + b0 = δ2 s1 : n0a1 + n1a0 + d0b1 + d1b0 = δ1 s0 : n0a0 + d0b0 = δ0 или в матричном виде 0 n  1 n0  0 n1 n0 1 d1 d0 0   a1   1  1  a0  δ 2  ⋅ = d1   b1   δ1       d 0  b0  δ 0  . Решение уравнения имеет вид  a1   0 a   n  0 =  1  b1  n0     b0   0 1 d1 n1 n0 d0 −1 0 1 1  δ 2  ⋅ d 1   δ1     d 0  δ 0  Конечно, квадратная матрица в этом выражении (она называется матрицей Сильвестра) должна быть обратима. Можно доказать, что она действительно обратима тогда и только тогда, когда полиномы n(s) и d(s) не имеют общих корней, то есть передаточная функция объекта P(s) несократима. В противном случае общий корень этих полиномов неизбежно будет корнем характеристического полинома Δ(s). Кроме того, для того, чтобы количество неизвестных коэффициентов было равно числу уравнений, порядок регулятора нужно выбирать не меньше, чем N -1, где N − порядок модели объекта управления: N = max{deg n(s), deg d(s)}, где deg обозначает степень полинома. Иначе полученное уравнение будет разрешимо только при специально выбранном полиноме Δ(s) . Заметим, что при размещении полюсов мы никак не учитываем нули передаточной функции, которые также влияют на динамику системы. 9.4. Метод коррекции частотных характеристик системы В отечественной литературе классическим стал метод синтеза корректирующих устройств с помощью логарифмических амплитуднофазовых частотных характеристик (ЛАФЧХ) разомкнутой системы (диаграмм Боде по зарубежной терминологии). Пусть разомкнутая система имеет передаточную функцию W(s). ЛАФЧХ включает в себя две кривые – амплитудную частотную характеристику (ЛАЧХ) Lm(ω) = 20lg|W(jω)| и фазовую (ЛФЧХ) φ(ω) = argW(jω). Угловая частота (в рад/сек) на оси ординат откладывается в логарифмическом масштабе. При этом так называемые асимптотические ЛАЧХ представляют собой отрезки прямых линий, это значительно облегчает ручное построение. Разложив числитель и знаменатель передаточной функции W(s) на сомножители первого и второго порядков, можно представить ЛАЧХ системы как сумму ЛАЧХ элементарных звеньев (апериодических, колебательных, интегрирующих, дифференцирующих и т.д.) Для W ( jω) = N1 ( jω) ...N n ( jω) D1 ( jω) ...Dq ( jω) получаем, используя свойства логарифма, 20lg|W(jω)|=20lg|N1(jω)| +…+ 20lg|Nn(jω)| − 20lg|D1(jω)| −…− 20lg|Dq(jω)| Раньше вручную строили асимптотические ЛАЧХ, суммируя ЛАЧХ отдельных звеньев. В среде MATLAB существуют средства, позволяющие автоматизировать построение точных (не асимптотических) ЛАФЧХ. При этом можно использовать накопленный за многие годы классический опыт проектирования. Низкочастотная часть ЛАЧХ определяет точность системы, среднечастотная (вблизи частоты среза ωc) – устойчивость и качество переходного процесса, высокочастотная – чувствительность к помехам. Если система содержит интегратор, низкочастотная часть имеет ненулевой наклон (-20 дБ на декаду для одного интегратора), постоянный сигнал отслеживается без установившейся ошибки. Для системы с двумя интеграторами ЛАФЧХ имеет в области низких частот наклон -40 дБ на декаду, без установившейся ошибки отслеживается не только постоянный, но и линейно возрастающий сигнал. Более сложные требования к точности приводят к тому, что ЛАЧХ не должна заходить в некоторые запретные области. Open-Loop Bode Editor (C) 50 Magnitude (dB) Запас устойчивости по амплитуде Gain Margin (G M ) ωc -50 -100 G.M.: 21.8 dB Freq: 1.73 rad/sec Stable loop Запас устойчивости по фазе, Phase Margin (P M ) -150 Phase (deg) -90 -180 -270 P.M.: 83.8 deg Freq: 0.162 rad/sec -2 10 -1 10 10 Frequency (rad/sec) 1 10 2 10 Рис. 9.2. Определение запасов устойчивости с помощью ЛАЧХ и ЛФЧХ Запас устойчивости по амплитуде gm (в дБ) – это расстояние от ЛАЧХ до горизонтальной прямой Lm=0 дБ на частоте, на которой фазовая характеристика пересекает прямую φ=-180о. На этой частоте система должна иметь коэффициент усиления меньше 1 (или Lm(ω) <0). Запас устойчивости по фазе φm (в градусах) – это расстояние от частотной характеристики до горизонтальной прямой φ=-180о на частоте среза ωc. На этой частоте фазовая характеристика должна иметь значение больше 180о. Допустимым считается запас по амплитуде не менее 6 дБ и запас по фазе не менее 30 градусов. «Подъем» ЛАЧХ означает увеличение коэффициента усиления контура, фазовая характеристика не изменяется. Точность системы (при отработке низкочастотных сигналов) повышается, однако увеличивается и влияние высокочастотных помех. Поскольку частота среза увеличивается, повышается быстродействие системы. При этом переходные процессы приобретают выраженный колебательный характер, запасы устойчивости уменьшаются, при дальнейшем увеличении коэффициента усиления теряется устойчивость. Обычно требуется, чтобы система имела высокую точность (большой коэффициент усиления по контуру) для низких частот и подавляла высокочастотные помехи (имела низкое усиление в области высоких частот). Частота среза выбирается исходя из требований к быстродействию. Таким образом, типичная ЛАЧХ имеет вид, показанный на рисунке 9.3. Серым цветом показаны запретные области, которые определяются требованиями к точности и подавлению помех. 12-16 дБ 12-16 дБ Рис. 9.3. Форма желаемой ЛАЧХ Lж(jω) Для обеспечения хорошего качества переходных процессов рекомендуется, чтобы ЛАЧХ пересекала ось L=0 с наклоном 20 дБ/дек. Это объясняется тем, что наклон 20 дБ/дек, соответствующий апериодическому звену, приводит к наименьшей колебательности переходного процесса. Точки перехода (излома асимптотической ЛАЧХ) от низкочастотной части к среднечастотной и далее к высокочастотной должны отстоять от оси L=0 на 12-16 дБ. В общем случае строится желаемая ЛАЧХ Lж(jω), удовлетворяющая требованиям к системе, затем ЛАЧХ последовательного корректирующего устройства определяется как разность между и Lж(jω) и ЛАЧХ существующей разомкнутой системы. 9.5. Пример синтеза корректирующего устройства по ЛАФЧХ На протяжении многих лет самым популярным инженерным методом синтеза регуляторов был метод, основанный на использовании логарифмических частотных характеристик (ЛАФЧХ). Он основан на двух свойствах ЛАФЧХ: 1) логарифмические амплитудные и фазовые частотные характеристики для последовательного соединения двух блоков (например, регулятора и объекта управления) равны сумме ЛАЧХ и ЛФЧХ этих блоков; 2) если передаточная функция объекта не имеет неустойчивых нулей и полюсов (с положительной вещественной частью), то амплитудная частотная характеристика однозначно определяет фазовую; отсюда следует что можно свести выбор регулятора к изменению только амплитудной характеристики нужным образом. Пусть G(s) = P(s) R(s) - передаточная функция объекта вместе с приводом, причем будет предполагать, что она не имеет неустойчивых нулей и полюсов (то есть, является минимально-фазовой). ЛАЧХ такого расширенного объекта обозначим как L0(ω) = 20lg|G(jω)|. Если мы сможем каким-то образом найти желаемую ЛАЧХ Lж(ω), то разница между этими двумя характеристиками − это и есть ЛАЧХ необходимого последовательного регулятора: LC(ω)=Lж(ω) – L0(ω). (9.1) Таким образом, для решения задачи требуется ответить на два вопроса: 1) как выбрать желаемую ЛАЧХ Lж(jω) так, чтобы обеспечить устойчивость и требуемое качество замкнутой системы? 2) как получить передаточную функцию C(s) по его ЛАЧХ (9.1)? Чтобы ответить на первый вопрос, вспомним типичные требования к системе управления: • • • • • устойчивость; нулевая ошибка в установившемся режиме; быстрый и плавный (в идеале - монотонный) переходный процесс; подавление шумов; робастность (нечувствительность к ошибкам модели). Эти требования нужно связать с формой ЛАЧХ. Постоянный сигнал можно рассматривать как предельный случай гармонического (синуса), только с нулевой частотой. Поэтому для обеспечения нулевой установившейся ошибки цепочка «регулятор-объект» должна иметь бесконечное усиление на нулевой частоте, то есть передаточная функция G(s)∙C(s) должна содержать интегратор (вспомните принцип внутренней модели). Обычно хочется, чтобы переходный процесс был монотонным, без перерегулирования. Такой процесс дает апериодическое звено. Легко проверить, что передаточная функция апериодического звена (слева) равна передаточной функции интегратора, охваченного единичной обратной связью (справа): Рис. 9.4. Звенья: апериодическое (а) и интегратор (б), охваченный обратной связью Отсюда, для получения монотонного переходного процесса ЛАЧХ разомкнутой системы должна быть похожа на ЛАЧХ интегратора − это прямая линия с наклоном -20 дБ/дек, которая пересекает ось абсцисс на частоте ωс=1/T. Эта частота называется частотой среза. Заметим, что для апериодического звена легко определить время переходного процесса: оно примерно равно 3T. Таким образом, частота среза определяет время переходного процесса. Вспомним, что устойчивость системы также определяется поведением ЛАЧХ в районе частоты среза. В результате справедливо следующее: 1) устойчивость и качество переходного процесса (время, перерегулирование) определяются формой ЛАЧХ в районе частоты среза, где она пересекает ось Lm = 0; эта область называется областью средних частот; 2) для получения качественного переходного процесса желательно, чтобы наклон ЛАЧХ около частоты среза был равен -20 дБ/дек; 3) если задано время переходного процесса tn, нужно выбирать ωс=3/tп. Теперь разберемся с шумами и робастностью. Как мы знаем, шумы - это высокочастотные сигналы. Кроме того, обычно именно в области высоких частот характеристики объекта и модели могут сильно расходиться. Поэтому для подавления помех и уменьшения влияния ошибок модели нужно по возможности уменьшать усиление системы в области высоких частот, то есть ЛАЧХ должна резко идти вниз. На рисунке 9.5 изображена желаемая ЛАЧХ. Это асимптотическая ЛАЧХ, состоящая из отрезков прямых линий. Рис. 9.5. Типовая желаемая ЛАЧХ В выделенных точках стыкуются два отрезка разного наклона. На низких частотах она имеет наклон -20 дБ/дек, то есть система содержит интегратор, который обеспечивает нулевую ошибку в установившемся режиме. ЛАЧХ пересекает ось абсцисс под наклоном -20 дБ/дек. Для обеспечения устойчивости и приемлемого показателя колебательности (M < 1,2) точки излома ЛАЧХ должны находиться на расстоянии 12-16 дБ от оси абсцисс (см. рис. 9.3). Пример 9.1. Продемонстрируем метод коррекции ЛАЧХ на простом примере. Пусть объект управления − апериодическое звено с передаточной функцией 1 G(s) = , T0 s + 1 где T0=5 с. Передаточная функция замкнутой системы без коррекции (то есть, с регулятором C0(s) = 1) равна: W (s) = 1 0,5 = . T0 s + 2 0,5T0 s + 1 Видим, что статический коэффициент усиления W(0) = 0,5 (а не 1), так что точного отслеживания входного сигнала не получается. Время переходного процесса можно приближенно подсчитать как tn =3∙0,5∙T0 = 7,5 c. Поставим задачу следующим образом: выбрать регулятор C(s), который обеспечивает: • нулевую ошибку в установившемся режиме; • время переходного процесса около 1,5 с; • наклон ЛАЧХ -40 дБ/дек на высоких частотах для подавления помех. Для решения используем метод коррекции ЛАЧХ. Линия 1 на рис. 9.6 обозначает нескорректированную ЛАЧХ, совпадающую с ЛАЧХ апериодического звена G(s). Рис. 9.6. Иллюстрация метода коррекции ЛАЧХ Желаемая ЛАЧХ (зеленая линия) должна иметь наклон -20 дБ/дек на низких частотах, чтобы обеспечить нулевую статическую ошибку. Частота среза ωс определяется требуемым быстродействием: ωс = 3/tn = 2 рад/с. Таким образом, начальный участок желаемой ЛАЧХ совпадает с ЛАЧХ интегрирующего звена с передаточной функцией (на низких частотах). ω ωc , то есть Lж (ω) = 20 lg c ω s На высоких частотах нужно изменить наклон ЛАЧХ с -20 до -40 дБ/дек на частоте ω1, где Lm(ω) = -15 дБ. Из этого условия находим 20 lg ωc = −15 ⇒ ω1 ωc = 10 −15 / 20 ω1 ⇒ ω1 = 103 / 4 ⋅ ωc = 5,62 ⋅ 2 = 11,24рад/с Таким образом, построена желаемая ЛАЧХ (линия 2), удовлетворяющая требованиям к системе. Вычитая из нее исходную ЛАЧХ (без коррекции, линия 1), получим ЛАЧХ регулятора, которая показана линией 3 на нижнем графике. Остается перейти от ЛАЧХ регулятора к его передаточной функции. На низких частотах (ω0 < 1/T0) ЛАЧХ регулятора имеет наклон -20 дБ/дек и проходит через точку (ωс; 0), то есть ω C ( s ) = c ⋅ C1 ( s ) , s где С1(s) не изменяет асимптотическую ЛАЧХ на частотах, меньших 1/T0. На частоте ω0=1/T0 ЛАЧХ регулятора меняет наклон с -20 дБ/дек до нуля, то есть в числитель добавляется множитель T0s +1: ω (T s + 1) C (s) = c 0 ⋅ C2 ( s ) . s Здесь C2(s) − регулятор, не влияющий на ЛАЧХ для частот, меньших ω1. Наконец, на частоте ω1 наклон увеличивается с нуля до -20 дБ/дек. Для того, чтобы на этой частоте «загнуть» вниз ЛАЧХ, нужно добавить в регулятор апериодическое звено с постоянной времени T1 , где 1 T1 = = 0,09 c. ω1 Таким образом, окончательно C (s) = ωc (T0 s + 1) . s (T1s + 1) На рис. 9.7 показаны переходные процессы при единичном ступенчатом входном сигнале в нескорректированной системе (линия 1) и в системе с полученным регулятором C(s) (линия 2). Графики показывают, что найденный регулятор значительно ускорил переходный процесс и обеспечил нулевую статическую ошибку (установившееся значение выхода равно 1). Рис. 9.7. Переходные процессы в нескорректированной и скорректированной системах Нужно отметить, что алгоритм коррекции ЛАЧХ существенно усложняется, если объект содержит неустойчивые или неминимально фазовые звенья. 9.6. Управление с двумя регуляторами (степенями свободы) Один из способов улучшить качество управления − изменить структуру системы, добавив в нее второй регулятор C2(s) на входе: Рис. 9.8. Структура САУ с двумя регуляторами Теперь W ( s) = C2 ( s)C ( s) R( s ) P( s ) . 1 + C ( s) R( s) P( s) Регулятор C2(s) не влияет на свойства контура управления (запасы устойчивости, подавление возмущений, робастность), а влияет только на переходные процессы при изменении задающего воздействия. Поэтому сначала нужно, не обращая внимания на переходные процессы, построить регулятор в контуре C(s) так, чтобы обеспечить нужный уровень подавления возмущений и робастность, а затем сформировать нужные качества передаточной функции W(s) с помощью регулятора C2(s). Поскольку две передаточные функции можно изменять независимо друг от друга, такая схема называется комбинированным управлением (или управлением с двумя степенями свободы). В идеале мы хотим, чтобы система точно воспроизводила сигнал x(t) на выходе y(t), то есть, нужно обеспечить W(s) ≡ 1. Для этого требуется, чтобы 1 1 + C ( s) R( s) P( s) C2 ( s ) = = , (9.2) C ( s) R( s) P( s) W1 ( s ) где W1 ( s) = C ( s) R( s) P( s) 1 + C ( s) R( s) P( s) − передаточная функция замкнутой системы с одной степенью свободы. Из (9.2) следует, что регулятор C2(s) должен быть обратной системой (инверсией) для W1(s). Частотная характеристика W1(jω) в реальных системах близка к нулю на высоких частотах, следовательно, регулятор C2(s) должен иметь в этом частотном диапазоне огромное усиление. Например, для W1 ( s ) = 1 Ts + 1 получим C2(s)=Ts+1, то есть регулятор содержит физически нереализуемое дифференцирующее звено. Таким образом, точная инверсия (9.2) не может применяться в практических задачах. Обычно стараются приближенно обеспечить равенство (9.2) для тех частот, где важно точно отследить задающий сигнал. Отметим, что существуют и другие схемы с двумя степенями свободы, но можно доказать, что все они эквивалентны, разница только в реализации. 9.7. Управление с тремя регуляторами (степенями свободы) Если возмущение g можно как-то измерить, для улучшения качества системы иногда вводится третий регулятор (рис. 9.9), что означает наличие у нее третьей степени свободы. Тогда передаточная функция по возмущению равна [1 − C3 ( s ) R ( s )]P( s ) Wg ( s ) = . 1 + C ( s) R( s) P( s) Рис. 9.9. Структура САУ с тремя регуляторами В этом случае теоретически есть возможность обеспечить полную компенсацию возмущения g, выбрав 1 C3 ( s ) = (9.3) R( s) так что Wg(s)=0. Это условие называется условием инвариантности (неизменности), поскольку в этом случае система абсолютно подавляет любые возмущения по входу g. Заметим, что мы снова пришли к идее инверсии (построения обратной системы), как и в (9.2). К сожалению, на практике условие инвариантности чаще всего невыполнимо, потому что регулятор C3(s) должен быть предсказывающим, так как нужно подать компенсирующий сигнал на привод раньше, чем внешнее возмущение успеет повлиять на объект. Чаще всего получается, что числитель передаточной функции C3(s) (9.3) должен иметь более высокую степень, чем знаменатель. Это значит, что такой регулятор включает звенья чистого дифференцирования, которые не являются физически реализуемыми. Обычно подбирают регулятор C3(s) так, чтобы он был физически реализуемым, но условие (9.3) приближенно выполнялось в наиболее важном диапазоне частот. 9.8. Параметризация Юла для множества стабилизирующих регуляторов Как известно, не каждый регулятор стабилизирует систему. Поэтому важно выделить множество регуляторов, которые обеспечивают устойчивость замкнутого контура. Такие регуляторы называются стабилизирующими. Желательно также получить параметризацию, то есть, представить все множество стабилизирующих регуляторов в виде формулы, зависящей от параметра, который может выбираться произвольно в некоторой допустимой области. Рассмотрим простейшую замкнутую систему (рис, 9.10), для которой передаточная функция равна W (s) = C ( s) P( s) . 1 + C ( s) P( s) (9.4) Рис. 9.10. Структура САУ со стабилизирующим регулятором Регулятор входит в нее нелинейно, что значительно осложняет анализ и синтез системы. Заметим, что эту функцию можно представить в виде W(s)=Q(s)P(s), где Q( s) = C (s) . 1 + C ( s) P( s) (9.5) Выражение (9.5) внешне выглядит как передаточная функция последовательного соединения объекта P(s) и «регулятора» Q(s), причем оно линейно зависит от Q(s). Поэтому естественно возникает вопрос: нельзя ли сначала выбрать нужным образом Q(s), а затем найти соответствующий ей регулятор, выразив его передаточную функцию из (9.5): C ( s) = Q( s) . 1 − Q( s) P( s) (9.6) Очевидно, что функция Q(s) должна быть устойчивой, иначе передаточная функция замкнутой системы W(s) (9.5) также окажется неустойчивой. Оказывается, если объект P(s) устойчив, то регулятор, полученный из (9.6), всегда будет стабилизирующим. Более того, форма (9.6) охватывает все возможные стабилизирующие регуляторы. Параметризация множества стабилизирующих регуляторов для устойчивого объекта, осуществляемая по форме (9.6), называется параметризацией Юла (D.C.Youla). Параметром в (9.6) является устойчивая функция Q(s), которая может выбираться произвольно. На практике регулятор (9.6) должен быть физически реализуемым. Это значит, что передаточная функция C(s) должна быть правильной (степень ее числителя не больше степени знаменателя). Для этого функция Q(s) также должна быть правильной. Теоретически для оптимального слежения нужно выбрать Q(s)=1/P(s), что дает W(s) = 1, однако чаще всего это невозможно. Дело в том, что передаточная функция объекта в практических задачах − строго правильная (степень числителя меньше степени знаменателя), и Q(s) получается неправильной. Поэтому используют компромиссные решения, обеспечивая приближенную инверсию только для наиболее важной полосы частот. Существует множество методов синтеза, в которых устойчивая и правильная функция Q(s) выбирается в результате численной оптимизации по какому-либо критерию. Затем передаточная функция регулятора рассчитывается по формуле (9.6). Посмотрим, что получится, если попробовать применить такой подход для неустойчивого объекта с передаточной функцией 1 P( s) = . s −1 Выбрав Q(s) = 1, из (15.6) получаем C (s) = При этом в произведении C ( s) P( s) = s −1 . s−2 s −1 1 ⋅ s − 2 s −1 неустойчивый полюс модели объекта сокращается (компенсируется) неустойчивым нулем регулятора. Характеристический полином Δ(s) = s -1 + (s - 2)(s -1) = (s -1)2 будет неустойчивым, как и вся замкнутая система. Следовательно, параметризацию (9.6) в этом случае использовать нельзя. Для неустойчивых объектов используют другую, более сложную параметризацию. Пусть P( s) = n( s ) , d (s) где n(s) и d(s) − полиномы. Выберем произвольный устойчивый полином f(s), степень которого равна наибольшей из степеней n(s) и d(s). Представим функцию P(s) в виде отношения рациональных функций P( s) = n( s ) d (s) U (s) , где U ( s ) = и V (s) = . f (s) f (s) V (s) Можно показать, что существуют такие правильные устойчивые функции X(s) и Y(s), для которых выполняется равенство U (s) X (s) + V(s)Y(s) = 1. (9.7) Тогда множество всех стабилизирующих регуляторов описывается формулой C (s) = X ( s ) + V ( s )Q( s ) , Y ( s ) − U ( s )Q( s ) (9.8) где Q(s) − произвольная правильная устойчивая функция. Выражение (9.8) определяет параметризацию множества стабилизирующих регуляторов (параметризацию Юла) в общем случае, даже для неустойчивых объектов. Подставив (9.8) в формулу (9.4), получаем с учетом (9.7), W(s) = [X(s) + V(s)Q(s)]U(s). При синтезе можно выбирать устойчивую правильную функцию Q(s), при которой передаточные функции замкнутой системы (по входу, по возмущению, по ошибке) имеют нужные свойства, а затем вычислять передаточную функцию регулятора, используя (9.8). Для примера рассмотрим снова неустойчивый объект с передаточной функцией P( s) = 1 , s −1 которую можно записать в виде P( s) = s −1 1 U (s) , где U ( s) = , V ( s) = . s +1 s +1 V (s) Решением уравнения (9.7) может быть, например, такая пара устойчивых функций X (s) = 4 s+3 , Y (s) = . s +1 s +1 При выборе Q(s) = 1 по формуле (9.8) получаем C (s) = s+3 . s+2 Теперь в произведении C(s)P(s) нет никаких сокращений, система устойчива. Лекция. 24 марта _ Б. 10. ОЦЕНКА ТОЧНОСТИ РЕГУЛИРОВАНИЯ В УСТАНОВИВШИХСЯ РЕЖИМАХ 10.1. Точность в установившемся режиме Пусть передаточную функцию разомкнутой системы можно представить в виде W(s) = KW1(s), W1 ( s ) = 1 . Тогда где передаточная функция W1(s) обладает свойством lim s →0 передаточная функция замкнутой системы по ошибке равна Φ ε (s) = 1 1 + KW1 ( s ) . Установившееся значение ошибки при постоянном входном сигнале x(t)=x0, x0 имеющем изображение по Лапласу X ( s ) = , может быть вычислено по s теореме о конечном значении: ε∞= lim ε(t )= lim s Φ ε ( s ) X ( s )= t →∞ s →0 x0 . 1+ K Таким образом, при увеличении коэффициента усиления K ошибка уменьшается (однако запас устойчивости также уменьшается и система может стать неустойчивой). Величина K называется добротностью системы. При любом конечном K в такой системе ошибка будет конечной. Для линейно возрастающего сигнала ошибка будет линейно возрастать. Теперь пусть W (s) = K W1 ( s ) , sv W1 ( s ) = 1 . Тогда для всех входных сигналов вида где v – целое число и lim s →0 x(t) = x0+x1(t) +x2t2 + …+ xv-1tv-1 система будет обеспечивать нулевую установившуюся ошибку при любых значениях коэффициентов x0, …, xv-1. Таким образом, при v > 0 система отслеживает постоянный сигнал без установившейся ошибки. Такие системы называют астатическими. Число v называется порядком астатизма. Для сигнала x(t ) = xν tν , X (s) = ν ! xν sν +1 установившаяся ошибка равна ε∞ = ν ! xν K Выше рассмотрен случай астатизма по отношению к задающему воздействию. Аналогично может идти речь об астатизме по отношении к возмущающему воздействию. 10.2. Временные оценки качества переходного процесса Хорошо спроектированная система должна не только быть устойчивой и поддерживать заданную точность в установившемся режиме, но и плавно переходить на новый режим при изменении заданного значения выхода (уставки). Качество переходных процессов обычно оценивается по переходной характеристике (реакции системы на единичный ступенчатый входной сигнал). Рассмотрим характеристики качества типовых переходных процессов, приведенных на рис. 10.1. а б Рис. 10.1. Колебательный (а) и астатический переходные процессы (б) В первую очередь нас интересует, насколько быстро заканчивается переход на другой режим (время переходного процесса tn). Оно определяется как время, через которое регулируемая величина «входит в коридор» шириной 2Δ вокруг установившегося значения yx. Это значит, что при t > tn значение выхода отличается от установившегося не более, чем на Δ. Обычно величина Δ задается в процентах от установившегося значения, чаще всего 2% или 5%. Заметим, что для апериодического звена с постоянной времени T время переходного процесса равно tn = 3T (с точностью 5%). Другая важная характеристика – перерегулирование σ – показывает, на сколько процентов максимальное значение выхода ymax превышает установившееся значение: ymax − y∞ = σ ⋅100% . y∞ Справка: понятие «перерегулирование» обычно вводится для случая, когда установившееся значение выхода больше нуля, хотя, в принципе, оно может быть и отрицательным – тогда перерегулирование показывает, насколько «ниже» установившегося значения ушла переходная функция в точке минимума. Иногда удается обеспечить нулевое перерегулирование (апериодический переходный процесс, как у апериодического звена). Нужно помнить, что увеличение быстродействия обычно приводит к увеличению перерегулирования. Известно, что устойчивость линейной системы определяется полюсами ее передаточной функции W(s), однако на переходные процессы влияют и нули, причем в некоторых случаях очень существенно. Для примера рассмотрим передаточную функцию = W (s) as + 1 a ( s + 1/ a ) = , ( s + 1) 2 ( s + 1) 2 где a может принимать как положительные, так и отрицательные значения. Такая передаточная функция имеет нуль в точке s = -1/a . Нули, находящиеся в левой полуплоскости (при a > 0) часто называют устойчивыми (по аналогии с полюсами), а нули в правой полуплоскости (при a < 0) – неустойчивыми. Очевидно, что при a = 0 мы получаем апериодическое звено второго порядка. Теперь построим переходные характеристики этого звена при разных значениях a. Заметим, что при любом a установившееся значение выхода равно W(0) = 1. Рис. 10.2. Переходные процессы с перерегулированием (a > 0) и недорегулированием (a < 0) По графикам видно, что при нулевом значении а переходный процесс – апериодический. При a > 0 (устойчивый нуль) наблюдается перерегулирование, причем оно тем больше, чем больше модуль а. При отрицательных значениях a в переходном процессе есть недорегулирование. Это значит, что в первый момент времени регулируемая переменная начинает изменяться в сторону, противоположную заданному значению. 10.3. Частотные оценки качества переходного процесса Качество системы можно оценивать не только во временной области (переходный процесс во времени), но и в частотной (по частотной характеристике). Из частотных оценок наиболее важны запасы устойчивости. Дело в том, что поведение реального объекта всегда несколько отличается от принятой модели, более того, динамика может меняться во времени, например, когда корабль расходует топливо в ходе рейса. Поэтому недостаточно спроектировать просто устойчивую систему, нужно, чтобы система сохранила устойчивость при некоторых изменениях параметров объекта и регулятора в сравнении с расчетными, то есть, обладала запасами устойчивости. Обычно рассматривают запасы устойчивости по амплитуде и по фазе. Запас устойчивости по амплитуде gm − это дополнительное усиление контура, которое необходимо, чтобы вывести систему на границу области устойчивости. Эта величина измеряется в децибелах. Рис. 10.3. Определение запасов по амплитуде и по фазе Запас по амплитуде вычисляется по формуле 1 , Ag где Ag< 1 − значение амплитудной характеристики на частоте ωg, где фазовая характеристика равна -180° . В практических задачах нужно обеспечивать запас по амплитуде не менее 6 дБ. Запас устойчивости по фазе φт - это дополнительный сдвиг фазы («поворот» частотной характеристики против часовой стрелки), который g m = 20 lg необходим для того, чтобы вывести систему на границу устойчивости. Он определяется на частоте среза ωс, где А(ωс) = 1. Запас по фазе должен быть не менее 30° . Рис. 10.4. Влияние запаздывания в системе на запасы устойчивости Если в системе есть запаздывание на время τ, каждая точка годографа частотной характеристики дополнительно поворачивается против часовой стрелки на угол, равный τω для частоты ω. Поэтому запасы устойчивости (как по амплитуде, так и по фазе) уменьшаются. На рисунке синяя линия соответствует системе без запаздывания, а красная − той же системе с запаздыванием. Видно, что во втором случае запасы устойчивости существенно меньше. Запасы устойчивости легко определяются по логарифмическим частотным характеристикам: Рис. 10.5. Определение запасов устойчивости по логарифмическим частотным характеристикам Заметим, что запас по амплитуде может быть равен бесконечности, если фазовая характеристика не пересекает линию -180°. К сожалению, в некоторых случаях классические запасы устойчивости (по амплитуде и фазе) дают не совсем верное представление о том, насколько система действительно близка к границе устойчивости. Поэтому в качестве единой характеристики иногда используют кратчайшее расстояние γ от годографа до точки (-1; 0). Рис. 10.6. Определение кратчайшего расстояния годографа до точки (-1; 0) Еще одна аналогичная характеристика называется показателем колебательности. Она определяется по амплитудной частотной характеристике замкнутой системы как отношение ее максимума к значению на нулевой частоте: Рис. 10.7. Определение показателя колебательности по АЧХ Для каждого значения M можно нарисовать «запретную области», в которую не должна заходить частотная характеристика разомкнутой системы, если ее показатель колебательности должен быть меньше М. Эта M область имеет форму круга радиуса R = 2 , центр которого находится в M −1  M2  точке  − 2 ;0  . На рисунке показаны границы запретных областей для  M −1  различных значений M. Рис. 10.8. Изображение границ запретных областей для различных значений колебательности M При M = 1 окружность имеет бесконечный радиус (превращается в вертикальную линию) и проходит через точку (-0,5; 0). При увеличении M радиус окружности уменьшается. 10.4. Корневые оценки качества Многие свойства системы можно предсказать, посмотрев на расположение корней характеристического полинома Δ(s) на комплексной плоскости. Прежде всего, все корни Δ(s) для устойчивой системы должны находиться в левой полуплоскости, то есть слева от мнимой оси. Быстродействие системы определяется степенью устойчивости η − так называется расстояние мнимой оси до ближайшего корня (или пары комплексно-сопряженных корней). На рис. 10.9 точками отмечены положения корней характеристического полинома. Он имеет два вещественных корня (обозначенных номерами 1 и 4) и пару комплексно сопряженных корней (2 и 3). Рис. 10.9. Положение корней характеристического полинома Степень устойчивости определяется вещественным корнем 1, потому что он находится ближе всех к мнимой оси. Этот корень называется доминирующим, он определяет самые медленные движения в системе и время переходного процесса, которое может быть примерно рассчитано по 3 формуле tn = . Корни 2, 3 и 4 соответствуют более быстрым движениям. η Следует помнить, что степень устойчивости, несмотря на название, ничего не говорит о близости системы к границе устойчивости, она только характеризует быстродействие. Параметр, определяющий скорость затухания колебаний в системе, называется колебательностью. Система имеет склонность к колебаниям, если характеристическое уравнение содержит комплексные корни η12= –α ± jβ. Колебательность μ для пары комплексно-сопряженных корней α ± jβ вычисляется как отношение мнимой и вещественной частей корня (по модулю): β µ =  , α  чем больше эта величина, тем слабее затухают колебания, вызванные этими корнями, за один период колебаний. Линии постоянной колебательности − это лучи, выходящие из начала координат (рис. 10.10). По значению колебательности можно оценить перерегулирование σ≤e − π µ ⋅100% . Рис. 10.10. Сектор заданных значений системы на комплексной плоскости При проектировании систем обычно требуется обеспечить быстродействие не ниже заданного (степень устойчивости не меньше заданной ηmin) и колебательность не выше заданной μmax. Эти условия определяют усеченный сектор на комплексной плоскости. 10.5. Робастность Обычно регулятор строится на основе некоторых приближенных (номинальных) моделей объекта управления (а также приводов и датчиков) и внешних возмущений. При этом поведение реального объекта и характеристики возмущений могут быть несколько иными. Поэтому требуется, чтобы разработанный регулятор обеспечивал устойчивость и приемлемое качество системы при малых отклонениях свойств объекта и внешних возмущений от номинальных моделей. В современной теории управления это свойство называют робастностью (грубостью). Иначе его можно назвать нечувствительностью к малым ошибкам моделирования объекта и возмущений. Различают несколько задач, связанных с робастностью: • робастная устойчивость - обеспечить устойчивость системы при всех допустимых отклонениях модели объекта от номинальной; • робастное качество - обеспечить устойчивость и заданные показатели качества системы при всех допустимых отклонениях модели объекта от номинальной; • гарантирующее управление - обеспечить заданные показатели качества системы при всех допустимых отклонениях модели возмущения от номинальной (считая, что модель объекта известна точно). Для того, чтобы исследовать робастность системы, нужно как-то определить возможную ошибку моделирования (неопределенность). Ее можно задать различными способами. 10.4.1. Параметрическая неопределенность Параметрическая неопределенность означает, что структура модели известна, а параметры могут отличаться от номинальных, например: где k0 и T0 − номинальные значения коэффициента усиления и постоянной времени, а ε1 и ε2 - малые ошибки моделирования. Предположим, что такой объект управляется регулятором-усилителем с передаточной функцией C(s) = K . Тогда характеристический полином замкнутой системы принимает вид Δ(s) = (T0 +ε2)s +1 + K(k0 +ε1). Робастный регулятор должен обеспечивать устойчивость этого полинома при всех допустимых ε1 и ε2. В данном случае условия устойчивости сводятся к тому, что коэффициенты полинома, T0 +ε2 и 1 + K(k0 +ε1), имеют одинаковый знак (оба положительные или оба отрицательные). Будем считать, что k0 > 0 и T0 > 0, а отклонения ε1 и ε2 малы в сравнении с k0 и T0 соответственно. Таким образом, T0 +s2 > 0 при всех возможных s2. Следовательно, замкнутая система устойчива при 1 + K (k0 + ε1 ) > 0 ⇒ K > −1 . k0 + ε1 Наибольшее значение в правой части последнего неравенства будет при максимальном значении ε1, поэтому условие робастной устойчивости принимает вид −1 K > K min = . k0 + ε1max Таким образом, любой регулятор-усилитель, имеющий коэффициент усиления K > Km i n , обеспечивает робастную устойчивость системы в том смысле, что устойчивость сохраняется при всех допустимых ошибках ε1 и ε2. В более сложных случаях часто используют теорему Харитонова, которая позволяет проверить робастную устойчивость характеристического полинома Δ(s) = a0 + a1s +... + ansn-1 + ansn, где коэффициенты a0, a1,..., an точно неизвестны, но принадлежат интервалам li < ai < ui (i = 1, …, n). Оказывается, полином Δ(s) устойчив при всех возможных значениях коэффициентов тогда и только тогда, когда устойчивы четыре полинома Харитонова: ∆1 ( s ) = l0 + l1s + u2 s 2 + u3 s 3 + l4 s 4 + l5 s 5 + ... ∆ 2 ( s ) = u0 + u1s + l2 s 2 + l3 s 3 + u4 s 4 + u5 s 5 + ... ∆ 3 ( s ) = l0 + u1s + u2 s 2 + l3 s 3 + l4 s 4 + u5 s 5 + ... ∆ 4 ( s ) = u0 + l1s + l2 s 2 + u3 s 3 + u4 s 4 + l5 s 5 + ... Таким образом, для проверки устойчивости бесконечного числа возможных характеристических полиномов достаточно проверить устойчивость четырех полиномов Харитонова. 10.4.3. Непараметрическая неопределенность Непараметрическая неопределенность задает допустимую ошибку в частотной области, то есть ошибку в частотных характеристиках. Для номинальной модели P0(jω) различают аддитивную неопределенность (абсолютную ошибку) Δa(jω): P(jω) = P0 (jω) + Δa(jω) и мультипликативную неопределенность (относительную ошибку) Δm(jω): P(jω) = [1 + Δm(jω)]P 0 (jω). Для мультипликативной неопределенности известен очень простой критерий робастной устойчивости: система с регулятором C(s) и номинальный объектом P0(s) робастно устойчива, если для любой частоты ω выполняется неравенство |W 0 (jω) Δ m(jω) |< 1, (10.1) где W 0 (s) − передаточная функция номинальной замкнутой системы: W0 = C ( s ) P0 ( s ) . 1 + C ( s ) P0 ( s ) Этот результат называется теоремой о малом коэффициенте усиления. При этом также требуется, чтобы реальная и номинальная модели объекта, P(s) и P0(s), имели одинаковые неустойчивые полюса, то есть неопределенность не должна вносить новые источники неустойчивости. Условие (10.1) − это достаточное условие робастной устойчивости, то есть, его выполнение гарантирует устойчивость, но для некоторых робастно устойчивых систем оно может не выполняться. Обычно модель строится так, чтобы хорошо описывать свойства реального объекта на низких частотах, а для высоких частот ошибка моделирования Δm(jω) может быть значительной. Тогда, учитывая (10.1), можно сделать вывод, что с точки зрения робастной устойчивости значение |W 0 (jω)| должно быть мало на высоких частотах, где велика неопределенность модели. 11. МОДАЛЬНОЕ УПРАВЛЕНИЕ. АЛГОРИТМИЗАЦИЯ И МОДЕЛИРОВАНИЕ В СРЕДЕ MATLAB 11.1. Постановка задачи модального управления по спектру матрицы замкнутой системы Поведение в системе автоматического управления определяется корнями характеристического уравнения, которым, в свою очередь, соответствуют составляющие свободного движения системы, называемые «модами». Модальное управление − это такое управление, когда достигается требуемый характер переходных процессов за счет обеспечения необходимого расположения корней характеристического полинома на комплексной плоскости. При этом задача сводится к определению коэффициентов соответствующих обратных связей по состоянию объекта, а не путем применения корректирующих звеньев в прямой цепи САУ. Это управление применяется тогда, когда все составляющие вектора состояния объекта управления доступны непосредственному измерению (полная управляемость). Модальный синтез предполагает формирование таких обратных связей по состоянию, при которых обеспечивается заданное расположение полюсов замкнутой системы. Модой называется составляющая решения дифференциального уравнения, соответствующая конкретному полюсу. Расположение полюсов в основном определяет характер переходного процесса в системе: его быстродействие и длительность, колебательность и перерегулирование. Для оценки быстродействия системы используется понятие степени устойчивости η, под которой понимается расстояние мнимой оси до ближайшего корня (или пары комплексно-сопряженных корней), что дает в переходном процессе наиболее медленно затухающую составляющую. Этот корень называется доминирующим, так как он определяет самые медленные движения в системе и время переходного процесса tп, которое можно приближенно оценить по формуле tп = 3 . η Параметр, определяющий скорость затухания колебаний в системе, называется колебательностью. Система имеет склонность к колебаниям, если ее характеристическое уравнение содержит комплексные корни s12= –α ± jβ. Колебательность μ для пары комплексно-сопряженных корней α ± jβ вычисляется как отношение мнимой и вещественной частей корня (по модулю): µ= β . α По значению колебательности можно оценить перерегулирование δ≤e − π µ ⋅100% . Модальный регулятор относится к полноразмерным (нередуцированным) линейным регуляторам состояния, т. е. для выработки оптимального управления используется информация обо всех координатах управляемого объекта. Векторно-матричная структурная схема (схема пространства состояния) системы модального управления приведена на рис. 11.1. Рис. 11.1. Структурная схема системы модального управления Объект управления (ОУ) может быть представлен в векторно-матричной форме  dX (t )  = AX (t ) + Bu (t ),  dt  y (t ) = CX (t ) + Du (t ). (11.1) где Х(t) – вектор-столбец состояния [п×1]; А – матрица коэффициентов объекта [п×n]; В – матрица входа [n×1]; u(t) – сигнал управления; Y – вектор выхода [k×1]; С – матрица выхода [1×n]; D – матрица влияния входа непосредственно на выход системы [n×1] (часто полагают D = 0). Система, описываемая матрицами А и В является управляемой, если из любого начального состояния Х(0) ее можно перевести в любое другое конечное состояние X(tk) при помощи некоторого входного сигнала в течение конечного интервала времени. Для SISO-системы с одним входом и одним выходом вводится понятие матрицы управляемости (размером п×n) Qу = [В АВ А2В ... Аn-1B] имеющей полный ранг, равный rankQy = n, где n − размерность пространства состояний системы. Если детерминант этой матрицы отличен от нуля (матрица невырождена), то система управляема. Сформируем обратную связь следующим образом: u(t) = [g(t) – LX(t)], (11.2) где g(t) – вектор задающих воздействий размерности m × 1, L – матрица, размерности [m × n] искомых постоянных коэффициентов обратной связи системы по координатам состояния объекта. С учетом линейности структур (11.1) и (11.2) векторно-матричная модель замкнутой системы модального управления получает вид: (11.3) X (t ) = AX (t ) + B[( g (t ) − LX (t )] = ( A − BL) X (t ) + Bg (t ) . Характеристический полином системы определяет ее свободное движение, т. е движение под действием ненулевых начальных условий X(0). Это означает, что свободное движение замкнутой системы определяется только первым слагаемым в (10.3), т.е. выражением X (t ) = ( A − BL) X (t ) . (11.4) Обозначим матрицу свободного движения замкнутой системы в виде ~ A = A − BL . (11.5) Основная теорема модального управления гласит, что если линейная динамическая система (10.1) является управляемой, то линейная обратная связь может быть выбрана таким образом, что матрица (А − ВL) будет иметь желаемое расположение корней (спектр). При доказательстве этой теоремы используется каноническая форма управляемости матриц А и В. Характеристический полином системы имеет вид ~ D( s ) = det( sI − A) . (11.6) ~ Поскольку собственные числа матрицы A однозначно определяют коэффициенты характеристического полинома, задача может быть сформулирована следующим образом: для управляемой системы (11.1) с характеристическим полиномом sn+αn-1sn-1+…+α0=0 (11.7) найти вектор L коэффициентов обратных связей, чтобы замкнутая система (11.4) имела желаемую стандартную форму характеристического полинома (11.6) с заданными коэффициентами li. Процедура расчета коэффициентов обратной связи l1,..., ln проводится в следующей последовательности: 1. Выбираем желаемое распределение корней характеристического уравнения, то есть выбираем желаемую стандартную форму характеристического полинома замкнутой системы. С целью сокращения объема вычислений для случаев объектов высокого порядка целесообразно применить описание объекта в канонической управляемой форме Фробениуса. 2. Находим характеристический полином с помощью формулы (11.6), коэффициенты которого определяют искомые параметры li и масштабирующий коэффициент k0, обеспечивающий нулевую статическую ошибку. 3. Приравниваем коэффициенты при одинаковых степенях s полиномов, полученных на первом и втором шагах, получаем систему уравнений для определения неизвестных параметров li. Решив ее при известных остальных параметрах системы (матрицы А, B, С), находим искомые параметры модального регулятора (элементы матрицы L). При этом k0 предварительного усилителя находится из условия получения требуемых переменных состояния в установившемся режиме, т.е. X i = 0 . Наиболее распространенными из стандартных форм характеристического полинома являются: фильтр Чебышева, распределение Бесселя, распределение Баттерворта, биномиальное распределение и др. Значения коэффициентов характеристического уравнения D(s) в зависимости от порядка системы в биномиальном распределении и распределении Баттерворта представлены соответственно в таблицах 11.1 и 11.2. Таблица 11.1. Полиномы Баттерворта для различного порядка системы n Полиномы Баттерворта 1 s+ω 2 s2 + 1.414ωs + ω2 3 s3 + 2ωs2 + 2ω2s + ω3 4 s4 + 2.613ωs3 + 2.414ω2s2 + 2.613ω2s + ω4 5 s5 + 3.236ωs4 + 5.236ω2s3 + 5.236ω3s2 + 3.235ω4s + ω5 6 s6 + 3.86ωs5 + 7.46ω2s4 + 9.136ω3s3 + 7.46ω4s2 + 3.86ω5s +ω6 Таблица 11.2. Биномиальные полиномы для различного порядка системы Биномиальные полиномы n 1 s+ω 2 s2 + 2ωs + ω2 3 s3 + 3ωs2 + 3ω2s + ω3 4 s4 + 4ωs3 6ω2s2 + 4ω3s + ω4 5 s5 + 5ωs4 + 10ω2s3 + 10ω3s2 + 5ω4s + ω5 6 s6 + 6ωs5 + 15ω2s4 + 20ω3s3 + 15ω4s2 + 6ω5s +ω6 Аккерманом была предложена формула, позволяющая с помощью преобразования подобия перевести модель произвольной структуры в каноническую форму управляемости, определить искомые коэффициенты L, а затем пересчитать полученное решение применительно к исходной структуре. Формула Аккермана имеет вид [3] L = [0 0 … 1]·[B AB A2B ,,, An-1B]·[An ln-1An-1 … l1A l0I], где li – коэффициенты характеристического полинома матрицы (А – ВL). Искомую матрицу L коэффициентов обратных связей можно получить в результате решения системы уравнений (11.6) и (11.7) путем приравнивания в этих выражениях коэффициентов при операторе s c одинаковыми степенями. Заметим, что эта рутинная операция в среде MATLAB может быть выполнена с помощью функций acker либо place соответственно для одномерных и многомерных систем. С их назначением, синтаксисом и примерами использования, в случае необходимости, можно ознакомиться по справке (help acker или help place). Таким образом, задача модального синтеза сводится к выбору желаемых, корней характеристического полинома замкнутой системы, при которых обеспечиваются заданные параметры переходного процесса, после чего в соответствии со стандартным алгоритмом рассчитываются коэффициенты обратных связей по состоянию. 11.2. Синтез модального регулятора на базе стандартных полиномов Синтез модального регулятора рассмотрим на конкретном примере системы управления нейтральным объектом. Пример 11.1. Рассмотрим задачу синтеза обратной связи для системы управления электроприводом перемещения. Упрощенная линейная модель разомкнутой системы управления описывается дифференциальным уравнением вида:  + ϕ = ku Tϕ где: Т − постоянная времени привода, учитывающая его инерционность; k − общий статический коэффициент передачи канала управления; φ и ω − соответственно угол поворота и угловая скорость электродвигателя; u − управляющий сигнал (напряжение управляемого источника питания). Переходя к изображениям по Лапласу, получим: Ts2φ(s) + sφ(s) =ku(s), откуда k k k ϕ( s ) = 2 = 1 ⋅ 2, u ( s ) Ts + s Ts + 1 s где k1·k2 = k. Представим объект управления структурной схемой в виде последовательного соединения апериодического и интегрирующего звеньев (рис. 11.2). Рис. 11.2. Структурная схема объекта управления в операторном виде Если за X1 принять переменную состояния, пропорциональную углу поворота электропривода, т. е. X1=φ=y, а за X2 − переменную состояния, пропорциональную угловой скорости электропривода, т. е. X 2 = ϕ = ω , то уравнения объекта в скалярной форме будут иметь вид  X 1 = K 2 X 2  K1 1 U − X2  X 2 = T T  Y = X 1 Уравнение объекта в векторно-матричной форме согласно (11.1): Отсюда находим  X = AX + BU  Y = CX 0  0 K 2  B =  K1  ; A= 1; C = [1 0] −     T   T  Корни характеристического уравнения разомкнутой системы λ1=0, λ2= -1/T. Следовательно, объект управления является нейтральным. Для обеспечения заданного перемещения G(t) введем линейные обратные связи по углу и угловой скорости u(t) = – l1 x1(t) – l2 x2(t) + k0 G(t). Тогда замкнутая система с модальным управлением, описываемая дифференциальными уравнениями в скалярной форме  X 1 = K 2 X 2  K1 K 1  K 0 g (t ) − X 2 − 1 (l1 X 1 + l 2 X 2 ) X 2 = (11.7) T T T  Y = X1   будет иметь вид, показанный на рис. 11.3. Рис. 11.3. Замкнутая линейными обратными связями система управления Коэффициент усиления предварительного усилителя К0 найдем из условия обеспечения установившегося перемещения (заданного), т.е. y=x1=g. При этом X 1 = X 2 = 0 . Тогда из уравнения (10.7) получим K0 = l1 . Из (10.7) получим матрицу свободного движения замкнутой системы  0 ~  A = K1l1 −  T K2   1 K l  −  + 1 2  . T  T Тогда, характеристическое уравнение замкнутой САУ с неизвестными параметрами li модального регулятора согласно (11.6):   0 1 0  ~  D( s ) = det[ sI − A] = det s  − Kl  0 1  1 1  T   s =  K1  l1 T K2   1 K l   = −  − 1 2   T   T − K2  kk 1 K 1 K1  = s 2 + s ( + 1 l 2 ) + 1 2 l1 = 0. s+( + l 2 ) T T T T T  (11.8) Если для САУ второго порядка принять коэффициенты желаемого характеристического уравнения (11.8) в соответствии с распределением Батворта, 2 D(s) = s +1,4ωs + ω2 = 0 и tp =3/ω, (11.9) то предварительно задавшись требуемым временем переходного процесса tp, приравнивая коэффициенты при одинаковых степенях оператора s в уравнениях (11.8) и (11.9), получим следующие коэффициенты обратных связей (модального регулятора): 32 T l1 = 2 ; t p K1 K 2   1,4 ⋅ 3 ⋅ T l2 =  − 1 / K 1   t p   (11.10) Теперь для той же САУ примем коэффициенты желаемого характеристического уравнения (11.8) в соответствии с биномиальным распределением, т. е. D(s) = s2 +2ωs + ω2 = 0 и tp ≈ 3/ω, (11.11) Задавшись тем же временем переходного процесса tp, приравнивая коэффициенты при одинаковых степенях оператора s в уравнениях (11.8) и (11.11), получим следующие коэффициенты обратных связей (модального регулятора): l1 = 32 T ; t 2p K1 K 2   2 ⋅ 3⋅T l2 =  − 1 / K 1   t   p (11.12) Для приведенной САУ модального управления примем следующие значения параметров: T = 0,2 c.; k1 = 10; k2 = 0,1; tp = 0,3 c. Тогда коэффициенты обратных связей модального регулятора, рассчитанные по формулам (11.10) и (11.12), будут иметь значения: – для биномиального распределения – l1 = 20; l2 = 0,3; – для распределения Баттерворта – l1 = 20; l2 = 0,18. С помощью пакета Simulink MATLAB построена схема САУ с модальным регулятором (рис. 11.4), настроенным на распределение Баттерворта, и выполнено ее моделирование. 0.18 Gain1 Sum1 20 Step Gain6 1 50 Sum Gain5 0.1 s Transfer Fcn (with initial states)1 Gain4 Transfer Fcn2 Scope 5 Gain 20 Gain2 Рис. 11.4. Модель системы модального управления с настройкой регулятора по распределению Баттерворта На рис. 11.5 приведены результаты моделирования САУ с модальным управлением в среде MATLAB. а) б) Рис. 11.5. Переходные процессы в системе с биномиальной (а) настройкой регулятора и по распределению Баттерворта (б) На рис. 11.5 изображены переходные процессы при g(t) = 1 для биномиального распределения (а) и для распределения Баттерворта (б). При использовании распределения Баттерворта время переходного процесса меньше, чем при использовании биномиальной настройки, но в тоже время появляется перерегулирование. При использовании биномиальной стандартной настройки и стандартного распределения Баттерворта ошибка системы регулирования с нейтральным объектом стремится к нулю. В обоих случаях быстродействие выше, чем при классических оптимальных настройках регуляторов (например, модульной и симметричной). 11.3. Инструментарий MATLAB для синтеза модального регулятора В программном комплексе MATLAB для формирования модели в пространстве состояний используется функция ss, синтаксис которой » w1=ss(A, В, С, D), где А, В, С, D – матрицы модели. Модель в пространстве состояний связана с передаточной функций (ПФ) командой: » w2=tf(w1). Обратное преобразование модели, заданной ПФ в пространство состояний осуществляется той же командой ss, например » w=tf([2 2],[3 4 1]); » w1=ss(w) Заметим, что одной и той же ПФ могут соответствовать разные модели в пространстве состояний, но всем этим моделям соответствует одна и та же ПФ. Матрица управляемости может быть построена с помощью функции ctrb, которая вызывается одной из команд: » W=ctrb(A, В) » W = ctrb(sys) » W= ctrb(sys.A, sys.B) В пакете MATLAB имеется функция acker, с помощью которой можно обеспечить желаемое расположение полюсов одномерной линейной системы (в соответствии с формулой Аккермана): » k = acker(A,B,P), где А и В − матрицы системы; Р – вектор, задающий желаемое расположение полюсов системы. Пример 11.2. Пусть система описывается матрицами  0 1 0  A= , B =  1 . − 2 3   Желаемые полюса заданы вектором: P = [-1 -3]. Тогда рассчитать значение коэффициентов обратных связей можно с помощью команд » А=[0 1;-2 3]; » B=[0; 1]; » P=[-1 -3]; » L=acker(A,B,P) K= 1 7 Таким образом, управление в этом примере должно быть сформировано в виде  x (t )  u (t ) = − LX (t ) = −[1 7]⋅  1  = − x1 (t ) − 7 x2 (t ) .  x2 (t ) (11.13) Для многомерных систем в пакете MATLAB имеется функция place (ее можно использовать также и для одномерных систем), реализуемая командой » L=place(A,B,P), которая рассчитывает матрицу L коэффициентов обратных связей, которая обеспечивает желаемое расположение полюсов системы. Длина вектора Р должна быть равна числу строк матрицы А. Следует заметить, что метод модального управления не гарантирует равенство установившейся ошибки нулю. Для обеспечения равенства задающего воздействия и выходного сигнала системы в установившемся режиме вводится масштабирующий коэффициент k0. Для его вычисления запишем уравнения состояния в виде:  x1   0 1  x1  0  x  = − 2 3  x  + 1 (u + k 0 g ) ,  2     2  подставляя уравнение (10.9), имеем: x2   x1   =  x  − 3 x − 4 x + k g  1 2 0   2  x  y = CX = [1 0] 1  = x1 .  x2  В установившемся режиме получаем (11.14) x1 = x 2 = x2 = 0 и должно выполняться условие y = g. Следовательно, из уравнения (10.10) получаем ko=3. На эту величину должно умножаться входное воздействие. В пакете моделирования Simulink MATLAB для описания объекта в пространстве состояний имеется блок State Space, позволяющий моделировать работу модального регулятора при условии описания матричных операций. 11.4. Пример синтеза и моделирования системы в среде MATLAB Пример 11.3. Выполнить: 1) синтез модального регулятора для системы управления с заданной на рис. 11.6 структурой и параметрами, согласно таблице 11.1. Рис. 11.6. Структурная схема системы управления без регулятора Таблица 11.3. Исходные параметры: № Kтп вар. (о.е.) 7 50 Ттп Rэ TЭ (с) (Ом) (с) 0,01 2,0 0,04 Kд Tм Kt (Вс) (с) (Ом) 0,2 0,2 0,2 Tt Tmt (с) (с) 0,03 0.015 Ia ωn (А) (рад/с) 20 40 tg (с) 0,35 2) моделирование полученной системы модального управления с применением Приложений Simulink MATLAB; 3) моделирование синтезированной с помощью Приложения Control Toolbox MATLAB системы модального управления. 1) Синтез модального регулятора Дифференциальные уравнения, составленные на основе структурной схемы, имеют вид: RЭ K Д  (i − ic ) ω =  T M   1    di 1  1  e = − ω − i    П K  , dt T R Э  Д  Э     de  П = 1 (U у K ТП − e П ) TТП  dt где второе уравнение системы получено из обобщенного дифференциального уравнения апериодического звена с передаточной функцией 1/(Tэs+1) Tэ где K= di (t ) + i (t ) = Ku (t ) , dt  1  1 ω . , u (t ) =  eп −  K Rэ Д   Отсюда, вектор состояния исходной системы управления будет представлен следующим вектором X=[ω, i, eп]T=[x1, x2, x3]. Подставив конкретные значения, получим: ω = 2(i − ic ) di = 12.5e П − 62.5ω − 25i dt de П = 5000U у − 100e П dt В векторно-матричной форме дифференциальные уравнения 2 0   0   0   A = − 62.5 − 25 12.5 ; B =  0  . 5000  0 − 100 Матрица состояния замкнутой системы в соответствии (10.5) 2 0   0   0 ~  A = − 62.5 − 25 12.5  −  0  ⋅ [l1 l 2  0 − 100 5000  0 l3 ] =  − 62.5 − 5000l1 2 − 25 − 5000l 2   12.5  − 100 − 5000l3  Характеристический полином замкнутой САУ −2  s ~  D( s ) = det( sI − A) =  62.5 s + 25 5000l1 5000l 2 − 12.5  =  s + 5000l3 + 100 = s 3 + (5000l3 + 125) s 2 + (125000l3 + 62500l 2 + 2625) s + 625000l3 + 125000l1 + 12500. Зададимся желаемым временем регулирования tр.жел=0.2 характеристическим полиномом с желаемым расположением корней c и D(s)=(Ts + 1)n=(0,02s+1)3 = 8‧10-06 s3 + 0.0012s2 + 0.06s + 1, где T= tp.жел./3n =0,2/(3‧3) ≈ 0,02 c. Приведя его к каноническому виду, получаем D(s)=s3 +150s2 + 7500s + 125000, Приравнивая коэффициенты при одинаковых степенях s характеристического полинома замкнутой САУ и желаемого полинома, получаем s2 : 5000l3 + 125 = 150 s : 125000l3 +62500l2 + 2625 = 7500 s0 : 625000l3 + 125000l1 +12500 = 125000 или в матричной форме 5000   l1  150 − 125  0     0 62500 125000  ⋅ l 2  = 7500 − 2625  .  125000 0 625000 l3  125000 − 12500 Отсюда, получим вектор искомых коэффициентов обратных связей −1 5000   125  l1  0   l  = 0 62500 125000  = 4875  ,  2  112500 l3  125000 0 625000 равных следующим значениям: l1=0,875, l2=0.068, l3=0.05. 2) Моделирование замкнутой системы с использованием Приложения Simulink MATLAB Структура замкнутой модели системы управления, построенной с помощью Приложения Simulink MATLAB с учетом найденных значений коэффициентов усиления обратных связей и заданных значений параметров разомкнутой САУ, представлена на рис. 11.7. Рис. 11.7. Структура замкнутой системы, построенная в Simulink MATLAB Кривые переходных процессов в замкнутой системе при ступенчатом приложении задающего воздействия приведены на рис. 11.8. Рис. 11.8. Переходные процессы в системе модальным регулятором Верхние графики отражают задающее воздействие, средние – изменение тока нагрузки, нижние – скорости вращения вала двигателя. Как следует из полученных графиков, длительность переходных процессов не превышает заданное (желаемое) время регулирования системы модального управления. 3) Моделирование синтезированной с помощью Приложения Control Toolbox MATLAB системы модального управления а) Исследование динамики исходной (без регулятора) системы Для получения динамики системы воспользуемся функциями типовых соединений звеньев: series, parallel, feedback. Введем обозначения звеньев: % Передаточная функция тиристорного преобразователя sys1=tf(Ktp,[Ttp 1]); % Передаточная функция регулятора ЭДС sys2=tf(1/Re,[Te 1]); % Передаточная функция усилителя мощности sys3=tf(Re*Kd,[Tm 0]); % Передаточная функция датчика ЭДС электродвигателя sys4=tf(1/Kd,[0 1]); в результате получим: >> sys1 Передаточная функция (Transfer function): 50 ---------0.01 s + 1 >> sys2 Передаточная функция (Transfer function): 0.5 ---------0.04 s + 1 >> sys3 Передаточная функция (Transfer function): 0.4 ----0.2 s >> sys4 Передаточная функция (Transfer function): 5 Согласно рис.10,6 сначала соединим последовательно звенья sys2 и sys3. В результате получим: sys23=series(sys2,sys3) sys23 Передаточная функция (Transfer function): 0.2 ----------------------0.008 s^2 + 0.2 s Введем звено sys4, находящееся в обратной связи (рис.11.6), и получим sys234: sys234=feedback(sys23,sys4) sys234 Передаточная функция (Transfer function): 0.2 ---------------------------0.008 s^2 + 0.2 s + 1 Затем последовательно соединим звенья sys1 и sys234. В результате будет определена передаточная функция системы sys1_4, представленной на рис.11.6 sys1_4=series(sys1,sys234); sys1_4 Передаточная функция (Transfer function): 10 -----------------------------------------8e-005 s^3 + 0.01 s^2 + 0.21 s + 1 По полученной передаточной функции в среде LTI определим структуру эквивалентной непрерывной системы в пространстве состояний с матрицами A, B, C и D, согласно уравнениям (11.1): sys=ss(sys1_4) >> sys=ss(sys1_4) a= x1 x2 x3 x1 -125 -41.02 -12.21 x2 64 x3 16 b= u1 x1 8 x2 0 x3 0 c= x1 y1 d= u1 y1 0 x2 x3 0 15.26 Получена непрерывная модель в пространстве состояний (Continuoustime state-space model). Видно, что в модели использованы обозначения: A=a, B=b, C=c и D=d. Получим переходный процесс (рис. 11.9) в системе sys1_4: step(sys), grid Step Response 10 9 8 7 Amplitude 6 5 4 3 2 1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Time (seconds) Рис. 11.9. Переходный процесс в системе sys (без регулятора) Из рис. 11.9 следует, что время переходного процесса в системе без регулятора составляет около 1 с. Система устойчива. Собственные значения матрицы A равны: >> eig(sys)=[-100.0000; -18.0902; -6.9098]. б) Выбор «эталонной» модели характеристического полинома Теперь предположим, что требуется повысить быстродействие системы, например, уменьшить время переходного процесса до значения tр.жел.=tg =0.35 c. (см. таблицу исходных данных) при сохранении монотонности формы переходного процесса. С этой целью необходимо выбрать корни полинома знаменателя системы с регулятором, при которых можно обеспечить заданное быстродействие и апериодический закон изменения переходной функции путем дополнения полученной структуры sys обратными связями по координатам состояния x1, x2 и x3. Существует большое число способов выбора наиболее «подходящего» переходного процесса для динамических систем, по существу, являющихся низкочастотными фильтрами. Не останавливаясь подробно на этом вопросе, отметим лишь следующее. В настоящее время на практике наиболее часто используются линейные формы, основанные на применении бинома Ньютона, низкочастотных фильтров Баттерворта, Бесселя, Чебышева и др. Поскольку для стандартных линейных форм полиномов перечисленных фильтров известны также переходные процессы, мы можем выбрать соответствующий стандартный переходный процесс. При заданном порядке полинома известны и его корни. Остается лишь стандартный переходный процесс принять как «желаемый» и настроить проектируемую систему на получение подобного процесса с помощью регулятора L. Слово «подобный» здесь означает, что переходный процесс по форме остается «стандартным», однако при настройке может использоваться операция его растяжения или сжатия во времени путем выбора коэффициента сжатия (среднегеометрического корня). При выборе полинома с кратными корнями в форме (sT+1)n , где n – порядок полинома (целое число), можно воспользоваться простой связью между T и tр.жел.=tg , устанавливаемой с помощью соотношения (11.9): T≈ t р. жел. 3n . Принимая n=3, в кодах MATLAB мы получим передаточную функцию желаемой замкнутой системы Sd: T=tg/(3*n); sd=tf(1,[T 1]);sd1=series(sd,sd); Sd=series(sd1,sd). Далее определим ее эквивалент в пространстве состояний и оценим собственные значения (вектор p): Sdd=ss(Sd); p=eig(Sdd). в) Синтез модального регулятора Воспользуемся функцией acker для синтеза регулятора L: L=acker(A,b,p). Коэффициенты регулятора равны: L =[-5.9821 -1.2531 0.5631]. Матрицы A и b получены ранее для системы без регулятора (см.sys). Согласно (5), получаем матрицу состояния замкнутой систе6мы с регулятором Ac=A-b*L и находим собственные значения, которые эквивалентны элементам вектора p. eig(Ac) г) Моделирование системы с модальным регулятором Переходные процессы в системе с синтезированным модальным регулятором получены с помощью функции initial и приведены на рис. 11.10. Response to Initial Conditions To: Out(1) 0.2 To: Out(2) Amplitude -0.2 -0.5 To: Out(3) -1 1 0.5 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 Time (seconds) Рис. 11.10. Переходный процесс в системе с модальным регулятором С этой целью создана система SYSA. Для измерения всех переменных состояния выберем матрицу С, равную единичной матрице, что обеспечит равенство измерений соответствующим значениям переменных состояния. При получении системы в пространстве состояний выберем «пустые» матрицы B и C. Зададим вектор начальных условий x0=[0 0 1]’, как показано ниже: C=eye(3); SYSA=ss(Ac,[],C,[]) x0=[0 0 1]'. На заключительном этапе выполним моделирование системы с регулятором состояния L: initial(SYSA,x0), grid. Из графиков переходных процессов (рис. 10.7) видно, что продолжительность переходного процесса составляет приблизительно 0.35с, т.е. соответствует заданному значению по условиям задачи синтеза регулятора. 11.5. Задание на самостоятельную работу 1. Для полученного варианта объекта управления, заданного матрицами А, В, С (см. табл. 11.4), обосновать возможность модального управления с помощью критерия управляемости. 2. Рассчитать коэффициенты обратной связи, при которой обеспечивается желаемое расположение полюсов замкнутой системы. Рассмотреть два варианта - когда перерегулирование равно 30 и 0% (апериодический процесс). 3. С помощью выбора масштабирующего коэффициента обеспечить в системе нулевую установившуюся ошибку. 4. Собрать в Simulink MATLAB структурную схему системы с модальным регулятором (не используя блок State space) и проверить полученные результаты. Таблица 11.4. Модели в пространстве состояний № п/п 1 2 A  − 39 − 71 − 23   23 40 13   − 6,6 − 10,7 − 3,3 B  0,228  − 0,127     0,038   − 44 − 78 − 25    26 43 , 7 14   − 7,5 − 11,8 − 3,7  0,228  − 0,127     0,038  C [28000 84000 112000] [28000 84000 112000] 3 4 5 6 7 8 9 10 11 12 − 54 − 98 − 32   31 55 17,8    − 9 − 15 − 4,8 − 60,8 − 107 − 34,7  35 60 19    − 10 − 16,7 − 5,3  − 72,4 − 130,6 − 42,5   41,5 73 23 , 6    − 12 − 20,6 − 6,6  − 80,4 − 142,5 − 46   45,9 79,6 25,6    − 13,6 − 22,6 − 7,2 − 100,5 − 174,4 − 56   57 97 31    − 17 − 28 − 8,9 − 13,2 − 16,3 − 4,7  8,6 9,5 2,6    − 2,4 − 1,5 − 0,3 − 11,4 − 16,7 − 5,13    7,5 9 , 7 2 , 9    − 2 − 1,6 − 0,36 − 16,2 − 26,3 − 8,3  10,2 15 4,6    − 2,9 − 3,2 − 0,9 − 22,3 − 38,6 − 12,4  13,6 21,9 6,9    − 3,9 − 5,3 − 1,6   − 34 − 54 − 17   20 30,5 9,4    − 5,9 − 7,9 − 2,3 Отчет должен содержать:  0,228  − 0,127     0,038   0,228  − 0,127     0,038   0,228  − 0,127     0,038   0,228  − 0,127     0,038   0,228  − 0,127     0,038   0,228  − 0,127     0,038   0,228  − 0,127     0,038   0,228  − 0,127     0,038   0,228  − 0,127     0,038   0,228  − 0,127     0,038  [35000 105000 140000] [35000 105000 140000] [42000 126000 168000] [42000 126000 168000] [42000 126000 168000] [3500 10500 14000] [7000 21000 28000] [14000 42000 56000] [21000 63000 84000] [21000 63000 84000] – краткие теоретические сведения; – расчетную часть; – структурные схемы моделирования в Simulink; – графики переходных процессов в системе. Лекция. 25 марта 2021 г. _ А 12. ОЦЕНКА СОСТОЯНИЯ ОБЪЕКТА И ВОЗМУЩЕНИЙ 12.1. Постановка задачи оценки состояния При наличии информации о текущих значениях переменных состояния объекта может быть решена задача модального управления − обеспечения заданных значений коэффициентов характеристического многочлена, что предполагает, что все компоненты вектора состояния X могут быть измерены. Кроме того, решение различных задач оптимального управления процессами основано на использовании значений всего вектора состояния. Актуальной является также задача оценивания неизмеряемых возмущений для организации комбинированного управления. В реальных условиях измерение вектора состояния, как правило, неосуществимо из-за необходимости установки датчиков в труднодоступных местах, измерения производных высоких порядков и так далее. Еще более сложной задачей является измерение возмущений. Таким образом, при решении практических задач управления в САУ не все переменные состояния объекта бывают доступными для измерения, а только некоторые входы и выходы. Причем, некоторые компоненты могут быть неизвестны по одной из двух причин: – измерительных приборов может быть недостаточно; – некоторые компоненты вектора X могут не иметь физического смысла. Преодолеть (или уменьшить) эти трудности можно, если наиболее полно использовать имеющуюся априорную информацию о модели объекта и текущие измерения его входов и выходов. С этой целью в систему управления вводится подсистема (алгоритм) оценивания состояния объекта и возмущений [3, 8]. Различают три типа оценок состояния: • сглаживание − по текущим данным определяется поведение системы в прошлом, т.е. по результатам измерений к моменту времени t оценивается состояние системы на момент t - Т, Т > 0; • фильтрация − по текущим данным определяется состояние системы в тот же самый момент времени; • прогноз − производится экстраполяция результатов измерений, т.е. по данным к моменту времени t оценивается состояние системы в будущем, на момент t + Т, Т > 0. Таким образом, оценивание является задачей восстановления состояния системы по доступной текущей информации о ее входах и выходах. Эта задача принципиально разрешима, если имеется взаимно однозначное соответствие между переменными вход-выход и состоянием объекта. Это соответствие имеется для полностью наблюдаемых объектов. Отсюда, если система является наблюдаемой, то все компоненты вектора X могут быть восстановлены по наблюдениям вектора Y. Состояние Х(t) называется наблюдаемым, если в момент наблюдения t = t0 можно однозначно определить начальное состояние X(t0) по данным измерения Y(t) и U(t) на конечном интервале t0 ≤ t ≤ tk при u(t) = 0. Наблюдаемость системы описывается условием: rank [C; CA; CA2; … CAn-1]T = n. Для системы с одним входом и одним выходом матрица наблюдаемости (размером п×n) имеет вид: [C; CA; CA2; … CAn-1]T. Если детерминант этой матрицы отличен от нуля, то система наблюдаема. В настоящее время известны два подхода косвенного определения компонент вектора состояния управляемого объекта, недоступных прямому измерению. Первый подход основан на применении наблюдающих устройств полного порядка, предложенных Р. Калманом (фильтр Калмана). Второй подход основан на применении наблюдающих устройств пониженного порядка, предложенных Луенбергером. Рассмотрим кратко первый подход косвенного определения недоступных для измерения компонент вектора состояния объекта. 12.2. Алгоритм работы наблюдателя состояния полного порядка Рассмотрим наблюдатель, у которого размерность вектора состояния такая же, как и у объекта (так называемый наблюдатель полного порядка, или наблюдатель Калмана). Для того чтобы узнать все компоненты вектора состояния объекта, можно использовать его модель dX (t ) = AX (t ) + BU (t ) . dt (12.1) Если начальное состояние объекта и модели совпадают и модель адекватна объекту, то при отсутствии возмущений можно получить асимптотически точную оценку состояния в любой момент времени Xˆ (t ) = X (t ) , где X(t) − оценка вектора состояния объекта. Однако реализация такого алгоритма затруднена из-за влияния параметрических и координатных возмущений, а также сложностей вычислительного характера, также не может быть и полное равенство начальных условий. Поэтому на практике можно рассчитывать лишь на выполнение условия lim Xˆ (t ) = X (t ) . t →∞ Подобным свойством обладают так называемые асимптотические наблюдающие устройства (динамические компенсаторы). Наблюдатель состояния (идентификатор состояния, наблюдающее устройство, наблюдатель) можно представить в виде модели объекта управления, на вход которой поступает то же управляющее воздействие, что и на объект управления и, кроме того, дополнительный сигнал коррекции (обратной связи). Этот сигнал e = Y − Yˆ получается из невязки между выходами объекта и модели (рис. 12.1). Его влияние придает поведению модели качественно новые свойства (отличные от свойств объекта). Собственные движения модели и объекта оказываются различными, но переменные состояния модели служат оценками состояния объекта. Рис. 12.1. Обобщенная система управления в составе реального объекта и наблюдателя Сформируем требуемый закон управления, но вместо переменных состояния реального объекта будем использовать их оценки, полученные с помощью наблюдателя (рис. 12.1). Пусть объект управления описывается уравнением (12.1). Тогда работа наблюдающего устройства для оценки переменных состояния X по измеряемым переменным управления U и выходным переменным Y должна строиться в соответствии с уравнениями,     X = AX + BU + N (Y − Y )   (12.2) Y = CX отображающими его работу в составе обобщенной системы управления, представленной на рис. 12.1, где: xˆ ∈ R n − вектор состояния наблюдателя, служащий оценкой состояния объекта; N – (n×l) − матрица коэффициентов усиления (настройки) наблюдателя, подлежащих определению, Yˆ = CXˆ (t ) − вектор выхода наблюдателя, служащий оценкой вектора выхода объекта. Уравнения наблюдателя (12.2) описывают регулятор, входом которого является процесс Y, выходом – новое управляющее воздействие U. В отличие от модального регулятора с матрицей коэффициентов обратных связей L по уравнению (11.2), представленный регулятор является уже динамической системой, порядок которой совпадает с порядком объекта управления. И называют такой регулятор динамическим компенсатором. Объединив уравнения (12.2), получим:    X = AX − NCX + BU + NY (12.3) Если в уравнении (12.3) заменить выход Y = CX, то уравнение наблюдателя можно записать в следующем виде:    X = AX − NCX + BU + NCX (12.4) Асимптотическое наблюдающее устройство использует обратную связь  по ошибке ε = X − X восстановления вектора состояния, которую можно получить, вычитая из уравнения (12.4) уравнение (12.1). Отсюда векторное уравнение для ошибки будет иметь вид: ε = Aε − NCε = ( A − NC )ε = Hε , где H = (A − NC) − матрица динамических свойств наблюдателя. Выбором элементов матрицы N наблюдателю можно придать любое желаемое распределение корней (собственных чисел матрицы H) характеристического уравнения D(s)=det [sI – H], (12.5) при котором процесс оценивания (12.4) асимптотически устойчив и ε(t)→0, т. е. при t→∞ оценочные переменные состояния наблюдателя стремятся к переменным состояния объекта при любых начальных значениях х0, x̂0 . Уравнение наблюдателя в конечном итоге приобретает вид:   X = HX + BU + NY . (12.6) Для выбора распределения корней характеристического уравнения наблюдателя обычно пользуются одной из стандартных форм, например sn+αn-1sn-1+…+α0=0. (12.7) При этом также как и при расчете модального регулятора приравнивают коэффициенты при одинаковых степенях оператора s в уравнениях (12.5) и (12.7) и находят выражения для определения элементов матрицы N наблюдателя через параметр ω стандартных форм. Общий вид системы управления с наблюдателем показан на рис. 12.2. Рис. 12.2. Структура системы управления с наблюдателем Параметры наблюдателя и параметры регулятора могут рассчитываться независимо. Понятно, что процессы в наблюдателе должны протекать более быстро, чем переходный процесс в системе. Эмпирически установлено (см. [5]), что наблюдатель должен обладать быстродействием, в 2 – 4 раза превышающим быстродействие системы. 12.3. Синтез наблюдающего устройства полного порядка Наблюдающее устройство целесообразно применять в системах модального управления. Рассмотрим синтез наблюдающего устройства для системы модального управления, разработанной в примере 11.1. Расчет проводится в следующей последовательности: • задать элементы матрицы H в общем виде, найти выражения элементов для матрицы динамического компенсатора (12.5) и записать уравнение в скалярной форме. С учетом матриц А и С объекта управления (рис. 12.2), запишем в общем виде матрицу динамического компенсатора: 0 k 2   n  0 k 2   n 0  − n1 k 2  1 1   H = A − NC = 1 −   ⋅ [1 0] =  1− 1; = 0 -   n 2  0 -   n 2 0   − n 2 −  T T T    • в соответствии с уравнением (12.4) найти выражение для коэффициентов характеристического уравнения наблюдателя:  s + n1 − k 2  1 1  D( s) = det[ sI − H ] = det  1  = s 2 +  n1 +  s + k 2 n2 + n1 = 0 ; s+  T T  n2  T  (12.8) • задаться одной из стандартных форм характеристического уравнения и приравнять коэффициенты характеристических уравнений при одинаковых степенях s (12.8) и стандартной формы. Выразить неизвестные коэффициенты через параметр ωn стандартной формы характеристического уравнения наблюдателя или, в конечном счете, через желаемое быстродействие и перерегулирование. Для примера выберем биномиальное распределение s2 + 2ωns + ωn2 =0 из табл. 11.2, где n=2. Тогда искомые коэффициенты наблюдателя будут равны: 1 1 ωn2 = k 2 n2 + n1 ; 2ωn = n1 + ; T T • значение параметра ωn и значение ω стандартной формы характеристического уравнения модального регулятора (пример 11.1) должны находиться из соотношения ωn = (1,5 ÷ 2,0)ω, чтобы обеспечить более высокое быстродействие работы наблюдателя по сравнению с управляемой системой. С учетом условия обеспечения более высокого быстродействия наблюдателя, примем: ωn = 1,5ω рад/с; tp = 3/ω = 0,3 с; k1 = 10; k2 = 0,1; Т = 0,2 с. Тогда численные значения коэффициентов наблюдателя будут: n1 = 25; n2 = 1000. Запишем в скалярном виде уравнения системы модального управления с наблюдателем:  X 1 = K 2 X 2  K 1  X 2 = 1 U − X 2 T T  Y = X 1     X K X n Y n Y = + − 2 2 1 1  1  X = − 1 X + K1 U + n Y − n Y 2 2 2  2 T T  U = K (G (t ) − l X − l X ). 1 1 2 2  (12.9) По полученным в скалярной форме уравнениям (12.9) разработана структурная схема системы с числовыми данными (рис. 12.3) и выполнено моделирование ее переходных процессов с помощью пакета MATLAB и его приложения Simulink. Коэффициенты наблюдателя и модального регулятора выбраны с использованием биномиального распределения. Рис. 12.3. Система модального управления с наблюдателем На рис. 12.4 и 12.5 представлены результаты моделирования системы модального управления с наблюдателем, выполненные в среде пакета прикладных программ Simulink MATLAB с настройкой наблюдателей по биномиальному закону и распределению Баттерворта соответственно. На эпюрах каждого из графиков приведены переходные процессы при g(t)=1 для рассмотренной системы модального управления с наблюдателем (эпюра а) и без наблюдателя (эпюра б). Рис. 12.4. Переходные процессы в системе с настройкой наблюдателя по биномиальному закону Рис. 12.5. Переходные процессы в системе с настройкой наблюдателя по распределению Баттерворта Из графиков на рис. 12.4 и рис. 12.5 видно, что сходимость переменных состояния наблюдателя и переменных состояния объекта достаточно высокая (графики а и б) и быстрая. Кроме того, быстродействие системы модального управления с наблюдателем несколько выше, чем в системе без наблюдателя (график в). 12.4. Инструментарий MATLAB для моделирования наблюдателей Если исходная модель САУ задана в пространстве состояний как sys=ss(A,В,С,D), где А, В, С, D – матрицы модели, то матрица наблюдаемости в программном комплексе MATLAB может быть построена с помощью функции obsv, которая также может вызываться в одном из вариантов: » N=obsv(A,С) » N=obsv(sys) » N=obsv(sys.A,sys.C) Описанная выше функция acker может быть применена и для расчета коэффициентов обратных связей наблюдателя одномерной системы. Для этого надо транспонировать матрицу А и заменить В на СT: » N=acker(AT,CT,P), где Р – вектор желаемых полюсов наблюдателя. Пример 12.1. Пусть модель САУ содержащими следующие значения элементов: описывается матрицами, » А=[0 1; -2 3]; » В=[0;1]; » С=[1 0]; » Р=[-5 -5]; Находим коэффициенты обратных связей модального регулятора: » k = acker(A,B,P); » k1=k(1) k1=23 » k2=k(2) k2=13 Находим искомые коэффициенты обратных связей наблюдателя: » n=acker(A',C',P); » n1=n(1) n1 =13 » n2=n(2) n2=62 Для данного примера в пакете моделирования Simulink MATLAB для описания объекта в пространстве состояний используем блок State Space, позволяющий моделировать работу системы управления с наблюдателем при условии описания матричных операций. С учетом заданных значений матриц модели из примера 12.1 на рис. 12.6 представлена модель системы с наблюдающим устройством, построенная в среде Simulink MATLAB. Рис. 12.6. Моделирование САУ с наблюдателем на бвзе матричных операций в пакете Simulink MATLAB На рис. 12.7 представлены результаты моделирования системы модального управления с наблюдателем (из примера 12.1), полученные на основе выполнения матричных операций в среде MATLAB с использованием пакетов Control Toolbox и Simulink. Рис. 12.7. Переходные процессы объекта (верхний график) и наблюдателя (нижний график) из примера 12. 1. Из графиков на рис. 12.7 видно, что сходимость переходных процессов объекта (верхняя кривая) и наблюдателя (нижняя кривая) достаточно высокая. Для многомерных (и одномерных) систем задачу синтеза наблюдателей можно также решить с помощью функции place(AT,CT,P). Кроме того, в MATLAB существуют специальные функции для формирования наблюдателя: Функция estim формирует наблюдающее устройство в виде ss-объекта для оценивания вектора переменных состояния модели объекта управления sys и для заданной матрицы коэффициентов обратных связей наблюдателя N: » est=estim(sys.N). Функция reg формирует регулятор для заданной в пространстве состояний модели объекта управления sys, матрицы коэффициентов обратных связей по переменным состояния L и матрицы коэффициентов обратных связей наблюдателя N: » rsys=reg(sys,K,L). 12.5. Алгоритм синтеза наблюдателя полного порядка для оценки возмущений и шумов измерений Основной особенностью современных систем судовождения и их технических средств является высокая размерность и сложность. Целенаправленное управление судовыми динамическими системами требует получения достоверной информации о переменных состояния. Заданная точность и надежность управления судном в отношении возмущений угла курса, угловой скорости вращения или угла крена обеспечивается компромиссными решениями при выборе требуемого быстродействия системы и необходимой точности оценки вектора состояния, который не всегда доступен для измерений. На практике возникают трудности, связанные с необходимостью размещения датчиков в труднодоступных местах, а также измерений производных высокого порядка и др. К числу не менее сложных задач относится задача измерений шумов и возмущений, которые приводят к дополнительным составляющим погрешности оценивания переменных состояния, снижающим точность управления. В тех случаях, когда применение аппаратных средств измерений оказывается не эффективным, для оценки не доступных измерениям координат можно применить математические датчики информации, построенные на основе динамических наблюдателей и оценивателей. Влияние возмущений можно уменьшить, если наряду с оценкой состояния объекта выполняется также идентификация неизмеряемых внешних воздействий. Наиболее распространенными оценками в системах управления являются оценки типа «фильтрация». Такие оценки в системах реального времени целесообразно производить методами и вычислительными процедурами стохастической или биномиальной фильтрации. Процедура синтеза наблюдателей для оценки возмущений и помех состоит в следующем. Сначала в пространстве состояний задается модель управляемого объекта с составляющими возмущений, влияние которых оценивается путем решения дифференциальных уравнений при изменяющихся начальных условиях. Полученные оценки используются для построения модели внешних воздействий, которая в совокупности с моделью объекта образует модель расширенной динамической системы, для которой строится наблюдатель. Оценки, полученные с его помощью, содержат оценки, как состояния объекта, так и внешних воздействий. Если моделями внешних воздействий являются ряды, состоящие из полиномов вида N ∑ e λ P (t ), i =1 it i где λi ∈ Λ – известные постоянные, Pi(t) – полиномы с известными коэффициентами, синтез наблюдателя существенно упрощается. Это следует из того, что решение для системы линейных дифференциальных уравнений с постоянными коэффициентами можно получить с помощью стандартных функций вычислительной среды, допускающей объектно-ориентированное программирование операций, например, в системе MATLAB. Покажем возможность оценки внешних воздействий для модели объекта в форме уравнений состояния  x (t ) = A(t ) x(t ) + B(t )u (t ) + f (t ) ,   y (t ) = C (t ) x(t ) + v(t ) (12.9) для начальных условий: x(t0)=x0, t ≥ t0. Здесь x(t)∈Rn, u(t)∈Rm и y(t)∈Rl – векторы состояния, управления и выхода соответственно; A(t), B(t), C(t) – матрицы состояния, управления и выхода линейной нестационарной системы соответственно; f(t), v(t) − соответственно внешние возмущения и шум (погрешность) измерений, воздействующие на объект. Будем полагать, что измеряемыми переменными являются u(t), y(t), а не доступны измерению переменные x(t), f(t), v(t). Представим внешние воздействия f(t), v(t) в виде выходных процессов линейной системы, заданной в пространстве состояний уравнениями xc (t ) = Ac (t ) xc (t ), , (12.10) yc (t ) = Cc (t ) xc (t ), xc (t 0 ) = xc 0 , t ≥ t 0 где xc(t), yc(t) – векторы соответственно состояния и выхода модели среды (внешних воздействий) соответствующих размерностей (nc×1), (nc+l)×1. Заметим, что yc(t)=[f(t); v(t)], а Ac, Cc – известные матрицы. Как известно из [116], составная матрица Cc C  Cc =  f   Cv  содержит подматрицу Сf размерности (n×nc) и подматрицу Cv размерности (l×nc), которые определяют связь xc(t) и f(t) с шумами v(t) в (12.9). Вектор начальных состояний xc0 в системе (12.9) не определен. Введем вектор состояния расширенной (объединенной) системы «объект-среда» x (t ) = [x(t ), xc (t )]∈ R n×nc . Из совокупности уравнений (12.10) и (12.11) получаем уравнения расширенной системы следующего вида x (t ) = A (t ) x (t ) + B u (t ), . y (t ) = C (t ) x (t ), x (t 0 ) = x0 , t ≥ t 0 (12.11) При объединении двух независимых систем, описываемых уравнениями состояния (12.9) и (12.10) матрицы A , B , C обобщенной (композитной) системы имеют блочную структуру (см. разд. 3.5.1):  B   A Cf  , A= B = 0 , C = [C Cv ] .  A × c n n  nc ×m   c  Для восстановления вектора состояния расширенной системы (12.11) размерности n = n + nc , предложен наблюдатель следующей структуры  xˆ (t ) = A (t ) xˆ (t ) + B (t )u (t ) + N (t )( y (t ) − yˆ (t ))  , (12.12)  yˆ (t ) = C (t ) xˆ (t ), xˆ (t 0 ) = xˆ 0 , t ≥ t 0 n где xˆ (t ) ∈ R , yˆ (t ) ∈ R l - векторы, служащие оценками соответственно состояния и выхода расширенной системы «объект-среда» или, то же самое, векторы состояния и выхода наблюдателя соответственно; N(t) – матрица, размерностью [n×l], коэффициентов обратной связи наблюдателя или, то же самое, по невязке между выходами расширенной системы и наблюдателя. 12.6. Пример расчета наблюдателя системы управления курсом судна для оценки возмущений и шумов измерений Для демонстрации эффективности работы алгоритма рассмотрим на примере упрощенной модели судна процедуру оценки влияния возмущения d 2θ I x 2 = u (t ) + M (t ) dt , (12.13) где I x - момент инерции судна по отношению к продольной оси, θ(t), u(t), M(t) ‒ соответственно угол крена, управляющий и возмущающий моменты судна. Будем полагать, что вектор управления u(t) задан, а угловая скорость  t ) измеряется, тогда оценке подвергается возмущающий крена ω x (t ) = θ( момент M(t). Для оцениваемого параметра M(t), являющегося линейной функцией М(t) = M0 + vt, с неизвестными M0 и v предлагается модель M (t ) = v(t )  , (12.14) v(t ) = 0 с неопределенными начальными условиями М(0) и v(0). На базе этой модели получены уравнения состояния вида (12.11) с матрицами A, B , C . 0 1/ I x 0  1/ I x    = A 0 0= 1  , B = 0  , C [1 0 0] . (12.15) 0 0   0  Для системы (12.13) получен наблюдатель (12.12), в котором модель (1.14) имеет размерность n=3. Заметим, что в наблюдателе переменные состоя2ния x1 (t ) , x2 (t ) , x3 (t ) являются, по сути, оценками переменных ω x (t), M(t), v(t) соответственно. С учетом размерности системы характеристический многочлен наблюдателя с собственными числами матрицы Aн будет иметь вид n n2 s+ 3. Ix Ix Далее, используя стандартную форму представления характеристического многочлена наблюдателя с помощью полинома Баттерворта третьего порядка, т. е. осуществляя биномиальную фильтрацию det( sI 3 − Aн ) ≡ ( sI 3 − A + LC ) = s 3 + n1 s 2 + det( sI 3 − Aн ) = s 3 + 2Ω 0 s 2 + 2Ω 02 s + Ω 30 находим неизвестные коэффициентов характеристического многочлена n1=2Ω0, n2=2IxΩ02, n3=IxΩ03. Согласно выбранному многочлену Баттерворту, параметр Ω0 задает быстродействие системы. Время переходного процесса tp можно оценить по формуле tp = 5/Ω0. Полученный наблюдатель представим системой ω ˆ x (t ) = ˆ x (t ) + Mˆ (t ) / I x + n1ω x (t ) + u (t ) / I x −n1ω   ˆ ˆ x (t ) + vˆ(t ) + n2 ω x (t ) −n2 ω  M (t ) = .  ˆ x (t ) + n3ω x (t ) −n3ω vˆ(t ) = (12.16) Моделирование системы (12.16) выполнено с применением инструментария матричной лаборатории (см. файл ниже) при следующих значениях параметров системы и начальных условий: Ix=1000 кг∙м2, М(0)=0.25 Нм, v(0)=5∙10-3 Нм/с, Ω0=0.05 1/с. %Файл "nabkal_1.m" % Задание начального расширенного вектора х0_ x0_=[0,0,0]'; x0=[0 0.25 0.005]'; I=1000; % Ввод матриц А,В,С уравнений состояния расширенного объекта; A=[0 1/J 0;0 0 1;0 0 0]; B=[1/J;0;0]; C=[1 0 0]; % вычисление коэффициентов обратной связи l1,l2,l3; Om=0.05; n1=2*Om; n2=2*I*Om^2; n3=I*Om^3; % Формирование матриц уравнений (1.4); N=[n1;n2;n3]; A_=A-N*C; B_=B; % Формирование матриц объединенной системы (11.16); Ae=[A,zeros(3,3);N*C,A_]; Be=[B;B]; Ce=[C,-C]; % Задание начального состояния системы и интервала моделирования; xe0=[x0;x0_]; t=0:1:300; % Формирование входного воздействия; u=zeros(size(t)); %Моделирование; [y,xe]=lsim(Ae,Be,Ce,0,u,t,xe0); plot(t,xe(:,2),'-.b',t,xe(:,5),'b'),grid figure plot(t,xe(:,3),'-.m',t,xe(:,6),'m'),grid Графики переходных процессов в наблюдателе по оцениваемым переменным M(t), v(t) представлены на рис. 12.8 и рис. 12.9 соответственно. 1.8 1.6 1.4 M(t), Нм 1.2 ^ M(t) 1 0.8 0.6 M 0.4 0.2 50 100 150 Время t, c 200 250 300 Рис. 12.8. Переходный процесс по оцениваемой переменной M(t) -3 9 x 10 8 ^ v 7 v(t), Нм/c 6 5 4 v 3 2 1 50 100 150 Время t, c 200 250 300 Рис. 12.9. Переходный процесс по оцениваемой переменной ν(t) Как видно графиков, длительность переходных процессов в наблюдателе по оцениваемым параметрам не превышает значение, равное 100 с. Из графиков следует также, что длительность переходных процессов определяется численными значениями параметров модели, а также установившимися значениями переменных состояния. Таким образом, построен алгоритм наблюдателя полной размерности на базе модели расширенной системы «объект-среда» и получены оценки векторов возмущений и шумов измерений по вектору выхода – угловой скорости крена, доступного для измерения. Приведен пример расчета оптимальных траекторий динамики объектов, демонстрирующий корректность предлагаемого технического решения. Для выбранной модели наблюдателя устойчивость обеспечивается обоснованным выбором характеристического полинома наблюдателя – полинома Баттерворта третьего порядка. Выполнен мониторинг внешних возмущений и шумов измерения в обобщенной структуре расширенной системы с наблюдателем, в котором переменные состояния x1 (t ) , x2 (t ) , x3 (t ) являются, по сути, оценками переменных ω x (t), M(t), v(t). Выполняя функции математических датчиков информации, наблюдатели могут быть использованы для оценки тех внешних воздействий, измерение которых в судовых условиях затруднено. Данный алгоритм численной оценки возмущений и шумов измерений средствами математического программирования может эффективно применяться в системах судовождения и управления технологическими процессами, плохо формализуемыми в математической форме. 12.7. Синтез наблюдателя для оценивания вектора переменных состояния объекта на основе фильтра Калмана Рассмотрим непрерывную модель объекта управления, заданную в пространстве состояний системой уравнений вида  x = Ax(t ) + Bu (t ))   y = Cx(t ) + Du (t ) где x(t), u(t) ‒ векторы состояния и управления с размерностями соответственно n и r; y(t) ‒ вектор измерений размерности m; А, B, C, D – матрицы соответственно состояния системы размерности [п×n], управления размерности [n×r], выхода размерности [m×n], связи входа с выходом системы размерности [n×1] (как правило, D=0). С учетом внешних воздействий среды, главными из которых являются аддитивная помеха w(t) и погрешности измерений v(t), базовая модель системы примет вид [90]:  x = Ax(t ) + Bu (t ) + Gw(t )   y v = Cx (t ) + Du (t ) + Hw(t ) + v(t ) (12.17) где: w(t) –вектор неизвестного шумового процесса (например, порывы ветра, волнение водной поверхности и др.) c интенсивностью W и размерностью k; G матрица параметров канала прохождения шума w(t) размерности [n×k]; v(t) – вектор шумов измерения c дисперсией V и размерностью p. Полагаем, что воздействия w(t) и v(t), являются гауссовскими случайными процессами, со спектром белого шума. Предположим, что модель системы (12.17), полностью управляема и наблюдаема, а векторы w(t), v(t) и x(t0) не коррелированы между собой: { { } } { } T M w(t )v(t )T = 0 ; M x(t ) w(t ) T = 0 ; M x(t )v(t ) = 0 . С целью оценки (восстановления) вектора переменных состояния x(t), синтезируем наблюдатель, формирующий несмещенную оценку xˆ (t ) , средний квадрат нормы ошибок которой, равен минимальному значению { } M e 2 (t ) → min , где e(t ) = x(t ) − xˆ (t ) − вектор ошибок оценки состояния. Отсюда, несмещенная оценка вектора переменных x(t) системы относительно вектора оценки xˆ (t ) определяется условием M {x(t )} = M {xˆ (t )} = x (t ) . В этом случае, как видно из (11.19), математическое ожидание вектора ошибки оценки e(t) состояния системы будет равно нулю на всем интервале оценивания. e (t ) = x(t ) − xˆ (t ) = x (t ) − xˆ (t ) = 0 . Решением задачи синтеза наблюдателя будет линейная динамическая система, представляющая собой оптимальный фильтр Калмана [78]-[80]. Получение оптимальных оценок вектора состояний, согласно фильтрации по Калману-Бьюси, реализуется в структуре наблюдателя, приведенной на рисунок 12.10. Наблюдатель, состоящий из фильтра Калмана и объекта управления, на основе известного вектора входа u и искаженного случайными помехами вектора измерений yv,, позволяет вычислять оценки векторов переменных состояния x̂ и выхода ŷ . Рис. 12.10. Система управления с наблюдателем состояний на основе фильтра Калмана Фильтр Калмана реализуется как n-мерный наблюдатель полного порядка, в котором идентификатором состояния служит математическая модель системы (12.17). В нем осуществляется процедура рекурсивного оценивания путем наблюдения за входным и выходным сигналами объекта. Причем, уменьшение дисперсии оценок обеспечивается за счет введения в алгоритм идентификатора корректирующей обратной связи по выходу системы y(t). Математическая модель следующими соотношениями: оптимального фильтра представляется  xˆ (t ) = Axˆ (t ) + Bu (t ) + S [ y v (t ) − Cxˆ (t ) − Du (t )], xˆ (t 0 ) = x0 ,   yˆ v (t ) = Cxˆ (t ) + Du (t ) где S – матрица размерности (n×1) параметров оптимального фильтра, минимизирующая дисперсию оценки состояния, определяется из соотношения S = PC T V −1 . (12.18) Здесь P – ковариационная матрица ошибок оценки, определяемая (в условиях стационарности процессов) путем решения матричного алгебраического уравнения Риккати AP + PAT + GV (t )G T − PC T V −1CP = 0 . В общем случае, синтез оптимального наблюдателя полного порядка позволит решить задачу оптимального управления стохастической моделью в условиях неопределенности вектора переменных состояния. Рассмотрим алгоритм оценки вектора состояний с применением фильтра Калмана на примере непрерывной системы с передаточной функцией W ( p) = 100 . p + p + 100 2 Задача определения оптимальной оценки вектора состояния средствами MATLAB решается в следующей последовательности. Сначала строится модель исходной динамической системы, и задаются характеристики случайных процессов. Затем формируется модель фильтра Калмана путем решения уравнения Риккати на основе известной ковариационной матрицы ошибок оценивания Р. И, наконец, определяется матрица оптимальных коэффициентов обратных связей S. Для моделирования обобщенной системы необходимо выполнить объединение модели исходной системы и фильтра Калмана. Такую модель, названную в файле программы SYSm, можно сформировать с учетом следующих предпосылок [81]: а) входом объединенной модели служит совокупный вектор [u; w; v] внешних воздействий на обобщенную систему; б) выходом объединенной модели служит совокупный вектор [y; ŷ ], содержащий вектора выхода y исходной системы и оптимальной оценки ŷ . С учетом этих предпосылок, заданных характеристик случайных процессов и правил синтаксиса среды MATLAB, представим уравнения состояния обобщенной системы в виде  x (t ) = Ax(t ) + Bu (t ) + Gw(t )  xˆ (t ) = Axˆ (t ) + Bu (t ) + S ( y (t ) − Cxˆ (t ) − Du (t ) )    y (t ) = Cx(t ) + Du (t ) + Hw(t ) + v(t )  yˆ (t ) = Cxˆ (t ) + Du (t ). (12.19) Раскрыв матрицы в системе (12.19), представим ее в следующем виде  0   x B G  d  x  A =  dt  xˆ   SC A − SC   xˆ  +  B SH         u   y C x D H I          w  = +          yˆ   0 C   xˆ   D 0 0     v   u  0   w S     v  (12.20) Для синтеза фильтра Калмана в среде MATLAB предназначены следующие функции Control System Toolbox: [kest, L, P] = kalman(sys, Qn, Rn, Nn) [kest, L, P] = kalman(sys, Qn, Rn, Nn, sensors, known) для дискретных моделей [kest, L, P, M, Z] = kalman(sys, Qn, Rn, Nn) для синтеза дискретного фильтра Калмана для непрерывных систем [kest, L, P, M, Z] = kalmz(sys, Qn, Rn, Nn) Приведенные выше функции выполняют синтез фильтров Калмана для оценки переменных состояния объекта управления на основе данных о случайных внешних возмущениях и ошибках измерений. Ниже приведен m-файл в кодах MATLAB программы, реализующей синтез фильтра Калмана на основе инструментария в составе Приложения Control System Toolbox системы. % Файл «nabkal.m» >> sys=ss(tf(100,[1 1 100])) >> [A,B,C,D]=ssdata(sys) >> P=ss(A,[B B],C,[D D]) >> Kest=kalman(P,1,0.01) % Выполним моделирование системы управления с наблюдателем. % Принимаем x1=x1, x2=x2, x1^=x3, x2^=x4. % Вводим следующие матрицы >> A1=[-1 -6.25 0 0; 16 0 0 0; 0 54 1 -60.2; 0 41.5 16 -41.5] >> B1= [2 2 0; 0 0 0; 2 0 17.3; 0 0 13.3] >> C1=[0 3.125 0 0; 0 0 0 3.125] % Входом системы управления с наблюдателем будет вектор u1=[u;w;v], % Выходом y1=[y;y^]. Здесь y=3.125y2, y^=3.125y4. % Моделирование t=0:0.001:5; u=ones(size(t)); w=randn(size(t))*1000^0.5; v=rаndn(size(t))*10^0.5; S=ss(A1,B1,C1,0); u1=[u;w;v]; [y1 y4]=lsim(S,u1',t); plot(t, y1(:,1),'-b',t,y1(:,2),':b') plot(t, v'+y1(:,1), ':g', t,y1(:,2),'-b') Результаты компьютерного моделирования динамики исходной системы без возмущения (кривая 1) и с возмущением (кривая 2) приведены на рисунке 12.11. Рис. 12.11. Зависимости точного (кривая 1), и наблюдаемого (кривая 2) выходных процессов объекта управления Результаты моделирования движения обобщенной системы (с фильтром Калмана) приведены на рисунке 12.12. Как следует из графических зависимостей (рисунки 12.11 и 12.12), компьютерное моделирование исходной системы, показывает, что шумовой процесс w, воздействующий на объект управления, способствует смещению оценок вектора выхода, т. е. оцениваемая траектория отстает от реальной траектории. Анализ сглаживания зашумленных процессов в условиях воздействия аддитивных составляющих (возмущений и шума измерений) помехи на заданном массиве (m=5000) значений времени свидетельствует об асимптотической сходимости реальных значений и их оценок сигналов на выходе объединенной системы (см. рис. 12.11 и 12.12). Рис. 12.2. Измеренный (зашумленный) и оцененный (сглаженный) сигналы выхода наблюдателя Сравнительный анализ полученных зависимостей показывает, что для меньшего объема выборки m вычисленные оценки будут ближе к точным значениям, но при этом ухудшается сглаживание случайного процесса, а при большем значении m получаем обратный результат. Это объясняется тем, что в первом случае, фильтр, обладая большой памятью, лучше сглаживает траекторию движения, но по причине своей узкополосности, он хуже ее отслеживает и оцениваемая траектория отстает от реальной траектории. Во втором случае, фильтр, обладая меньшей памятью хуже сглаживает, но хорошо отслеживает реальную траекторию. Здесь важно отметить, что при оптимальной фильтрации оценки вектора ŷ будут всегда смещенными, так как любой процедуре сглаживания соответствует прохождение зашумленного сигнала через фильтр низкой частоты, разделяющий низкочастотный полезный сигнал от высокочастотного шума. Таким образом, с увеличением выборки m улучшается точность прогноза оценки вектора выхода ŷ обобщенной системы, что объясняется доминированием заложенной в ней модели фильтра Калмана. Однако реальный процесс может быть адекватен модели только локально, на некоторых интервалах, следствием чего является ухудшение точности прогноза. В заключение отметим, что использование соотношений (12.17) ÷ (12.20) и инструментария Control System Toolbox позволяет синтезировать фильтр Калмана, обеспечивающий (см. рисунок 12.12) даже в условиях аддитивного шума (измерений и возмущений) достаточно точное восстановление вектора состояний. 13. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ. АЛГОРИТМИЗАЦИЯ И МОДЕЛИРОВАНИЕ В СРЕДЕ MATLAB 13.1. Постановка задачи оптимального управления системой с полной обратной связью Оптимальными называются системы, в которых процесс управления проводится наилучшим образом по сравнению со всеми другими возможными способами. Оценку достижимости цели в процессе управления объектом, представленную в формализованном виде (аналитической форме), принято называть критерием оптимальности или целевой функцией. Разработка наилучшей системы, удовлетворяющей поставленным требованиям, представляет собой задачу синтеза оптимальной системы. Задача синтеза оптимального управления автоматической системы управляющего устройства (УУ) математически может быть сформулирована следующим образом. Пусть объект описывается системой xi = f i ( x1 ,...xn , u1 ,..., u m , t ), i = 1,..., n (13.1) Здесь x1, …, xn − фазовые координаты, т.е. обобщенные координаты, однозначно определяющие состояние объекта, u1, …,un – параметры управления. Введя векторные обозначения X = (x1, …, xn), U = (u1, …, um), f = (f1, …, fn), приведенную систему можно записать в виде xi = f i ( X , U , t ), i = 1,..., n (13.2) или в более компактной векторной форме X = f i ( X , U , t ), i = 1,..., n (13.3) Вектор X называется фазовым вектором или вектором состояния, а U – управлением или вектором управления. Будем предполагать, что уравнения (13.1) описывают возмущенное движение, фазовые координаты xi (i = 1, ... , n) характеризуют отклонение объекта от программного движения или положения равновесия. Тогда назначение регулятора состоит в том, чтобы привести его в конечный момент времени tf в положение X(tf) = 0, в каком бы состоянии X0 не находился объект в начальный момент времени t0. Другими словами, в моменты t0 и tf фазовый вектор должен удовлетворять условиям: X(t0) = X0, X(tf) = 0. Эти условия называются краевыми или граничными условиями. В общем случае параметры управления стеснены некоторыми условиями. Часто они выражаются в виде неравенства α j ≤ uj ≤βj, j = 1, ,..., m . (13.4) Эти условия называются ограничением на управление. Качество автоматической системы в теории оптимального управления характеризуют функционалом: I = I(u(t), x(t)). (13.5) В общем случае функционал (13.5) может зависеть от моментов t0 и tf, граничных значений фазового вектора – Х(t0) и Х(tf). Функционал (13.5), характеризующий качество системы, называется критерием оптимальности. Применяемое в каждый момент времени t ∊ Т управление имеет вид управления c полной связью по всем переменным вектора состояния (рис. 13.1). Рис. 13.1. Схема управления с полной обратной связью по вектору состояния Формулировка задачи синтеза оптимальной системы состоит в следующем. Для объекта, описываемого уравнениями (13.1), найти такой алгоритм управления U = U(Х, t), при котором соблюдается ограничение (13.4), выполняются краевые условия (13.3) и функционал (13.5) принимает минимальное значение. В настоящее время известны различные методы решения задач оптимального управления. Одним из них является метод динамического программирования. 13.2. Алгоритм синтеза оптимального управления методом динамического программирования Основным утверждением, на котором базируется метод динамического программирования, является принцип оптимальности. Применительно к задачам оптимального управления его можно сформулировать следующим образом. Оптимальное управление U(Х, t), t0 ≤ t ≤ tf состоит в том, что каковы бы ни были начальное состояние X(t0) и начальное управление U(Х, t) на отрезке t0 ≤ t ≤ t1 (t1 – произвольный промежуточный момент), последующее управление U(Х, t) на интервале t1 ≤ t ≤ tf, должно составлять оптимальное управление относительно состояния x(t1), полученного в результате первоначального управления. Используя принцип оптимальности, можно получить уравнение Беллмана, которое непосредственно используется при решении задач синтеза оптимальных систем управления. Пусть критерий оптимальности имеет вид: tf I = ∫ f 0 ( X ,U , t )dt . t0 Введем в рассмотрение функцию tf S ( X , t ) = min ∫ f 0 ( X , U , t )dt , U ∈Ω t0 называемую функцией Беллмана. Здесь Ω обозначает множество значений управления, определяемого ограничением на управление, в частности, условием (13.4). Если функция Беллмана непрерывна по совокупности аргументов х1, ..., хn, t и обладает непрерывной полной производной по t, то для оптимальности управления U*(t) = U*(X*(t), t) и соответствующей траектории X*(t) необходимо, чтобы имело место уравнение f 0 ( X * (t ),U * (t ), t ) + dS ( X * (t ), t ) dS ( X (t ), t )   = min  f 0 ( X ,U , t ) +  = 0 U ∈Ω dt dt  (13.6) при граничном условии S ( X (t f ), t f ) = 0 . (13.7) Уравнение (13.6) называется уравнением Беллмана. Если функция Беллмана обладает непрерывными частными производными по x1, ..., xn и t, то уравнение Беллмана можно записать в виде: − n   ∂S ∂S = min  f 0 ( X ,U , t ) + ∑ f i ( X ,U , t )  ∂t U ∈Ω  i =1 ∂xi  (13.8) где fi(X, U, t) – правые части уравнений (13.1) объекта. Если выражение в квадратных скобках уравнения (13.8) дифференцируемо по u1, ..., um и множество Ω открыто, то из этого уравнения следует: ∂f 0 ( X ,U , t ) n ∂S ∂f i ( X ,U , t ) +∑ = 0, ∂u j ∂u j i =1 ∂xi j = 1,...m. (13.9) Порядок решения задачи синтеза оптимального управления с помощью уравнения Беллмана состоит из следующих этапов: 1. Составляется уравнение Беллмана и из условий минимума его правой части находится управление как функция от S − функции Беллмана. 2. Подставив найденное управление в уравнение Беллмана, и решив его, определяется функция Беллмана. 3. Полученная функция Беллмана подставляется в выражение для управления, определенное в соответствии с п. 1. Пример 13.1. Выполним синтез оптимальной системы, когда объект описывается уравнением x = u или системой в нормальной форме x1 = x2 ; x 2 = u (13.10) и критерий оптимальности имеет вид tf I = ∫ ( x12 + qx22 + ru 2 )dt (13.11) t0 Составим уравнение Беллмана. Так как правые части нормальных уравнений объекта управления на основании (13.2) равны f1(X, U, t) = x2, f2(X, U, t) = u и подынтегральная функция (12.11) f 0 ( X ,U , t ) = ( x12 + qx22 + ru 2 ) не содержат явно время, то производная ∂S = 0. ∂t Следовательно, для рассматриваемого случая уравнение Беллмана принимает вид  ∂S ∂S  ⋅ x2 + ⋅u = min ( x12 + qx22 + ru 2 ) + 0. U ∈Ω ∂ ∂ x x   1 2 (13.12) Производную по u от фигурной скобки приравниваем к нулю и находим оптимальное управление u*(t) в функции от ∂S/дх2 ∂ {...} = 2ru * + ∂S = 0 , ∂u ∂x2 откуда u* = − 1 ∂S . 2r ∂x2 (13.13) Подставив это значение в уравнение Беллмана, получим 2 2 ∂S 1  ∂S  1  ∂S   +  =0 x12 + qx22 +  x2 −  2r  ∂x2  4r  ∂x2  ∂x1 или, приведя подобные члены, 2 ∂S 1  ∂S   + x + qx −  x2 = 0 4r  ∂x2  ∂x1 2 1 2 2 (13.14) Решение уравнения Беллмана (13.14) будем искать в виде квадратичной формы S(X) = k11x12 + k12x1x2 +k22x22. (13.15) Вычислив производные и подставив их в уравнение Беллмана, путем приравнивая к нулю всех коэффициентов при фазовых координатах, получим систему уравнений для определения коэффициентов k11, k12 и k22:  k122 =0 1 − 4 r  1 2  q + k12 − k 22 = 0 , r  1 2k11 − k12 ⋅ k 22 = 0  r k12 = 2 r  k 22 = r (q + 2 r ) .  k11 = q + 2 r откуда (13.16) Следовательно, функция Беллмана принимает вид: S ( X ) = q + 2 r ⋅ x12 + 2 r ⋅ x1 ⋅ x2 + r (q + 2 r ) ⋅ x22 (13.17) а оптимальное управление u* ( X ) = − 1 ∂S 1 = −  2 r x1 + 2 r (q + r )  = −(k1 x1 + k 2 x2 )  2r ∂x2 2r  где k1 = q+2 r 1 ; k2 = . r r (13.18) Для заданных значений r=0,04; q=0,09 по формулам (13.16) и (13.18) выполнен расчет коэффициентов усиления k1 и k2, обеспечивающих оптимальное значение заданного критерия качества (13.11). Модель системы управления, реализующей оптимальное управление u*(X) = -(k1x1 + k2x2) по расчетным значениям k1 и k2, построена в среде MATLAB с применением пакета Simulink и представлена на рис. 13.2. Рис. 13.2. Модель оптимальной системы управления, построенная в среде Simulink MATLAB (r=0,04; q=0,09; k1=5; k2=3.5) 13.2. Алгоритм синтеза оптимального управления на основе уравнения Риккати Дальнейшее развитие методов синтеза автоматических систем основано на принципе оптимальности, что позволяет поставить общую задачу: найти закон оптимального управления U(X), обеспечивающий наилучшие режимы работы объекта по заданным критериям качества. Закон оптимального управления определяется методами теории оптимального управления. Требования к повышению качества автоматических систем в большинстве случаев сводятся к увеличению точности и уменьшению расхода энергии при управлении. Оптимальные по точности автоматические системы рассматривают при детерминированных и случайных сигналах. Чтобы получить оптимальные детерминированные процессы при наличии измеряемых внешних возмущениях, необходимо рассматривать задачу векторной оптимизации с использованием квадратичных интегральных оценок типа tk I = ∫ ε 2 (t )dt , (первый частный критерий) t0 где ε(t)=yз - y(t) − отклонение выходной переменной y(t) от заданного значения yз, и функционалов типа tk I = ∫ ru 2 (t )dt , |u| ≤ Umax, (второй частный критерий) t0 где u(t) − вектор управления (напряжение источника); r = 1/R − коэффициент пропорциональности (сопротивление электрической цепи), характеризующих качество переходных процессов соответственно по точности и по расходу энергии на управление соответственно. С этой целью рассмотрим объект оптимизации, динамика которого определяется дифференциальными уравнениями состояния, и известны начальное и конечное значения векторов состояния: X = AX + Bu; X (t 0 ) = X 0 ; X (t k ) = X k , (13.19) а также задан также квадратичный функционал в векторной форме: ∞ 1 I = ∫ X T QX + U T RU dt 20 ( ) (13.20) где Q − диагональная матрица весовых коэффициентов qii > 0, qij = 0 для i≠j; R − диагональная матрица весовых коэффициентов ri > 0. Требуется определить оптимальное управление U(X), при котором функционал (13.20) имеет минимальную величину. Краевые условия в данном случае имеют вид: X(0) = X0; X(∞) = 0, (13.21) где X0 − произвольный заданный вектор. Функционал (13.20) является обобщенным скалярным критерием, полученным в результате объединения обобщенной квадратичной интегральной оценки, используемой в теории автоматического управления для косвенной оценки качества переходных процессов, и критерия, характеризующего расход энергии при управлении. Весовые коэффициенты qii > 0 и rl > 0 накладывают “штрафы” на величину и длительность отклонения координат в переходном процессе. Положительность этих коэффициентов обеспечивает положительную определенность подынтегральной функции, что исключает возможность больших и длительных отклонений координат состояния и управлений при оптимальном переходном процессе. Составим функциональные соотношений (13.8) и (13.9): уравнения Беллмана на основании ∂S ∂S 1 T T [ ] X QX + U RU + AX + BU = − , 2 ∂X ∂t  ∂S U T R + ⋅ B = 0. ∂X  ( ) (13.22) Исключим из первого уравнения системы (12.22) параметр управления, используя подстановку: T  ∂S  U = −R B   .  ∂X  −1 T (13.23) Функцию Беллмана будем искать в виде векторной квадратичной формы: S = XTPX, (13.24) где P – неизвестная неотрицательно определенная симметричная матрица. Вычисляя частные производные от S по параметрам X и t и, подставляя их в первое уравнение системы (13,22), получим алгебраическое уравнение Риккати: −PA – ATP + KBR-1BTP – Q = 0. оптимальному решению (алгоритму управления) соответствовать положительно определенная матрица  p11 p P =  21  ...   pn1 p12 p22 ... ... ... pn 2 ... ... (12.25) которого p1n  p2 n  ...  ,  pnn  будет (13.26) у которой диагональные миноры должны удовлетворять условию p p11 > 0,  11  p21  p11 p p12  . > 0, ...,  21   ... p22    pn1 p12 p22 ... pn 2 ... ... ... ... p1n  p2 n  > 0. ...   pnn  Если система является асимптотически устойчивой и при tk →∞ неуправляемая составляющая фазового вектора стремится к нулю, то оптимальное управление будет являться только функцией фазовых координат: U0(X) = − R-1BTPX = -K0X, (13.27) где K0 = R-1BTP. Пример 12.2. Используя уравнение Риккати, выполнить синтез оптимальной системы, управляемым объектом которой служит объект из примера 13.1 с уравнением динамики x = u , модель которого в пространстве состояний имеет вид:  x1 = x 2 ,   x 2 = u. (13.28) Краевые условия имеют вид: X (0) = X0, X (∞) = 0; координата управления не ограничена, а функционал обобщенного скалярного критерия оптимальности имеет вид: ∞ I = ∫ ( x12 + qx 22 + ru 2 )dt вид: Для данной задачи уравнение состояния в матричной форме будет иметь  x1  0 1  x1  0 0 u   x  = 0 0 ⋅  x  + 1 0 ⋅ 0    2      2  или в нормализованной форме: X = AX + BU , где 0 1  A= ,   0 0  B= , 1   В соответствии с функционалом 1 0  Q= , 0 q  и учетом (13.27) получим:  r 0 R= , 0 1  (13.29) r −1 0 0 1  p11 U ( X ) = − ⋅ ⋅p 1   21    p12   x1  p p ⋅   = − 12 ⋅ x1 − 22 ⋅ x2 . (12.30)  p22   x2  r r Коэффициенты p12 и p22 находим из алгебраического уравнения Риккати типа (13.25): p −  11  p21 r −1 × 0 p12  0 1 0 0  p11 p12   p11 p12  0 0 ⋅ − ⋅ + ⋅ × p22  0 0 1 0  p21 p22   p21 p22  1 0 0 0 1  p11 p12  1 0  0 0 ⋅ − ⋅ = . 1 0 0  p21 p22  0 q  0 0 (13.31) Перемножив матрицы из уравнения (13.31), получаем  p12 p21r −1  −1 − p11 + p21 p22 r − p11 + p12 p22 r −1  1 0  0 0 − = , 2 −1  − ( p12 + p21 ) + p22 r  0 q  0 0  откуда, полагая p12 = p21 (матрица P – симметричная), запишем три алгебраических уравнения:  p122 ⋅ r −1 − 1 = 0  −1 − p11 + p12 ⋅ p22 ⋅ r = 0 − 2 ⋅ p + p 2 ⋅ r −1 − q = 0. 12 22  (13.32) Из решения (13.32) получаем уравнения: p12 = ± r , p22 = ± r (q + 2 ⋅ r ) , p11 = p12 ⋅ p22 ⋅ r −1 = ± q + 2 r . Так как матрица P должна быть положительно определенной, принимаем p12 = r и p22 = r (q + 2 ⋅ r ) , При этом закон оптимального управления на основании (13.30) записывается как U 0(X ) = − r (q + 2 ⋅ r ) p12 p r ⋅ x1 − 22 ⋅ x2 = − ⋅ x1 − ⋅ x2 r r r r где k1 = r (q + 2 ⋅ r ) r , k2 = . r r (13.34) Выражения (13.34) для коэффициентов усиления в цепи обратной связи k1 и k2 полностью соответствуют соотношениям (13.18) для этих коэффициентов, найденным в разделе 13.1, по методу динамического программирования. Структурная схема оптимальной по точности системы согласно (13.34) представлена на рисунке 13.3, а схема моделирования, построенная с использованием пакета Simulink MATLAB, – на рис.13.4. Рис. 13.3. Структурная схема оптимальной системы управления Рис. 13.4. Модель оптимальной системы управления, построенная в среде Simulink MATLAB (r=0,04; q=0,09; k1=5; k2=3.5) На рис. 13.5, а, б и в приведены графики переходных процессов, которые соответствуют осциллограммам, полученным с приборов Scope 2, Scope и Scope 1 (см. рис. 13.4). а) б) в) Рис. 13.5. Графики переходных процессов: а) на приборе Scope 2; б) на приборе Scope; в) на приборе Scope 1 По графикам переходных процессов можно определить перерегулирование и время регулирования при каждой паре постоянных q и r. Лекция. 25 марта 2021 г. ___ Б. 13. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ. АЛГОРИТМИЗАЦИЯ И МОДЕЛИРОВАНИЕ В СРЕДЕ MATLAB 13.1. Постановка задачи оптимального управления системой с полной обратной связью Оптимальными называются системы, в которых процесс управления проводится наилучшим образом по сравнению со всеми другими возможными способами. Оценку достижимости цели в процессе управления объектом, представленную в формализованном виде (аналитической форме), принято называть критерием оптимальности или целевой функцией. Разработка наилучшей системы, удовлетворяющей поставленным требованиям, представляет собой задачу синтеза оптимальной системы. Задача синтеза оптимального управления автоматической системы управляющего устройства (УУ) математически может быть сформулирована следующим образом. Пусть объект описывается системой xi = f i ( x1 ,...xn , u1 ,..., u m , t ), i = 1,..., n (13.1) Здесь x1, …, xn − фазовые координаты, т.е. обобщенные координаты, однозначно определяющие состояние объекта, u1, …,un – параметры управления. Введя векторные обозначения X = (x1, …, xn), U = (u1, …, um), f = (f1, …, fn), приведенную систему можно записать в виде xi = f i ( X , U , t ), i = 1,..., n (13.2) или в более компактной векторной форме X = f i ( X , U , t ), i = 1,..., n (13.3) Вектор X называется фазовым вектором или вектором состояния, а U – управлением или вектором управления. Будем предполагать, что уравнения (13.1) описывают возмущенное движение, фазовые координаты xi (i = 1, ... , n) характеризуют отклонение объекта от программного движения или положения равновесия. Тогда назначение регулятора состоит в том, чтобы привести его в конечный момент времени tf в положение X(tf) = 0, в каком бы состоянии X0 не находился объект в начальный момент времени t0. Другими словами, в моменты t0 и tf фазовый вектор должен удовлетворять условиям: X(t0) = X0, X(tf) = 0. Эти условия называются краевыми или граничными условиями. В общем случае параметры управления стеснены некоторыми условиями. Часто они выражаются в виде неравенства α j ≤ uj ≤βj, j = 1, ,..., m . (13.4) Эти условия называются ограничением на управление. Качество автоматической системы в теории оптимального управления характеризуют функционалом: I = I(u(t), x(t)). (13.5) В общем случае функционал (13.5) может зависеть от моментов t0 и tf, граничных значений фазового вектора – Х(t0) и Х(tf). Функционал (13.5), характеризующий качество системы, называется критерием оптимальности. Применяемое в каждый момент времени t ∊ Т управление имеет вид управления c полной связью по всем переменным вектора состояния (рис. 13.1). Рис. 13.1. Схема управления с полной обратной связью по вектору состояния Формулировка задачи синтеза оптимальной системы состоит в следующем. Для объекта, описываемого уравнениями (13.1), найти такой алгоритм управления U = U(Х, t), при котором соблюдается ограничение (13.4), выполняются краевые условия (13.3) и функционал (13.5) принимает минимальное значение. В настоящее время известны различные методы решения задач оптимального управления. Одним из них является метод динамического программирования. 13.2. Алгоритм синтеза оптимального управления методом динамического программирования Основным утверждением, на котором базируется метод динамического программирования, является принцип оптимальности. Применительно к задачам оптимального управления его можно сформулировать следующим образом. Оптимальное управление U(Х, t), t0 ≤ t ≤ tf состоит в том, что каковы бы ни были начальное состояние X(t0) и начальное управление U(Х, t) на отрезке t0 ≤ t ≤ t1 (t1 – произвольный промежуточный момент), последующее управление U(Х, t) на интервале t1 ≤ t ≤ tf, должно составлять оптимальное управление относительно состояния x(t1), полученного в результате первоначального управления. Используя принцип оптимальности, можно получить уравнение Беллмана, которое непосредственно используется при решении задач синтеза оптимальных систем управления. Пусть критерий оптимальности имеет вид: tf I = ∫ f 0 ( X ,U , t )dt . t0 Введем в рассмотрение функцию tf S ( X , t ) = min ∫ f 0 ( X , U , t )dt , U ∈Ω t0 называемую функцией Беллмана. Здесь Ω обозначает множество значений управления, определяемого ограничением на управление, в частности, условием (13.4). Если функция Беллмана непрерывна по совокупности аргументов х1, ..., хn, t и обладает непрерывной полной производной по t, то для оптимальности управления U*(t) = U*(X*(t), t) и соответствующей траектории X*(t) необходимо, чтобы имело место уравнение dS ( X * (t ), t ) dS ( X (t ), t )   f 0 ( X (t ),U (t ), t ) + = min  f 0 ( X ,U , t ) +  = 0 U ∈Ω dt dt  (13.6) * * при граничном условии S ( X (t f ), t f ) = 0 . (13.7) Уравнение (13.6) называется уравнением Беллмана. Если функция Беллмана обладает непрерывными частными производными по x1, ..., xn и t, то уравнение Беллмана можно записать в виде: n   ∂S ∂S − = min  f 0 ( X ,U , t ) + ∑ f i ( X ,U , t )  ∂t U ∈Ω  i =1 ∂xi  (13.8) где fi(X, U, t) – правые части уравнений (13.1) объекта. Если выражение в квадратных скобках уравнения (13.8) дифференцируемо по u1, ..., um и множество Ω открыто, то из этого уравнения следует: ∂f 0 ( X ,U , t ) n ∂S ∂f i ( X ,U , t ) +∑ = 0, ∂u j ∂u j i =1 ∂xi j = 1,...m. (13.9) Порядок решения задачи синтеза оптимального управления с помощью уравнения Беллмана состоит из следующих этапов: 1. Составляется уравнение Беллмана и из условий минимума его правой части находится управление как функция от S − функции Беллмана. 2. Подставив найденное управление в уравнение Беллмана, и решив его, определяется функция Беллмана. 3. Полученная функция Беллмана подставляется в выражение для управления, определенное в соответствии с п. 1. Пример 13.1. Выполним синтез оптимальной системы, когда объект описывается уравнением x = u или системой в нормальной форме x1 = x2 ; x 2 = u (13.10) и критерий оптимальности имеет вид tf I = ∫ ( x12 + qx22 + ru 2 )dt t0 (13.11) Составим уравнение Беллмана. Так как правые части нормальных уравнений объекта управления на основании (13.2) равны f1(X, U, t) = x2, f2(X, U, t) = u и подынтегральная функция (12.11) f 0 ( X ,U , t ) = ( x12 + qx22 + ru 2 ) не содержат явно время, то производная ∂S = 0. ∂t Следовательно, для рассматриваемого случая уравнение Беллмана принимает вид  ∂S ∂S  ⋅ x2 + ⋅u = min ( x12 + qx22 + ru 2 ) + 0. U ∈Ω ∂ ∂ x x   1 2 (13.12) Производную по u от фигурной скобки приравниваем к нулю и находим оптимальное управление u*(t) в функции от ∂S/дх2 ∂ {...} = 2ru * + ∂S = 0 , ∂u ∂x2 откуда u* = − 1 ∂S . 2r ∂x2 (13.13) Подставив это значение в уравнение Беллмана, получим 2 2 ∂S 1  ∂S  1  ∂S   +  =0 x + qx +  x2 −  4r  ∂x2  ∂x1 2r  ∂x2  2 1 2 2 или, приведя подобные члены, 2 ∂S 1  ∂S   + x + qx −  x2 = 0  4r  ∂x2  ∂x1 2 1 2 2 (13.14) Решение уравнения Беллмана (13.14) будем искать в виде квадратичной формы S(X) = k11x12 + k12x1x2 +k22x22. (13.15) Вычислив производные и подставив их в уравнение Беллмана, путем приравнивая к нулю всех коэффициентов при фазовых координатах, получим систему уравнений для определения коэффициентов k11, k12 и k22:  k122 =0 1 − 4 r  1 2  q + k12 − k 22 = 0 , r  1 2k11 − k12 ⋅ k 22 = 0  r k12 = 2 r  k 22 = r (q + 2 r ) .  k11 = q + 2 r откуда (13.16) Следовательно, функция Беллмана принимает вид: S ( X ) = q + 2 r ⋅ x12 + 2 r ⋅ x1 ⋅ x2 + r (q + 2 r ) ⋅ x22 (13.17) а оптимальное управление u* ( X ) = − 1 ∂S 1 = −  2 r x1 + 2 r (q + r )  = −(k1 x1 + k 2 x2 )  2r ∂x2 2r  где k1 = q+2 r 1 ; k2 = . r r (13.18) Для заданных значений r=0,04; q=0,09 по формулам (13.16) и (13.18) выполнен расчет коэффициентов усиления k1 и k2, обеспечивающих оптимальное значение заданного критерия качества (13.11). Модель системы управления, реализующей оптимальное управление u*(X) = -(k1x1 + k2x2) по расчетным значениям k1 и k2, построена в среде MATLAB с применением пакета Simulink и представлена на рис. 13.2. Рис. 13.2. Модель оптимальной системы управления, построенная в среде Simulink MATLAB (r=0,04; q=0,09; k1=5; k2=3.5) 13.2. Алгоритм синтеза оптимального управления на основе уравнения Риккати Дальнейшее развитие методов синтеза автоматических систем основано на принципе оптимальности, что позволяет поставить общую задачу: найти закон оптимального управления U(X), обеспечивающий наилучшие режимы работы объекта по заданным критериям качества. Закон оптимального управления определяется методами теории оптимального управления. Требования к повышению качества автоматических систем в большинстве случаев сводятся к увеличению точности и уменьшению расхода энергии при управлении. Оптимальные по точности автоматические системы рассматривают при детерминированных и случайных сигналах. Чтобы получить оптимальные детерминированные процессы при наличии измеряемых внешних возмущениях, необходимо рассматривать задачу векторной оптимизации с использованием квадратичных интегральных оценок типа tk I = ∫ ε 2 (t )dt , (первый частный критерий) t0 где ε(t)=yз - y(t) − отклонение выходной переменной y(t) от заданного значения yз, и функционалов типа tk I = ∫ ru 2 (t )dt , |u| ≤ Umax, (второй частный критерий) t0 где u(t) − вектор управления (напряжение источника); r = 1/R − коэффициент пропорциональности (сопротивление электрической цепи), характеризующих качество переходных процессов соответственно по точности и по расходу энергии на управление соответственно. С этой целью рассмотрим объект оптимизации, динамика которого определяется дифференциальными уравнениями состояния, и известны начальное и конечное значения векторов состояния: X = AX + Bu; X (t 0 ) = X 0 ; X (t k ) = X k , (13.19) а также задан также квадратичный функционал в векторной форме: ∞ 1 I = ∫ X T QX + U T RU dt 20 ( ) (13.20) где Q − диагональная матрица весовых коэффициентов qii > 0, qij = 0 для i≠j; R − диагональная матрица весовых коэффициентов ri > 0. Требуется определить оптимальное управление U(X), при котором функционал (13.20) имеет минимальную величину. Краевые условия в данном случае имеют вид: X(0) = X0; X(∞) = 0, (13.21) где X0 − произвольный заданный вектор. Функционал (13.20) является обобщенным скалярным критерием, полученным в результате объединения обобщенной квадратичной интегральной оценки, используемой в теории автоматического управления для косвенной оценки качества переходных процессов, и критерия, характеризующего расход энергии при управлении. Весовые коэффициенты qii > 0 и rl > 0 накладывают “штрафы” на величину и длительность отклонения координат в переходном процессе. Положительность этих коэффициентов обеспечивает положительную определенность подынтегральной функции, что исключает возможность больших и длительных отклонений координат состояния и управлений при оптимальном переходном процессе. Составим функциональные соотношений (13.8) и (13.9): уравнения Беллмана на основании ∂S ∂S 1 T T [ ] X QX + U RU + AX + BU = − , 2 ∂X ∂t  ∂S U T R + ⋅ B = 0. ∂X  ( ) (13.22) Исключим из первого уравнения системы (12.22) параметр управления, используя подстановку: T  ∂S  U = −R B   .  ∂X  −1 T (13.23) Функцию Беллмана будем искать в виде векторной квадратичной формы: S = XTPX, (13.24) где P – неизвестная неотрицательно определенная симметричная матрица. Вычисляя частные производные от S по параметрам X и t и, подставляя их в первое уравнение системы (13,22), получим алгебраическое уравнение Риккати: −PA – ATP + KBR-1BTP – Q = 0. оптимальному решению (алгоритму управления) соответствовать положительно определенная матрица  p11 p P =  21  ...   pn1 p12 p22 ... ... ... pn 2 ... ... (12.25) которого p1n  p2 n  ...  ,  pnn  будет (13.26) у которой диагональные миноры должны удовлетворять условию p p11 > 0,  11  p21  p11 p p12  . > 0, ...,  21   ... p22    pn1 p12 p22 ... pn 2 ... ... ... ... p1n  p2 n  > 0. ...   pnn  Если система является асимптотически устойчивой и при tk →∞ неуправляемая составляющая фазового вектора стремится к нулю, то оптимальное управление будет являться только функцией фазовых координат: U0(X) = − R-1BTPX = -K0X, (13.27) где K0 = R-1BTP. Пример 12.2. Используя уравнение Риккати, выполнить синтез оптимальной системы, управляемым объектом которой служит объект из примера 13.1 с уравнением динамики x = u , модель которого в пространстве состояний имеет вид:  x1 = x 2 ,   x 2 = u. (13.28) Краевые условия имеют вид: X (0) = X0, X (∞) = 0; координата управления не ограничена, а функционал обобщенного скалярного критерия оптимальности имеет вид: ∞ I = ∫ ( x12 + qx 22 + ru 2 )dt вид: Для данной задачи уравнение состояния в матричной форме будет иметь  x1  0 1  x1  0 0 u   x  = 0 0 ⋅  x  + 1 0 ⋅ 0    2      2  или в нормализованной форме: X = AX + BU , где 0 1  A= ,   0 0  B= , 1   В соответствии с функционалом 1 0  Q= , 0 q  и учетом (13.27) получим:  r 0 R= , 0 1  (13.29) r −1 0 0 1  p11 U ( X ) = − ⋅ ⋅p 1   21    p12   x1  p p ⋅   = − 12 ⋅ x1 − 22 ⋅ x2 . (12.30)  p22   x2  r r Коэффициенты p12 и p22 находим из алгебраического уравнения Риккати типа (13.25): p −  11  p21 r −1 × 0 p12  0 1 0 0  p11 p12   p11 p12  0 0 ⋅ − ⋅ + ⋅ × p22  0 0 1 0  p21 p22   p21 p22  1 0 0 0 1  p11 p12  1 0  0 0 ⋅ − ⋅ = . 1 0 0  p21 p22  0 q  0 0 (13.31) Перемножив матрицы из уравнения (13.31), получаем  p12 p21r −1  −1 − p11 + p21 p22 r − p11 + p12 p22 r −1  1 0  0 0 − = , 2 −1  − ( p12 + p21 ) + p22 r  0 q  0 0  откуда, полагая p12 = p21 (матрица P – симметричная), запишем три алгебраических уравнения:  p122 ⋅ r −1 − 1 = 0  −1 − p11 + p12 ⋅ p22 ⋅ r = 0 − 2 ⋅ p + p 2 ⋅ r −1 − q = 0. 12 22  (13.32) Из решения (13.32) получаем уравнения: p12 = ± r , p22 = ± r (q + 2 ⋅ r ) , p11 = p12 ⋅ p22 ⋅ r −1 = ± q + 2 r . Так как матрица P должна быть положительно определенной, принимаем p12 = r и p22 = r (q + 2 ⋅ r ) , При этом закон оптимального управления на основании (13.30) записывается как U 0(X ) = − r (q + 2 ⋅ r ) p12 p r ⋅ x1 − 22 ⋅ x2 = − ⋅ x1 − ⋅ x2 r r r r где k1 = r (q + 2 ⋅ r ) r , k2 = . r r (13.34) Выражения (13.34) для коэффициентов усиления в цепи обратной связи k1 и k2 полностью соответствуют соотношениям (13.18) для этих коэффициентов, найденным в разделе 13.1, по методу динамического программирования. Структурная схема оптимальной по точности системы согласно (13.34) представлена на рисунке 13.3, а схема моделирования, построенная с использованием пакета Simulink MATLAB, – на рис.13.4. Рис. 13.3. Структурная схема оптимальной системы управления Рис. 13.4. Модель оптимальной системы управления, построенная в среде Simulink MATLAB (r=0,04; q=0,09; k1=5; k2=3.5) На рис. 13.5, а, б и в приведены графики переходных процессов, которые соответствуют осциллограммам, полученным с приборов Scope 2, Scope и Scope 1 (см. рис. 13.4). а) б) в) Рис. 13.5. Графики переходных процессов: а) на приборе Scope 2; б) на приборе Scope; в) на приборе Scope 1 По графикам переходных процессов можно определить перерегулирование и время регулирования при каждой паре постоянных q и r. 13.3. Инструментарий LQR-оптимизации управления в среде MATLAB Базовой составляющей среды MATLAB, содержащей основную часть прикладного программного обеспечения для поддержки анализа и синтеза систем управления, является пакет CST (Control System Toolbox). В состав пакета входит ряд инструментальных средств, которые наиболее часто используются в процессе исследовательского проектирования. В их состав входят две составляющие, которые непосредственно используют оптимизационный подход к проектированию: программная поддержка синтеза LQR регуляторов и фильтров Калмана. Рассмотрим первую из них с учетом того обстоятельства, что пакет CST фактически предоставляет только базовые функции для решения LQR задачи, что в практическом применении требует использования определенной методологии, для достижения желаемого качества динамики замкнутой системы. Базовая задача LQR оптимального синтеза связана с тем обстоятельством, что среди множества характеристик процессов и систем управления особую роль играют интегральные квадратичные функционалы. Они с достаточной для практики мерой адекватности характеризуют точность управления и энергетические затраты управляющих устройств. В связи с этим, особо значимы задачи о таком выборе законов управления, чтобы эти характеристики достигали своих экстремальных значений с учётом требования устойчивости замкнутых систем. Классическая постановка LQR задачи имеет следующий вид. Пусть задана математическая модель объекта управления в виде LTI системы  x (t ) = Ax(t ) + Bu (t ), x(0) = x 0  ,  y (t ) = Cx (t ) (13.35) где х ∈ Rn − n-мерный вектор состояния системы; u ∈ U ⊂ Rm − вектор управления, U − некоторое заданное множество допустимых значений управления; y ∈ Rk − вектор выхода (измеряемых координат); A, B, C – матрицы с постоянными коэффициентами соответствующей размерности; t ∈ T = [t0, t1] − интервал времени функционирования системы, где t0, t1 − моменты начала и окончания процесса управления соответственно. Введем в рассмотрение обратную связь или регулятор u(t) = Kx(t), (13.36) где K – постоянная матрица коэффициентов усиления. На движениях замкнутой системы (12.35), (12.36) с указанными начальными условиями зададим интегральный квадратичный функционал ∞ ∞ J = J ( K , x0 ) = ∫ ( y Qy + du Ru )dt = ∫ ( x T C T QCx + du T Ru )dt T T (13.37) где Q – неотрицательно определенная симметрическая матрица размера (n×n), R – положительно определенная симметрическая матрица (q×q), например R = I. Постоянные компоненты указанных матриц являются весовыми множителями, определяющими значимость вклада в величину функционала отдельных составляющих векторов состояния и управления. Задача LQR-оптимального синтеза состоит в том, чтобы найти такую матрицу K, чтобы функционал (13.37) достигал своего наименьшего значения по отношению ко всем другим матрицам коэффициентов усиления, обеспечивающим асимптотическую устойчивость замкнутой системы: J = J ( K ) → min K ∈Ω (13.38) где Ω – множество матриц K таких, что корни характеристического полинома замкнутой системы ∆ (s) = det((Is – A − BK) расположены в открытой левой полуплоскости. В настоящее время известен целый ряд вычислительных методов, которые позволяют найти оптимальную матрицу K 0 = arg min J ( K ) K ∈Ω коэффициентов регулятора. Наиболее известный вычислительный метод, реализованный в среде MATLAB, базируется на решении алгебраического уравнения Риккати PA + ATP− KBR-1BTP + Q = 0 (13.39) относительно симметричной положительно определенной матрицы P, через которую и вычисляется матрица коэффициентов K0= - R-1BTP оптимального регулятора (13.36). Эта матрица обеспечивает локальный экстремум функционала J(K) на движениях указанной системы при любых начальных условиях. С точки зрения практического аспекта применения приведенной схемы, ее реализация по классическому варианту предполагает, что матрицы R, Q в функционале (13.37) заранее заданы (см. разделы 13.1 – 13.3). Для синтеза оптимального регуляторов линейных стационарных систем в Control System Toolbox имеются функции решений уравнений Беллмана (табл. 13.2). Таблица 13.2. Функции Control System Toolbox Синтаксис Описание [K P e] = lqr(A, B, Q, R) Синтез непрерывного регулятора [K P e] = lqr(A, B, Q, R, N) Синтез непрерывного регулятора [K P e] = dlqr(A, B, Q, R) Синтез дискретного регулятора [K P e] = dlqr(A, B, Q, R, N) Синтез дискретного регулятора [K P e] = lqrd(A, B, Q, R, Ts) Синтез дискретного регулятора [K P e] = lqrd(A, B, Q, R, N, Ts) Синтез дискретного регулятора Функция [K P e] = lqr(A, B, Q, R) вычисляет оптимальную матрицу коэффициентов обратной связи (регулирования) K, такую, что закон управления u(t) = Kx(t) минимизирует функцию потерь (среднеквадратичный функционал качества) без терминального члена: ∞ J = ∫ ( x T Qx + du T Ru )dt . Кроме того, возвращаются матрица P, служащая решением присоединенного уравнения Риккати (13.39) и собственные значения e матрицы (A - BK). Функция [K P e] = lqr(A, B, Q, S, N) включает также перекрестную составляющую 2xTNu(t), которая связывает u и x в целевой функции. Функция [K P e] = dlqr(A, B, Q, R, N) вычисляет матрицу коэффициентов регулирования по всем переменным состояния K для дискретной системы со среднеквадратичным функционалом качества без терминального члена: N −1 ( J = ∑ x T (k )Qx(k ) + u T (k ) Ru (k ) + x T (k ) Nu (k ) k =0 ) при этом вычисляются матрица P, являющаяся решением уравнения Риккати и собственные значения e матрицы (A - BK). Пример 13.1. Ниже приведен пример script-файла, моделирующего систему управления и синтез оптимального регулятора. % Файл "optreg1.m" % Моделирование системы управления с оптимальным регулятором % Параметры системы A=[1 0;-2 1]; B=[1 0;1 0]'; % Параметры критерия качества управления Q=[1/2 0;0 1/2]; R=[1/2 0;0 1/2]; % Время регулирования T=10; % Величина шага SS=0.5; % Количество шагов N=T/SS % Вычисление параметров регулятора [k p e]=dlqr(A,B,Q,R) x=zeros(2,N); u=zeros(2,N); % Начальные условия x(1,1)=2; x(2,1)=1; % Построение графиков динамики системы for i=1:N-1, u(:,i)=-k*x(:,i); x(:,i+1)=A*x(:,i)+B*u(:,i); end x1=x(1,:); x2=x(2,:); u1=u(1,:); u2=u(2,:); t=0:SS:T-SS; subplot(4,1,1); plot(t,x1,'b'); subplot(4,1,2); plot(t,x2,'g'); subplot(4,1,3); plot(t,u1,'y'); subplot(4,1,4); plot(t,u2,'r'); Результаты вычисления параметров оптимального регулятора: >> optreg1.m N= 20 k= 0.8229 -0.1771 0.8229 -0.1771 p= 3.7343 -1.4114 -1.4114 1.1614 e= 0.1771 + 0.1771i 0.1771 - 0.1771i Графики динамики системы представлены на рис. 13.2. 2 -2 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 5 -5 2 -2 2 -2 Рис. 13.2. Динамика состояний и управлений: x1, x2,u1, u2. Заметим, что через решения матричных уравнений Ляпунова ( A + BK 0 ) T P1 + P1 ( A + BK 0 ) + C T RC = 0 ( A + BK 0 ) T P2 + P2 ( A + BK 0 ) + K 0T QK 0 = 0 относительно неизвестных матриц P1 и P2 можно найти величины отдельных составляющих функционала (13.37) для замкнутой оптимальной системы (13.35), (13.36) при заданном векторе начальных условий x(0) = x0 по следующим формулам ∞ J y = ∫ y Qydt =x P1 x0 T T ∞ J u = ∫ u T Rudt = x0T P2 x0 . На практике матрицы P определяют с помощью функции Ляпунова V(x)=xTPx, производная которой с учетом связи x = Ax преобразуется к виду V ( x) = x T PX + x T PX = x T AT Px + x T PAx = x T ( AT P + PA) x . Если обозначить ATP + PA= −C, (13.40) тогда поскольку C положительно определенна, то система асимптотически устойчива в целом и более того, матрица C симметрична. Это следует из того, что C T = −( AT P + PA)T = −( P T A + AT P T ) = −( PA + AT P ) = −C . Справедливы следующие утверждения: 1. Если n собственных значений λ1, …, λn матрицы A таковы, что λi+λj ≠ 0 (i, j =1, …, n), то из уравнения (13.40) при заданной матрице С матрица P определяется однозначно (достаточное условие устойчивости матрицы А). 2. Если матрица А устойчива и матрица C положительно определена, то матрица P также положительно определена (необходимое условие устойчивости матрицы А). На практике целесообразно решать обратную задачу. Выбирают какуюлибо положительно определенную положительную матрицу, например C = I. Тогда из (13.40) можно получить vматрицу P. Подобные операции (определения матрицы P) выполняются с использованием стандартных функций lqry, и lyap, входящих в состав пакета прикладных программ CST среды MATLAB, представленных в таблице 13.2. Таблица 13.2. Команды Control System Toolbox Синтаксис P = lyap(A, C) P = lyap(A, X, Y) Описание Решение непрерывных уравнений Ляпунова Решение непрерывных обобщенных уравнений Ляпунова (уравнений Сильвестра) Функция P=lyap(A, С) находит решение системы уравнений Ляпунова вида (13.40). Функция P=lyap(A, B, C) находит решение обобщенного матричного уравнения Сильвестра (обобщенных уравнений Ляпунова) вида: AX + XB = -C. Функции решения непрерывных уравнений Ляпунова выдают результат только в случае единственности решения, т.е. в случае, когда собственные значения λ11, ..., λ1n матрицы A и собственные значения λ21, ..., λ2n матрицы X для всех (i, j) удовлетворяют условию λ 1i + λ2j ≠ 0. 13.4. Контрольные задания по синтезу оптимальных систем управления на базе пакетов CST и Simulink MATLAB Построить с использованием пакетов Control System Toolbox и Simulink MATLAB модель системы оптимального управления объектом, описываемым системой (13.10) с заданным критерием оптимальности (13.11) и исследовать ее динамику при численных значениях q и r, приведенных в таблице 13.1. Таблица 13.1. Значения величин r и q интегрального квадратичного критерия № Значение постоянных r и q интегрального квадратичного критерия варианта Эксперимент 1 Эксперимент 2 Эксперимент 3 Эксперимент 4 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 r 0.04 0.04 0.04 0.04 0.02 0.03 0.05 0.06 0.07 0.08 0.09 0.05 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.02 0.03 0.04 0.05 q 0.05 0.09 0.08 0.07 0.008 0.03 0.04 0.06 0.07 0.4 0.6 0.001 0.01 0.07 0.06 0.05 0.04 0.1 0.3 0.5 r 1 2 0.2 0.1 0.3 0.6 0.5 0.4 0.7 0.8 0.9 4.0 0.6 0.8 0.9 0.4 0.2 0.1 0.3 0.5 0.7 4.0 6.0 9.0 8.0 q 1 5 0.2 0.1 0.3 0.6 0.5 0.4 0.7 0.8 0.9 4.0 0.9 0.6 0.1 0.2 0.4 0.3 0.5 0.7 0.8 2.0 3.0 4.0 5.0 r 10 8 4 2 3 6 5 14 7 12 9 16 8 9 5 10 2 1 6 3 4 18 12 20 15 q 10 8 4 2 3 6 5 14 7 12 9 16 10 8 4 2 1 9 3 4 5 18 16 22 15 r 50 40 20 10 30 60 25 56 70 80 90 64 32 45 55 75 26 15 36 27 62 72 86 94 95 q 50 40 20 10 30 60 25 56 70 80 90 64 32 45 55 75 26 15 36 27 62 72 86 94 95 Номер варианта задается устно преподавателем. Моделирование проводится в следующей последовательности: 1. Рассчитываются для заданного варианта коэффициенты k1 и k2 (этот пункт выполняется при подготовке). 2. Строится структурная схема системы управления (рис. 13.4) с использованием пакета Simulink MATLAB. 3. Устанавливаются начальные условия: x(0) = х1(0) =1, x’(0) =х1’(0) = х2(0) =0. 4. Исследуются динамические процессы построенной модели по графикам переходных процессов, полученных для каждой паре постоянных r и q. 5. По графикам переходных процессов определяются перерегулирование и время регулирования при каждой паре постоянных q и r. 6. Находятся среди исследованных значений коэффициентов k1 и k2 такие значения k1* и k2*, при которых время регулирования получается минимальным, а перерегулирование − максимальным. Цифровое оптимальное управление динамическим объектом с применением матрицы Крылова Дискретные динамические системы с конечным временем установления переходных процессов называют апериодическими системами управления. Хорошо «приспособленные» к техническим приемам модификации и применению численных методов оптимизации производственных и технологических процессов апериодические системы повышенного порядка особенно часто используются в цифровых управляющих комплексах различного назначения. Применение современных вычислительных сред для управления технологическими процессами на объектах водного транспорта позволяет кардинально изменить процедуру синтеза апериодических систем. Высокое быстродействие и производительность дают возможность для класса дискретных динамических объектов при вариации числа интервалов дискретности решать комплекс задач: идентифицировать объект по экспериментальным характеристикам, оценивать внешние воздействия и компенсировать их влияние на поведение управляемого объекта, а также оптимизировать технологический процесс при управлении по нескольким каналам с различными критериями качества. Важным этапом синтеза апериодических систем является определение управляющих сигналов, позволяющих в течение заданного времени (в условиях ограничений) переводить объект из определенного начального состояния в конечное состояние при минимизации (максимизации) целевой функции. В системах апериодического управления динамическими объектами кусочно-постоянные квантованные по времени сигналы генерируются при наличии в контуре обратной связи цифровых регуляторов выхода и состояния. Рассмотрим модель динамической системы в пространстве состояний = X ( t ) AX ( t ) + BU ( t ) , (6.23) гдеА – матрица состояния размерности n × n; В − (n × l)-матрица; X(t) – вектор состояния. При цифровом управлении вектор U(t) изменяется ступенчато на границах интервалов дискретности (в моменты квантования сигналов), а непосредственно на интервалах имеет постоянные значения. Из работ Калмана и Toy известно, что в общем случае для перевода динамической системы (6.23) с помощью дискретных управлений из начального в конечное состояние (например, нулевое) требуется синтезировать n сигналов управления. С этой целью весь временной интервал N должен состоять не менее, чем из n интервалов, на которых управления могут быть кусочно-постоянными функциями. Рассмотрим способ синтеза управлений, обеспечивающих решение двухточечной граничной задачи (начальное условие − левая граница, конечное условие − правая граница), основанный на использовании матрицы Крылова [18]. Для определенности положим, что (6.23) является системой с одним входом. При кусочно-постоянных сигналах управления, амплитуда которых изменяется в моменты квантования по времени с помощью квантователя, решение уравнения (6.23) при заданном векторе начальных условий X(t0) имеет вид X= ( tN ) W N X ( t0 ) − Kr ⋅U , (6.24) где X(tN) − вектор состояния объекта в момент tN; Kr − матрица Крылова; W − матричный экспоненциал; U – вектор кусочно-постоянных управлений размерности (N × 1). Матрица Крылова полного ранга размерности (n × N) имеет вид Kr = W N −1 W N − 2 ... W 1 W 0  .*H , (6.25) где W = eAδ и H=(I – eAδ)·A-1⋅B; δ – шаг квантования; I – единичнаяn-матрица. В формуле (6.25) знак (.*) означает выполнение операции поэлементного умножения на вектор-столбец H. Согласно (6.25) нa шаге N при δ = 1, т.е. в момент t = tN, вектор состояния X(tN) является функцией вектора начальных условий X(t0) и управлений U = = [U0, U1, …, UN–1]T, приложенных к системе в моменты квантования. Для перевода динамического объекта из состояния X(t0) в состояние X(tN) ≠ 0 требуется получить вектор U c помощью соотношения U = Kr + (X(tN) – WN·X(t0)), (6.26) откуда следует, что, если N = n, объект переводится из начального состояния в конечное за минимальное время. При этом квадратная матрица Крылова, имеющая полный ранг, должна инвертироваться. Если N > n, переход осуществляется за N шагов по критерию минимума расхода энергии на управление. Матрица Крылова становится прямоугольной, и для получения наилучшей оценки вектора управления U можно воспользоваться операцией псевдоинверсии Мура – Пенроуза. Случай приведения объекта в начало координат является частным и получается из (6.26), если X(tN) = 0. Если матрицаА является особенной, то вычисление Н следует производить путем численного интегрирования: t H = t − t ( 0 ) ∫ e A(t − τ ) BU ( τ ) d τ t0 (6.27) по переменной τ. Алгоритм апериодического управления динамическими объектами представлен соотношениями (6.23) – (6.27). Рассмотрим практическое применение полученного алгоритма на конкретных примерах. Предположим, что объект управления описывается матричным дифференциальным уравнением третьего порядка:  dX 1   dt     dX 2  =  dt   dX   3  dt  0 1 0   X 1  0 0 −1 1  ⋅  X  + 0 ⋅ U    2   0 0 −1  X 3  1 (6.28) с вектором начальных условий X(0) = [-1 1 2]T. Обратим внимание на то, что матрица 0 1 0  = A  0 −1 1    0 0 −1 является особенной. Для определенности примем N = 5. Нетрудно убедиться, что собственные значения A равны λ1 = 0, λ2 = -1, λ3 = -1. Следует отметить, что в уравнении (6.24) первое слагаемое в правой части представляет собой переходный процесс, вызванный ненулевыми начальными условиями. Вторая составляющая есть реакция системы на сигнал управления U, изменяющийся в виде ступенчатой функции, полученный с помощью (6.26). Выберем δ = ti – ti-1 = 1. Тогда переходную матрицу Н можно получить как реакцию (6.28) на единичный ступенчатый сигнал в момент t = 1 при нулевых начальных условиях. В среде MatLAB эта операция выполняется с помощью функции матричного экспоненциала: Dr = expm(A) = [ 1.0000 0.6321 0.2642; 0 0.3679 0.3679; 0 0 0.3679]. Формирование элементов матрицы Крылова при изменении N в среде MatLAB выполняется с помощью операции gallery. Матрица Крылова имеет следующие численные значения элементов: Kr = [0.9373 0.8610 0.7076 0.4377 0.1036; 0.0512 0.1076 0.2069 0.3298 0.2642; 0.0116 0.0315 0.0855 0.2325 0.6321]. Оценка управления U на каждом шаге, полученная по формуле (6.26), представляется вектором UT= [-1.2561 -0.8893 -0.2522 0.5022 -0.1047]. По приведенным расчетным данным выполнено построение переходного процесса при воздействии на объект вектора UT. На рис. 6.1 представлен процесс перехода объекта за время N = 5 из начального состояния: X(t0) = X(0) = [-1 1 2]T в конечное состояние: X(tN) = X(N) = [0 0 0]T. Алгоритм, в структуре которого используется матрица Крылова, хорошо адаптируется к изменениям граничных условий и времени действия системы. Так, например, если требуется перевести тот же самый динамический объект из состояния X(t0) = X(0) = [2 0.4 -1]T в состояние X(tN) = X(N) = [-1 0 -0.5]T, на вход следует подать управления, представленные вектором U1: U1 = [-2.2775 1.3244 0.2583 1.8212 -1.3776]. Апериодическое управление динамическим объектом 2 1.5 X(N)=[0; 0; 0] X3 X1,X2,X3, U 1 0.5 X2 -0.5 -1 X1 U -1.5 0.5 1 1.5 2 2.5 t, c 3 3.5 4 4.5 5 Рис. 6.1. Управление объектом с нулевой правой границей В результате получим переходный процесс (рис. 6.2) с графической интерпретацией траекторий переменных состояния, изменяющихся под действием апериодических управлений во времени. Заметим, что на правой границе U1 должен быть принят равным нулю. Ниже приведен фрагмент скрипт-файла sah727.m, предназначенного для вычислений апериодических управлений прямоугольной формы. Апериодическое управление с заданными граничными условиями 2.5 X(0)=[2 0.4 -1]', X(N)=[-1 0 -0.5]', N=5. 2 1.5 X1, X2, X3, U 1 X1 0.5 U X2 -0.5 X3 -1 -1.5 -2 -2.5 0.5 1 1.5 2 2.5 t, c 3 3.5 4 4.5 5 Рис. 6.2. Управление объектом при ненулевых граничных условиях Фрагмент файла sah727.m Применение матрицы Крылова для управления динамической системой по критерию минимума энергетических затрат ==================================== Динамика системы A=[0 1 0;0 -1 1;0 0 -1]; B=[0 0 1]'; N=5; C=eye(3); D=[0 0 0]' Начальные и конечные условия, число шагов N: x0=[-1 1 2]';xN=[0 0 0]'; N=6; Выбор шага квантования: delt=1.0; Переход к системе в пространстве состояний в терминах LTI: sys1=ss(A,B,C,D); Переход к дискретной системе в пространстве состояний sysd=c2d(sys1,delt,'zoh'); Вывод матриц дискретной системы по управлению 'zoh': Ad=sysd.a; Bd=sysd.b; Cd=sysd.c; Dd=sysd.d; МАТРИЦАКРЫЛОВА Kr=gallery('krylov',Ad,Bd,N); Kr=flipud(rot90(Kr,2)); KR=pinv(Kr); Оценка вектора управления дискретной системой c использованием % матрицы Крылова: Dr=expm(A.*delt); Z=Dr^(N)*x0; U5=KR*(xN-Z); ================================================ Формирование векторов управления непрерывной системой: U=[]; fori=0:N-1; for t1=0:0.001:N; if (t1>=i)&(t1

Разместил пособие