Идентификация в системах управления. Методы оценивания параметров моделей. Представление систем в пространстве состояний
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
ОГЛАВЛЕНИЕ
ИДЕНТИФИКАЦИЯ В СИСТЕМАХ УПРАВЛЕНИЯ......................................................................................................... 3
1.1.
ДИНАМИЧЕСКИЙ ОБЪЕКТ КАК ПРЕДМЕТ ИДЕНТИФИКАЦИИ ................................................................................... 3
1.2.
ОСНОВНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ ИДЕНТИФИКАЦИИ ................................................................................... 4
1.3.
ОСНОВНЫЕ ЭТАПЫ ИДЕНТИФИКАЦИИ .................................................................................................................. 5
2.
ВХОДНЫЕ СИГНАЛЫ, ИСПОЛЬЗУЕМЫЕ ПРИ ИДЕНТИФИКАЦИИ ................................................ 6
2.1.
ТРЕБОВАНИЯ КО ВХОДНЫМ СИГНАЛАМ ............................................................................................................... 6
2.2.
ПОНЯТИЕ ПОСТОЯННО ВОЗБУЖДАЮЩЕГО СИГНАЛА........................................................................................... 7
3.
МОДЕЛИ, ИСПОЛЬЗУЕМЫЕ ПРИ ИДЕНТИФИКАЦИИ ........................................................................ 8
3.1.
НЕПРЕРЫВНЫЕ МОДЕЛИ И ИХ ВЗАИМОСВЯЗЬ...................................................................................................... 8
3.2.
ДИСКРЕТНЫЕ МОДЕЛИ И ИХ ВЗАИМОСВЯЗЬ ......................................................................................................... 9
4.
МЕТОДЫ ОЦЕНИВАНИЯ ПАРАМЕТРОВ МОДЕЛЕЙ ......................................................................... 16
4.1.
МЕТОДЫ ОЦЕНИВАНИЯ (СТАТИЧЕСКИЕ МОДЕЛИ)............................................................................................... 16
4.1.1.
Метод наименьших квадратов для оценивания параметров статических моделей ...... 17
4.1.2.
Метод максимального правдоподобия для оценивания параметров статических
моделей 19
4.2.
МЕТОДЫ ОЦЕНИВАНИЯ В РЕЖИМЕ OFF-LINE (ДИНАМИЧЕСКИЕ МОДЕЛИ) ........................................................... 20
4.2.1.
Использование АРСС – моделей для описания процесса и шума ............................................ 20
4.2.2.
Применение МНК для оценивания параметров объекта .......................................................... 23
4.2.3.
Модели шума............................................................................................................................................. 26
4.2.4.
Обобщенный метод наименьших квадратов (ОМНК) ................................................................ 28
4.2.5.
Расширенный матричный метод (РММ) ...................................................................................... 31
4.2.6.Метод инструментальной переменной (МИП) .................................................................................. 33
4.3.
МЕТОДЫ ОЦЕНИВАНИЯ В РЕЖИМЕ ON-LINE (ДИНАМИЧЕСКИЕ МОДЕЛИ)............................................................. 37
4.3.1.
Рекуррентные алгоритмы идентификации ................................................................................. 37
4.3.2.
Рекуррентный метод наименьших квадратов ............................................................................ 37
4.3.3.
Рекуррентный обобщенный метод наименьших квадратов ................................................... 39
4.3.4.
Рекуррентный расширенный матричный метод ........................................................................ 42
4.3.5.
Рекуррентный метод инструментальной переменной ............................................................ 44
5.
МЕТОДЫ ОПРЕДЕЛЕНИЯ ПОРЯДКА МОДЕЛИ ОБЪЕКТА .............................................................. 46
5.1.
МЕТОДЫ ОПРЕДЕЛЕНИЯ ПОРЯДКА НА ОСНОВЕ ФУНКЦИЙ ПОТЕРЬ ..................................................................... 47
5.2.
МЕТОДЫ ОПРЕДЕЛЕНИЯ ПОРЯДКА ПО НЕКОРРЕЛИРОВАННОСТИ ОСТАТКОВ ..................................................... 48
5.3.
МЕТОД ОПРЕДЕЛЕНИЯ ПОРЯДКА ПО ХАРАКТЕРИСТИКАМ МАТРИЦЫ МОМЕНТОВ ............................................... 51
5.4.
МЕТОД ОПРЕДЕЛЕНИЯ ПОРЯДКА ПО АНАЛИЗУ ДИАГРАММЫ ПОЛЮСОВ И НУЛЕЙ ДИСКРЕТНОЙ ПЕРЕДАТОЧНОЙ
ФУНКЦИИ........................................................................................................................................................................ 56
2
6.
ПРЕДСТАВЛЕНИЕ СИСТЕМ В ПРОСТРАНСТВЕ СОСТОЯНИЙ...................................................... 57
6.1.
ПРЕДСТАВЛЕНИЕ ОДНОМЕРНЫХ СИСТЕМ В ПРОСТРАНСТВЕ СОСТОЯНИЙ ......................................................... 57
6.2.
ПРЕДСТАВЛЕНИЕ МНОГОМЕРНЫХ СИСТЕМ В ПРОСТРАНСТВЕ СОСТОЯНИЙ ....................................................... 63
6.3.
ПРЕДСТАВЛЕНИЕ МНОГОМЕРНЫХ ДИСКРЕТНЫХ СИСТЕМ В ПРОСТРАНСТВЕ СОСТОЯНИЙ. ................................ 71
7.
МОДЕЛИ МНОГОМЕРНЫХ ЛИНЕЙНЫХ ДИНАМИЧЕСКИХ СИСТЕМ ............................................................. 71
7.1.
МОДЕЛЬ В ВИДЕ МАТРИЦЫ ПЕРЕДАТОЧНЫХ ФУНКЦИЙ ...................................................................................... 72
7.2.
МОДЕЛЬ В ВИДЕ ИМПУЛЬСНОЙ ПЕРЕХОДНОЙ ФУНКЦИИ..................................................................................... 72
7.3.
ПРЕДСТАВЛЕНИЕ СИСТЕМЫ В ПРОСТРАНСТВЕ СОСТОЯНИЙ .............................................................................. 73
7.4.
ДРОБНО-МАТРИЧНОЕ ПРЕДСТАВЛЕНИЕ ....................................................................................................................... 74
7.5.
КАНОНИЧЕСКИЕ ФОРМЫ ПРЕДСТАВЛЕНИЯ МНОГОМЕРНЫХ ДИНАМИЧЕСКИХ СИСТЕМ .......................................................... 75
8.
ПЕРЕХОДЫ ОТ НЕПРЕРЫВНЫХ МОДЕЛЕЙ К ДИСКРЕТНЫМ И ОБРАТНО. P-Z И Z-P ПЕРЕХОДЫ. ................ 77
8.1.
ПОСТАНОВКА ЗАДАЧИ P-Z И Z-P ПРЕОБРАЗОВАНИЙ ........................................................................................................ 77
8.1.1.
p-z и z-p переходы при неидеальном импульсном элементе ............................................................. 78
9.
ТРАДИЦИОННЫЕ МЕТОДЫ ИДЕНТИФИКАЦИИ ........................................................................................... 85
9.1.
МЕТОД ИДЕНТИФИКАЦИИ, ОСНОВАННЫЙ НА УРАВНЕНИИ ВИНЕРА-ХОПФА ....................................................................... 85
9.2.
ПСЕВДО - СЛУЧАЙНЫЕ СИГНАЛЫ И ИХ ХАРАКТЕРИСТИКИ ................................................................................................ 87
3
Идентификация в системах управления
Лекция №1
Динамический объект как предмет идентификации
1.1.
Целью управления является построение качественных систем; для этого необходимо
знать математическое описание объекта управления.
Объекты, с точки зрения математического описания, делятся на:
1. Объекты, для которых математическое описание известно вплоть до значений
параметров. С точки зрения идентификации такие объекты представляются как белый,
или прозрачный ящик и обозначаются в виде рисунка, представленного на рис.1.1.
х
y
Объект
Рис.1.1. Объект типа «прозрачный ящик»
Пример: Двигатель постоянного тока, для которого указаны все параметры и известно
его математическое описание.
2. Объекты, у которых известен вид математического описания, но требуется уточнить
параметры, из-за неточности исполнения элементов они отличаются от номинальных. С
точки зрения идентификации такие объекты представляются как серый ящик и
обозначаются в виде рисунка, представленного на рис.1.2.
х
Объект
y
Рис.1.2. Объект типа «серый ящик»
Пример: Синхронные генераторы, двигатели , для которых требуется уточнение
параметров.
3. Объекты, для которых математическое описание неизвестно.
С точки зрения
идентификации такие объекты представляются как черный ящик и обозначаются в виде
рисунка, представленного на рис.1.3.
х
Объект
y
Рис.1.3. Объект типа «черный ящик»
Пример: Процессы, протекающие в металлургии, химических объектах, реакторах и др..
4
Объекты типов 2 и 3 являются объектами идентификации. Для таких объектов априорно
(до опыта) известно либо кое-что (2 группа), либо практически ничего (3 группа), а
апостериорно (после опыта) известны записи входных и выходных сигналов.
Основные понятия и определения идентификации
1.2.
Под идентификацией понимается определение на основе записей входных и выходных
сигналов объекта модели внутри определенного класса моделей, эквивалентной (адекватной)
объекту при определенных тестовых воздействиях. В отечественной литературе встречается
термин идентификация в узком смысле, что означает параметрическую идентификацию
(оценивание), когда известна структура модели и требуется определить ее параметры, и
идентификация в широком смысле, когда требуется определить как структуру, так и
параметры модели.
Идентификация – процесс сложный. Для нее используется вся имеющаяся в наличии
априорная информация об объекте.
На рис. 1.4. представлена схема использования информации в процессе идентификации и
моделирования.
Ошибки описания
Ошибки
линеаризации
линеаризация
Шум процесса
Нелинейные
дифференциальные
уравнения в частных
производных
ОБЪЕКТ
(ПРОЦЕСС)
Ошибки
агрегирования
агрегирование
Линеаризованные
уравнения в
частных
производных
Обыкновенные
линеаризованные
дифференциальные
уравнения
Моделирование (априорная информация)
Идентификация (апостериорная информация)
Измеренные
данные
дискретизация
Обработка
данных
Ошибки измерения
Ошибки
дискретизации
С
Т
Р
У
К
Т
У
Р
А
МОДЕЛЬ
Оценка
порядка
Оценка
параметров
Оценка
состояния
Рис. 1.4. Схема использования информации при идентификации и моделировании
5
Верхняя часть схемы относится к моделированию объекта на основе физических
законов, протекающих в нем, нижняя – к идентификации по записям входного / выходного
сигналов, полученных с объекта.
Основные этапы идентификации
1.3.
1. Изучение объекта управления с точки зрения действующих на него сигналов:
Нужно ответить на вопросы:
Какие сигналы действуют, т.е. тип сигнала (синусоидальный, постоянный и т.д.)?
Какие сигналы являются входными, выходными, возмущающими, помехами?
Какова рабочая точка, т.е. номинальный режим работы объекта?
Результатом является структурная схема объекта с действующими сигналами в виде
рис. 1.5.
fm
f
f
1
2
Помехи
x1
Входы
y1
y2
x2
xp
Выходы
yq
z1
z2
zr
Возмущения
Рис.1.5. Общая схема объекта
2. Изучение объекта управления с точки зрения его свойств. Из априорных знаний
об объекте (уравнений, описывающих объект) и из проведенных предварительных
исследований необходимо ответить на вопросы:
О линейности или нелинейности объекта;
О стационарности или нестационарности объекта;
О непрерывности или дискретности объекта;
О сосредоточенности или распределенности параметров.
На основании ответов выбирается класс модели, используемой в дальнейшем.
3. Выбор тестирующих сигналов, формирование записей входов/выходов. На этом
этапе решается вопрос о проведении активной или пассивной идентификации. Активная
идентификация проводится в том случае, если на вход объекта поступает недостаточно
информативный сигнал, по которому нельзя определить параметры объекта; в этом случае
6
на вход объекта подаются так называемые тестирующие сигналы, о которых речь пойдет в
дальнейшем. Результатом этого этапа являются записи входных/выходных сигналов.
4. Определение порядка модели в выбранном классе моделей, т.е. так называемая
структурная идентификация. На этом этапе из априорной информации об объекте
определяется максимально возможный порядок объекта и известными методами проводится
структурная идентификация, т.е. определение порядка объекта.
5. Оценивание параметров модели (параметрическая идентификация).
6. Проверка адекватности модели объекту; проводится по некоторым реализациям
входных сигналов.
2. Входные сигналы, используемые при идентификации
Требования ко входным сигналам
2.1.
1. Удобство генерирования сигнала. Входной сигнал должен быть легко сгенерирован
оператором или автоматическим устройством и должен быть безопасным для объекта;
например, из этих соображений единичный скачок предпочтительней единичного импульса
2. Обеспечение чувствительности выходного сигнала к изменению параметров объекта
(это означает, что изменяющиеся параметры объекта должны приводить к изменению реакции
этого объекта на входной сигнал).
3. Измеримость сигнала приборами (это означает, что динамические характеристики
приборов и их погрешности накладывают ограничения на возможные амплитуды входного и
выходного сигналов и их частотный диапазон). Так, например, при подаче на вход объекта
гармонического сигнала для измерения реакции на него не может использоваться электронный
вольтметр, измеряющий действующее значение гармонического сигнала, т.е. выдающего на
выходе константу.
4. Требования, накладываемые выбранным классом модели (это означает, что входной
сигнал должен соответствовать всем предпосылкам, при которых модель соответствует
объекту), что можно продемонстрировать на рис.2.1 для построения линеаризованной модели
нелинейного объекта.
y
x
Рис.2.1.
7
5.Требования, накладываемые методами оценивания (это означает, что входные сигналы
должны соответствовать имеющимся в распоряжении исследователя методам идентификации ).
6. Требования, накладываемые дальнейшим использованием моделей (для уточнения
параметров объекта, для проектирования системы, работающей в определенном диапазоне
частот, для предсказания выходов объекта и т.д.).
Лекция №2
Понятие постоянно возбуждающего сигнала
2.2.
В дальнейшем относительно входного сигнала будем предполагать следующее:
На вход системы подается постоянно возбуждающий сигнал порядка, большего, чем
число оцениваемых параметров.
Постоянно возбуждающим сигналом порядка n называется дискретный стационарный
сигнал u(kT) (k=0,1,…; Т – период дискретизации), у которого функция спектральной
плотности Suu( ) отлична от нуля по крайней мере в n точках на интервале частот от , или
T
, где
- частота квантования, равная
. Для такого сигнала
автоковариационная функция Ruu( ) не вырождена.
(
Примеры:
a)
По постоянному сигналу на входе и выходе объекта можно найти один параметр –
его коэффициент усиления, рис.2.2.
x
y
Sxx( )
ОБЪЕКТ
Рис. 2.2
b) По действующей на входе объекта синусоиде можно найти 2 параметра (например, для
инерционного звена k и T), рис.2.3.
y
x
k/(1+pT)
Рис.2.3
Sxx( )
8
3. Модели, используемые при идентификации
Модели можно представить в виде диаграммы, рис. 3.1
Непрерывные
МОДЕЛИ
Дискретные
Параметрические
Параметрические
Дифференциальные
уравнения
Разностные
уравнения
Передаточные
функции
Дискретные
передаточные
функции
Разложение по
ортогональным
функциям
Непараметрические
Непараметрические
Весовые функции
Весовые функции
Частотные
характеристики
Частотные
характеристики
Переходные
функции
Рис.3.1. Классификация моделей идентификации
3.1.
Непрерывные модели и их взаимосвязь
Взаимосвязь непрерывных моделей можно представить рисунком 3.2.
9
L( ),
( )
L
Дифференциальные
уравнения
j
W(p)
P( )
W(j )
L-1
Q( )
Рис.3.2
∫
w(t)
h(t)
d/dt
Рис.3.2. Взаимосвязь непрерывных моделей
На рис.3.2:
W(p) – передаточная функция;
W(j ) – комплексный коэффициент усиления;
P( ), Q( ) – действительная и мнимая частотные функции;
w(t), h(t) – весовая и переходная функции;
-1
L,L – прямое и обратное преобразование Лапласа;
L( ), ( ) – логарифмическая амплитудная и фазовая частотные характеристики.
Хотя методы идентификации с непрерывными моделями существуют и достаточно
хорошо разработаны, они обладают рядом недостатков:
Основной недостаток – это противоречие между дискретностью отсчетов
входных и выходных сигналов с непрерывностью модели;
Неточность представления непрерывных моделей на компьютере
(непрерывные модели представляются соединением интеграторов, каждый из которых
моделируется численными методами /методом Симпсона и т.д./, либо представляется
системой дифференциальных уравнений, решаемой методами Эйлера, Рунге-Кутта и т.д.
Трудность и ошибки при переходе от одной модели к другой.
3.2.
Дискретные модели и их взаимосвязь
Рассмотрим дискретные модели.
1.
Весовая (импульсная переходная функция: w(mT), m=0,1,2…, Т – период
квантования.
Как известно, весовая функция инвариантна к операции дискретизации, рис.3.3.
w(mT) – реакция объекта на единичный импульс
=
.
10
W(p)
T
T
Рис.3.3. Получение дискретной весовой функции
(t) =
w(mT)=w(t)
Весовая функция может быть использована в сумме свертки, аналогичной интегралу
свертки для непрерывных сигналов, а именно, для объекта, представленного на рисунке:
u(mT)
y(mT)
Объект
Выходной сигнал равен: y[nT]=
или в операторной форме:
, где U(z-1), Y(z-1) – дискретные изображения по Лапласу входного и выходного сигналов
-1
объекта, z – оператор задержки сигнала на один такт. Напомним, что дискретная передаточная
функция системы определяется по весовой функции непрерывной системы следующим
образом:
T
W(p)
w(t)
D
(p)T
w(mT)
)
-1
где L – обратное преобразование Лапласа;
Т – шаг дискретизации, или период квантования;
D – дискретное преобразование Лапласа.
Таким образом, дискретную передаточную функцию можно найти по формуле:
Характеристики модели:
Линейность по параметрам;
Бесконечное число параметров;
Единственность представления.
2. Разностное уравнение
11
Или в краткой форме:
.
АР – авторегрессионная часть;
СС – часть скользящего среднего;
АРСС – авторегрессионная модель скользящего среднего.
- оператор задержки на один такт во временной области
В операторной форме:
.
.
Характеристики модели:
Линейность по параметрам;
Конечное число параметров (g+p+1);
Не единственность представления, но, если потребовать минимальный порядок, то
модель становится единственной).
3. Дискретные передаточные функции
.
Характеристики модели:
Нелинейность по параметрам знаменателя;
Конечное число параметров (g+p+1);
Единственность представления;
Традиционность использования;
Полное описание при нулевых начальных условиях..
В основе дискретных моделей лежат разностные уравнения. Представим дискретные модели и
их взаимосвязь в виде схемы, представленной на рис.3.4.
D
z p
*
Разностные уравнения
W (p)
D
-1
W(p)
z p
w[mT]
w(t)
T
Рис.3.4. Взаимосвязь дискретных моделей
На рис.3.4 приняты обозначения:
W(p) – передаточная функция;
12
w(t) – весовая функция;
W*(p) – дискретная передаточная функция;
w[mT] – дискретная весовая функция;
D – дискретное преобразование Лапласа;
D-1 – обратное дискретное преобразование Лапласа;
T – шаг дискретизации (период квантования.
z p, p z – переходы от дискретного к непрерывному изображению по Лапласу и, наоборот,
от непрерывного к дискретному.
Пунктиром изображен переход от дискретной весовой функции, представленной
отсчетами, к дискретной передаточной функции. Продемонстрируем возможность такого
перехода на следующем примере.
Известна дискретная передаточная функция:
(
_________________________________
Из уравнений, зная отсчеты ординат весовой функции, можно найти коэффициенты
дискретной передаточной функции. Следует отметить, что ординаты весовой функции
удовлетворяют равенству:
Характеристики дискретных моделей
1. Дискретные модели точно представляются в памяти компьютера;
13
2. Дискретные модели полностью соответствуют дискретным отсчетам входных/выходных
сигналов;
3. При переходе от дискретных к традиционным непрерывным моделям появляются
погрешности перехода.
Лекция №3
Продемонстрируем взаимосвязь дискретных моделей на примере инерционного звена с
известной непрерывной передаточной функцией:
Найдем дискретную передаточную функцию по цепочке:
T
W(p)
w(t)
D
(p)T
w(mT)
)
1(t)
=
=
=
=
Переход от
к разностному уравнению
Переход от разностного уравнения к дискретной передаточной функции
14
)
Переход от разностного уравнения к весовой функции
=
Входной сигнал и выходной сигнал дискретного
инерционного звена представлен на рис. 3.5.
Рис. 3.5. Вход/выход инерционного звена
Переход от дискретной передаточной функции к весовой функции
Разложим дискретную передаточную функция в ряд Лорана, тогда коэффициентами при
будут ординаты весовой функции в соответствии с равенством:
15
Весовая функция дискретного инерционного звена имеет вид:
Переход от весовой функции, заданной ординатами, к дискретной передаточной функции
Предполагаем, что модель описывается дискретной передаточной функцией 1-го порядка:
В соответствии с ранее изложенным
Раскрывая равенство, получаем:
,
Откуда получаем дискретную передаточную функцию в виде:
Переход от непрерывной передаточной функции к дискретной передаточной функции
Перевод будем проводить с помощью билинейного преобразования
Аналогично получим p
2+pT=2z-pTz
pT(1+z)=2(z-1)
z переход:
16
Найдем коэффициент усиления дискретного полученного звена при p=0 и, следовательно,
z=1. При подстановке получим
, т.е. коэффициент усиления не изменился.
Переход от дискретной передаточной функции к непрерывной передаточной функции
Найдем коэффициент усиления полученного звена при p=0:
При выводе было использование приближение
1-T/T1
Лекция №4
4. Методы оценивания параметров моделей
4.1.
Методы оценивания (статические модели)
В качестве методов оценивания параметров статических моделей будем рассматривать
два:
1.
МНК – метод наименьших квадратов;
2.
ММП – метод максимального правдоподобия.
1). Одномерная задача: найти точное значение сопротивления R по данным N
экспериментов (рис.4.1).
Известно, что класс амперметра выше класса вольтметра, т.е.
погрешность измерения напряжения выше, чем – тока. Результаты
каждого эксперимента (i=1…N) можно представить в виде равенств:
,
Рис.4.1 Схема измерения сопротивления
Где ui, ii – показания вольтметра и амперметра при i-ом измерении;
- оценка
значения сопротивления;
- погрешность измерения.
2). Многомерная задача:
17
Найти значения n параметров электрической цепи (
1,
,
n)
, представленной на рис.4.2 по
результатам N измерений, произведенным с ошибками.
k=1…N
…………………………………………….
Рис.4.2. Схема измерения
В векторно- матричной форме можно записать:
=I
+
4.1.1. Метод наименьших квадратов для оценивания параметров статических
моделей
В основе Метода наименьших квадратов (МНК) лежит средняя квадратическая ошибка (СКО).
1). Одномерная задача
18
,
Где
,
– взаимная корреляционная и автокорреляционная функции.
Для получения более общего выражения для оценки параметра введем обозначения:
i– вход – x ,
u – выход – y ,
- искомый параметр -
.
Во введенных обозначениях, получим оценку искомого параметра в виде
.
Геометрическую интерпретацию приведенного результата можно продемонстрировать на рис.
4.3.
y
x
Рис.4.3.
2). Многомерная задача
Имея в виду соотношение:
=I
+ , сформируем среднюю квадратическую ошибку:
=
Для того чтобы взять производную от критерия V по вектору нужно вспомнить правила
дифференцирования по вектору:
1.
2.
3.
при условии, что А – симметричная матрица.
В соответствии с правилами дифференцирования, получим:
, откуда
19
При условии, что матрица
не вырождена, т.е. нет линейно зависимых столбцов (строк),
можно правую и левую часть равенства домножить на обратную матрицу
. При этом
получим
- МНК – оценка вектора параметров
.
Лекция №5
4.1.2. Метод максимального правдоподобия для оценивания параметров статических
моделей
1). Одномерная задача
Метод максимального правдоподобия (ММП) применяется при условии, что погрешность
измерений
I представляет
собой нормальный белый шум с нулевым математическим
ожиданием, т.е. функция плотности вероятности для помехи
I имеет
вид:
.
При проведении N экспериментов получены N отсчетов помех измерения
,…..
.
При условии, что сигнал помехи нормальный белый шум, запишем плотность
вероятности совместного события получения N отсчетов
помехи:
.
Таким образом, мы получили функцию плотности вероятности совместного события
получения реализации помехи
,…..
.
После того, как эксперимент был проведен и получена реализация сигналов ui и ii
функция плотности вероятности превращается в функцию правдоподобия
.
Естественно предположить, что наилучшая оценка параметра максимизирует функцию
максимального правдоподобия. Вместо поиска максимума функции правдоподобия
значительно легче найти минимум от логарифма функции правдоподобия:
Из равенства видно, что производная от функции максимального правдоподобия
обращается в ноль в той же точке, что и производная от логарифма функции МП. Иными
словами значение наилучшей оценки параметра, найденное из условия максимизации функции
20
МП. Совпадает с минимумом функции
, найденным из условия равенства нулю
производной:
, откуда получаем
.
Заметим, что оценка по ММП совпадает с оценкой, полученной по МНК.
2). Многомерная задача
Аналогичные рассуждения можно провести для многомерной задачи. В этом случае
функция правдоподобия будет иметь вид:
.
, откуда получаем ММП – оценку вектора
параметров:
Вывод: При условии, что помеха является нормальным белым шумом, оценки.
Полученные по методу наименьших квадратов и по методу максимального правдоподобия
совпадают и являются наилучшими.
Методы оценивания в режиме off-line (динамические модели)
4.2.
В качестве моделей будем использовать авторегрессионные модели скользящего
среднего (АРСС) минимального порядка, достоинства которых обсуждались ранее.
4.2.1. Использование АРСС – моделей для описания процесса и шума
Запишем уравнение АРСС – модели:
АР
где
СС
,
- входной и выходной сигнал в момент времени
;
-1
– так называемая ошибка уравнения; q – задержка на один такт во временной области.
Предположим, что идентифицируемые объекты (процессы) описаны разностными
уравнениями, т.е. АРСС – моделью (это предположение так же естественно, как и
предположение об описании непрерывных объектов линейными дифференциальными
уравнениями). Схему объекта можно представить в виде рис.4.4:
e[k]
u[k]
Идентифицируе
мый объект
y[k]
Рис.4.4. Схема объекта
21
Ошибка уравнения
возникает в результате:
1.
Наличия помех, действующих в объекте;
2.
Неточности описания объекта АРСС – моделью (из-за неучтенных
нелинейностей; более низкого порядка модели по сравнению с порядком реального
объекта).
Ошибка уравнения в общем виде может быть отлична от
белого шума, т.е. иметь автокорреляционную функцию, отличную
от
- функции, рис.4.5.
Такой шум называется цветным шумом.
Запишем разностное уравнение, соответствующее
выбранной АРСС – модели. Учтем, что g>=p из условия
Рис.4.5.Автокорреляционная
функция
физической реализуемости объекта.
+,,,+
+e(k).
Запишем уравнения для дискретных моментов времени k=0,1,…,g,g+1,…,N,где N
имея в виду, что начальные значения сигналов – нулевые:
Вводя следующие обозначения:
сигнала,
- вектор значений выходного
- вектор ошибок уравнения,
-вектор истинных параметров процесса,
- матрица
наблюдений.
,
22
Используя введенные обозначения, получим описание идентифицируемого процесса в
векторно-матричной форме
– вектор ошибок уравнения идентифицируемого объекта (процесса).
Уравнение модели для поиска параметров будет иметь аналогичный вид (т.е.
описываться АРСС – моделью и векторно-матричной формой):
.
(
)=
(
)=
Где
Значок
- оператор задержки на один такт во временной области;
означает оценку параметра.
Уравнение модели в векторно-матричной форме:
.
Вектор оцениваемых параметров АРСС – модели имеет вид:
,
- вектор ошибок уравнения модели, содержащих ошибку уравнения объекта и
дополнительно все информацию о неточности настройки параметров модели.
Лекция №6
Схема теоретической модели процесса и соответствующей АРСС- модели представлена
на рис.4.6.
23
ТМО
МО
Рис.4.6. Схема теоретической модели процесса и ARMAX-модели.
ТМО – теоретическая модель объекта;
МО – модель объекта;
- ошибка уравнения модели.
Предположим, что порядок модели и объекта одинаковый и модель настроена, тогда, как видно,
в силу симметрии схемы рис.4.6
и ошибка минимальная. Если параметры модели
не настроены, то в
будет содержаться информация о расхождении параметров модели и
объекта, которая будет существенной только при условии подачи на вход объекта и модели
достаточно информативного сигнала. По ошибке модели можно настроить ее параметры.
4.2.2. Применение МНК для оценивания параметров объекта
Для оценивания параметров объекта сформируем критерий близости модели к объекту в
виде СКО (среднеквадратической ошибки
):
Применяя векторно-матричную форму уравнения модели:
Наилучшую оценку векторов параметров модели
, получим:
находим из условия
.
24
Найдем производную от СКО по вектору параметров модели, используя правила
дифференцирования квадратичных форм по вектору, приведенные ранее.
.
При условии, что матрица
не вырождена, получаем МНК – оценку вектора
параметров модели :
Проверим полученную оценку на асимптотическую несмещенность, т.е. выполнение условия:
- =
В качестве
.
подставим выражение вектора, описывающего объект:
Т.е.
+
Для несмещенности возьмем предел, получим:
.
Из требования несмещенности оценки вектора параметров модели правый предел должен
быть равен нулевому вектору, т.е. должны выполняться условия несмещенности:
1.
2.
=
Требование 1 означает, что входной и выходной сигналы достаточно информативны, что
обеспечивается подачей на вход объекта постоянно возбуждающего сигнала порядка не
меньшего чем число оцениваемых параметров, т.е. g+p+.
Для того, чтобы понять, при каких условиях выполняется второе требование. Распишем его
подробнее:
=
25
=
Требование 2 выполняется в том случае, когда
а) входной сигнал объекта не коррелирован с ошибкой уравнения;
б) выходной сигнал объекта не коррелирован с ошибкой уравнения.
Условие а) выполняется для следующих двух схем идентификационного эксперимента, но не
выполняется для третьей схемы, поскольку входной сигнал объекта коррелирован с помехой
e[k]
(рис.4.7):
u[k]
Идентифициру
емый объект
y[k]
Схема разомкнута
e[k]
Схема замкнутая
u[k]
Идентифициру
емый объект
e[k]
u[k]
Идентифициру
емый объект
y[k]
y[k]
Схема замкнутая
Рис.4.7
Для того, чтобы исследовать условие некоррелированности выходного сигнала объекта и
ошибки уравнения, рассмотрим следующий пример:
Пример:
Объект первого порядка описывается разностным уравнением:
.
Запишем выходные сигналы объекта для нескольких моментов времени:
=
В соответствии с требованием 2 найдем значение взаимной корреляционной функции Rye(1)
усреднением по множеству, предполагая, что на входе и выходе действует случайные сигналы
и, как известно, для эргодических процессов усреднение по времени можно заменить
усреднением по множеству
26
,
(черта над выражением – усреднение по множеству). Предполагая, что ошибка уравнения имеет
нулевое математическое ожидание и не коррелированна со входным сигналом, получим :
Значение взаимной корреляционной функции может быть равно 0 только при условии
некоррелированности значений ошибки уравнения в разные моменты времени, т.е. только в том
случае, когда ошибка уравнения представляет собой сигнал типа белый шум и ее
автокорреляционная функция имеет вид
- функции Дирака.
Лекция №7
4.2.3. Модели шума
В большинстве случаев ошибка уравнения представляет собой цветной шум (coloured) , для
которого автокорреляционная функция отлична от
- функции. Причины этого могут быть
разными:
1. Естественная: соседние отсчеты при малом шаге квантования могут быть зависимыми;
2. Точка приложения шума (ошибка уравнения) может быть отлична от принятой в АРСС –
e(k)
моделях.
u(k)
y(k)
-1
b0+B(q )
-
A(q-1)
Рис. 4.8. АРСС-модель
Более естественным является представление ошибки в виде цветного шума.
В методах идентификации (оценивания), дающих несмещенные оценки, используются так
называемые модели шума, т.е. цветной шум предполагается выходом АР, СС или АРСС –
модели, на вход которой подается белый шум. В этом случае помеха
сигнал типа «белый шум»
, представляется как
, пропущенный через динамическое звено, в дискретном случае
описываемое разностной схемой. В этом случае получаем III модель шума :
,
,
где
-сигнал типа «белый шум», действующий на входе теоретической модели шума;
27
-сигнал на выходе теоретической модели шума, представляющий собой «цветной шум».
Из условия физической реализуемости r>=s.
e(k)
(k)
-1
1+C(q )
-
D(q-1)
Рис. 4.9 а. III модель шума
АРСС-модель шума может быть с некоторой точностью замене СС – моделью, т.е. в
виде «скользящего среднего», так называемой II моделью шума,рис.4.9 б .
e(k)
(k)
-1
1+C(q )
Рис. 4.9 б. II модель шума
или АР – моделью (авторегрессионной моделью) шума, так называемой I моделью шума
e(k)
(k)
-
’
D (q-1)
Рис. 4.9 в. I модель шума
Модели шума имеют одинаковые весовые функции, что можно продемонстрировать на
примере.
Пример Пусть «цветная» ошибка уравнения формируется как «белый» шум, пропущенный
через динамическую АРСС – модель:
(III модель шума). Для
получения весовой функции разложим дискретную передаточную функцию модели шума в ряд
Лорана, оделив числитель на знаменатель, а именно:
Весовая функция модели шума имеет вид, представленный на рис.4.10.
28
Рис.4.10. Весовая функция
II модель шума описывается уравнением
I модель шума может быть получена делением знаменателя на числитель дискретной
передаточной функции:
Очевидно, что дискретная весовая функция всех 3-х моделей шума имеет вид рис.4.10.
4.2.4. Обобщенный метод наименьших квадратов (ОМНК)
В ОМНК предполагаем, что ошибка уравнения представляет собой «цветной» шум т.е.
может быть представлена теоретической АР -моделью шума
. Тогда
уравнение, описывающее теоретическую модель объекта запишется в виде:
Уравнение модели будет иметь тот же вид:
Перемножим левую и правую части уравнения на
и получим уравнение
модели в следующем виде:
.
В предположении, что полином
известен, получим уравнение модели:
29
Уравнение теоретической модели объекта можно представить аналогичным образом:
Если сформировать критерий СКО из ошибок уравнения модели и применить МНК, то, в
силу того, что ошибка представляет собой «белый» шум, получаем несмещенные оценки
параметров модели, минимизирующие критерий, т.е. используем ОМНК - оцениватель:
Мы получили несмещенную ОМНК – оценку вектора параметров модели, на основе
фильтрованных входных и выходных сигналов объекта:
+…
+…
Где
,
- входной и выходной сигналы объекта, пропущенные через фильтр
.
Для определения коэффициентов модели шума запишем разностные уравнения модели
шума для разных моментов времени (k=1,2,…).
;
Соответствующее разностное уравнение запишется в виде:
,
Из которого следует:
,
,
……………………………………………………
,
……………………………………………………………………………………………………………….
.
Запишем уравнения в векторно-матричной форме:
;
30
=
Где
;
,
- вектор оцениваемых параметров.
Уравнение в векторно-матричной форме для модели шума:
.
Применение МНК для нахождения вектора оцениваемых параметров:
=
=
В итоге несмещенная оценка коэффициентов модели шума будет выглядеть следующим
образом:
Последовательность действий при определении ОМНК – оценок параметров объекта и
шума:
1). Получение смещенных оценок вектора параметров теоретической модели объекта по МНК;
2). Определение ошибки уравнения модели объекта («цветного» шума) из равенства для
моментов времени от 1 до N:
;
3).Формирование матрицы наблюдений E и вычисление вектора
по выше приведенной
формуле;
4). Получение фильтрованных сигналов
сигналов объекта через фильтр
, пропусканием входного и выходного
;
5).Вычисление несмещенной оценки вектора параметров модели по формуле ОМНК –
оценивателя;
6).Переход к п.2 и повторение шагов с 2 – 5 до тех пор, пока V2 уменьшается.
Лекция №8
31
4.2.5. Расширенный матричный метод (РММ)
Разработаны в настоящее время несколько расширенных матричных методов (I, II, III) в
зависимости от используемых в нем моделей шума. Рассмотрим III РММ, как наиболее общий.
Для этого используем АРСС – модель шума (III-ю модель шума).
, где
- «цветной» шум;
- «белый» шум;
C,D - полиномы
q1 – задержка на такт во временной области.
Выразим
:
=
Таким образом, «цветной» шум представлен приведенной выше расширенной моделью.
Запишем уравнение теоретической модели объекта с использованием расширенной модели:
.
Аналогично можем записать уравнение модели:
.
Записывая разностное уравнение для модели объекта:
и равенства для моментов времени k=1…N:
32
…………………………………………………………………………………………………………………………….
.
Для моментов времени от g+1 до N введем обозначения и запишем расширенное
уравнение модели объекта в векторно-матричной форме:
;
=
С учетом введенных обозначений уравнение в векторно- матричной форме запишется в виде:
.
Получим оценки параметров модели, минимизируя СКО для расширенной модели, для
чего запишем критерий:
=
33
.
Получим оценку расширенного вектора параметров:
При выводе оценки были сделаны следующие предположения:
- невырожденная матрица. Это предположение достигается
1.
за счет подачи на вход объекта постоянно возбуждающего сигнала порядка, не меньшего
g+p+s+r+1, т.е. количества оцениваемых параметров.
2. Порядки объекта и модели шума (g; p; s; r) – известны.
Последовательность действий при определении РММ – оценок параметров объекта и
шума:
1. Определение ошибки уравнения модели объекта («цветного» шума) из равенства для
моментов времени от 1 до N:
;
Заметим, что зная сигналы
невозможно оценить сигнал
,
и вычислив по приведенной формуле
,
в режиме работы с накоплением информации, т.е. в off – line
режиме. И таким образом РММ применяется только при работе в режиме on line, т.е. в режиме
рекуррентного оценивания.
Лекция №9
4.2.6.Метод инструментальной переменной (МИП)
Другой подход осуществлен в МИП. С исторической точки зрения, возникновение МИП
связано с желанием получить простой метод, гарантирующий несмещенные оценки, способный
заменить МНК и ММП в практических ситуациях. Он основан на отличном от МНК и ММП
критерии качества, представляющем собой корреляционный подход, заключающийся в том, что
в идеале ошибка уравнения для «хорошей» модели не должна зависеть от прошлых данных, т.е.
должна являться некоррелированной последовательностью («белым шумом»).
Однако при более близком рассмотрении становится очевидной тесная связь между двумя
критериями: минимизацией ошибки МНК и некоррелированностью ошибки МИП. Поэтому
будет справедливо рассматривать МИП как метод, родственный к МНК и его модификациям.
Для того чтобы оценки были несмещенными, необходимо добиться равенства нулю для
взаимно корреляционных функций входного и выходного сигналов процесса и ошибки
уравнения. Было предложено применить операцию «взвешивания», в результате которой
получаем взвешенный квадратичный критерий V:
34
,
где W – весовая квадратная матрица размерностью (N-g)*(N-g).
Существует несколько подходов для выбора весовой матрицы. Целью ее использования
является устранение коррелированности между соседними отсчетами сигнала
(«цветного»
шума).
В методе минимальных отклонений (ММО) весовая матрица выбирается в виде:
,
где R – симметричная ковариационная матрица ошибок уравнения объекта:
В методе минимальных отклонений требуется знание ошибки уравнения
,k=1,…,в
силу чего реализовать этот метод в чистом виде невозможно. Вместо этого метода используется
метод инструментальной переменной (МИП). В МИП весовая функция формируется в виде:
.
- матрица инструментальных переменных размерностью (N-g)*(g+p+1).
Сформируем критерий СКО с весовой матрицей:
=
.
Запишем теоретическую модель объекта в векторно-матричной форме:
Запишем уравнение модели объекта в векторно-матричной форме:
Используя обозначения:
;
,
Сформируем взвешенный критерий
=
35
=
Получаем оценку по методу инструментальной переменной (МИП):
Оценим, является ли оценка по МИП несмещенной, для чего проверим полученную
оценку на асимптотическую несмещенность, т.е. выполнение условия :
В качестве
- =
.
подставим выражение вектора, описывающего объект:
Т.е.
=
+
Для оценки несмещеннсти возьмем предел от левой и правой части равенства, в
результате чего получим:
.
Из требования несмещенности оценки вектора параметров модели правый предел должен
быть равен нулевому вектору, т.е. должны выполняться условия несмещенности:
- невырожденная матрица;
1.
2.
=
Выполнение условий 1 и 2 является требованием к сигналам, формирующим матрицу Z.
Из 1-го условия следует, что сигналы, формирующие матрицу Z , должны быть
коррелированны со входным и выходным сигналами объекта.
36
Из 2-го условия следует, что сигналы, формирующие матрицу Z, не должны быть
коррелированны с ошибкой объекта e(k).
Существует несколько вариантов выбора инструментальной переменной:
1. Сформируем сигнал инструментальной переменной, пропуская входной сигнал объекта
u(k) через фильтр:
u(k)
Фильтр
x(k)
В качестве фильтра можно использовать настраиваемую в процессе идентификации модель
объекта.
2. В качестве сигнала инструментальной переменной х принимается задержанный на
несколько тактов ( ) выходной сигнал объекта y, т.е.
3. В качестве сигнала инструментальной переменной х принимается задержанный на
несколько тактов ( ) входной сигнал объекта u.
4. Используется реализация входного и выходного сигналов объекта, полученная при
некоторой дополнительной записи входа/выхода, так называемая template function.
Выводы
Таким образом для получения несмещенности оценок используется 3 подхода:
1. Фильтрация входного и выходного сигналов в обобщенном МНК;
2. Расширение модели в 3-ем расширенном матричной методе;
3. Использование взвешивания, т.е. некоей весовой матрицы в критерии СКО в методе
инструментальной переменной.
Все методы рассмотрены в режиме с накоплением информации, т.е. в off-line режиме,
которые обладают следующими недостатками:
Необходимость запоминать большой объем информации;
Невозможность настройки модели по мере поступления новых отсчетов данных.
Лекция №10
37
4.3.
Методы оценивания в режиме on-line (динамические модели)
4.3.1. Рекуррентные алгоритмы идентификации
Рекуррентные алгоритмы (режим on line) строятся на базе рассмотренных методов; в
основе лежит матричное тождество :
,
которое доказывается умножением левой и правой частей равенства на
.
4.3.2. Рекуррентный метод наименьших квадратов
Во многих случаях полезно иметь в распоряжении модель системы, способную работать
в реальном масштабе времени. При этом модель не должна основываться на будущих
изменениях. Методы, позволяющие строить и уточнять модель объекта «на лету», в реальном
масштабе времени, получили название итерационных (рекуррентных).
Выведем рекуррентный алгоритм для МНК. Формула для оценки параметров имеет вид:
Оценка основана на (N-g) отсчетах.
Рекуррентные методы должны работать таким образом, чтобы улучшать оценки на
каждом шаге при получении новых данных (на N-ом шаге).
Поэтому запишем все наблюдения до (N-1) отсчета, выделив N-ый момент времени
особо:
, где
Обозначим
объекта в виде:
и представим оценку вектора параметров
-оценка на N – ом шаге;
-оценка на (N-1) – ом шаге.
38
Рекуррентное выражение для матрицы
получено с использованием матричного тождества
и записывается следующим образом:
.
Запишем формулу обращения матрицы
-матрицы моментов:
Найдем рекуррентную формулу для оценивания вектора параметров модели объекта, т.е. для
вектора :
,
Откуда, вынося из 3-х последних слагаемых значение:
Получим:
Окончательно,
-разница между значением выходного сигнала, измеренного в N-ый момент времени, и
предсказанным на основе предыдущих оценок параметров модели, называемая «ошибкой
предсказания».
39
Схема определения параметров модели с помощью рекуррентного МНК- оценивателя
приведена на рисунке 4.10.
Рис.4.10. Схема определения параметров модели с помощью рекуррентного МНК- оценивателя.
Рекуррентный МНК обладает такими же свойствами, как и обычный МНК, т.е. дает
асимптотически несмещенные оценки параметров модели объекта в случае, когда ошибка
уравнения является «белым» шумом.
4.3.3. Рекуррентный обобщенный метод наименьших квадратов
Алгоритм ОМНК:
Это оценка вектора параметров модели объекта.
Вектор параметров модели шума оценивается по формуле:
(
.
Рекуррентные соотношения для оценки вектора параметров модели
40
Формула для инвертирования матрицы
примет вид,
аналогичный формуле, используемой в рекуррентном МНК, а именно:
,
(4.3.1)
Рекуррентную оценку вектора параметров модели объекта можно получить так же, как и
в рекуррентном МНК, но только для фильтрованных значений сигналов входного и выходного
сигнала объекта:
.
(4.3.2)
Получим рекуррентную формулу для оценки вектора параметров модели шума
, для чего выделим данные для последнего N-го момента времени:
(
;
=
Запишем выражение для оценки вектора параметров шума для N-го и (N-1) –го шагов:
(
(
Выведем формулу обращения матрицы
.
:
=
=
41
.
Таким образом, получили оценку вектора параметров модели шума:
.
(4.3.3)
Окончательно для рекуррентного метода наименьших квадратов получаем:
(4.3.4)
Таким образом, рекуррентный алгоритм ОМНК сводится к выполнению расчетов:
(4.3.1),(4.3.2), (4.3.4) и (4.3.3). При этом первоначальное значение вектора параметров можно
принять равным нулевому вектору, а матриц P0 и Q0—диагональными матрицами с возможно
большими диагональными коэффициентами.
Лекция №11
Схема рекуррентного ОМНК – оценивателя(рис.4.11)
Представим ошибку уравнения объекта
в виде:
.
(k)
ТМШ
-
D’(q-1)
ТМО
e(k)
u(k)
y(k)
-1
b0+B(q )
-
A(q-1)
Фильтр
МО
ОМНК - оцениватель
Рис.4.11. Схема определения параметров модели с помощью рекуррентного ОМНК- оценивателя.
42
На рис.4.11.ТМШ – теоретическая модель шума;
ТМО – теоретическая модель объекта;
МЩ – модель объекта;
- ошибка предсказания значения ошибки уравнения на k-ом шаге по
параметрам, полученным на предыдущем (k-1) – ом шаге.
4.3.4. Рекуррентный расширенный матричный метод
Напомним, что одним из способов модификации МНК является расширение модели для
получения несмещенных оценок. Для описания процесса используются уравнения:
Они соответствуют 1-му, 2-му и 3-му расширенному матричному методу. Рассмотрим наиболее
общее третье уравнение, записав его в виде
-отсчеты в k-ый момент времени входного, выходного сигналов,
ошибки уравнения и формирующего ее «белого шума».
Уравнение модели запишется аналогичным образом:
,
Где
- приближение к сигналам
соответственно.
Таким образом,
.
Записав это уравнение для k=1,2,…,N и беря моменты времени g+1,…,N, можно записать
уравнение в векторной форме следующим образом:
43
;
Расширенная матрица наблюдений:
Тогда асимптотически несмещенные оценки вектора параметров модели будут рассчитываться
по формуле:
Для реализации данного метода необходимо знать сигналы
или их оценки
и
и
на каждом шаге итерации. Следовательно, этот метод может быть
применен только в рекуррентной форме:
векторы оценок соответствующих параметров модели на k-ом шаге.
Соответствующие рекуррентные соотношения выводятся так же, как и в рекуррентном
МНК и запишутся следующим образом:
44
Не рекомендуется с его помощью пытаться получить С-параметры модели шума. Дело в
том, что используемая при этом оценка сигнала получается в результате фильтрации
входных значений U и Y оценками АРСС- моделей
и
, что обуславливает
низкую точность С-параметров.
Схема определения параметров модели с помощью рекуррентного РММ- оценивателя
приведена на рис.4.12.
Рис.4.12 Схема определения параметров модели с помощью рекуррентного РММ- оценивателя
Лекция №12
4.3.5. Рекуррентный метод инструментальной переменной
Применим подход, используемый для рекуррентного МНК – оценивателя к оценке, используемой
в методе инструментальной переменной (МИП):
Рекуррентный МИП получается аналогично рекуррентному МНК. Запишем, применяя те же
обозначения:
45
Матрица Z(u,x) является матрицей инструментальной переменной, вместо у -выхода объекта в
ней используется сигнал х - инструментальная переменная. Матрица
(u,x) имеет такую же
размерность как и Ω N ( u , y ) .
Отсчёты инструментальной переменной могут быть получены несколькими способами:
задержанный входной сигнал;
задержанный выходной сигнал;
фильтрование сигнала некоторым звеном;
дополнительный сигнал.
Будем рассматривать случай, когда для формирования матрицы Z(u,x) используется фильтр. xN
- выход фильтра в N-ый момент времени, на вход подается сигнал uN. Рекуррентное выражение для
матрицы PN запишется следующим образом:
-
Таким образом, оценивание по рекуррентному МИП производится с помощью итеративной
схемы:
46
Напомним, что вектор
матрицы
, а вектор
содержит отсчеты
и
и является последней строкой
содержит отсчеты инструментальной переменной и является, подобно
, последней строкой матрицы Z ( u , y ) ;
ошибка предсказания.
Очевидно, что простой МИП не предусматривает возможность оценивания параметров шума
(согласно принятой выше АРСС-модели шума), что ухудшает функционирование метода в условии
действия на объект выходной аддитивной помехи.
Схема определения параметров модели с помощью рекуррентного МИП -оценивателя с расширением
представлена на рис. 4:13.
Рис. 4.13 Схема определения параметров модели с помощью рекуррентного МИП -оценивателя
5. Методы определения порядка модели объекта
Выбор структуры определяет весь последующий процесс идентификации. Ошибка на этом
этапе
сильно
снижает
продуктивность
дальнейшего исследования. Необходим признак,
позволяющий ранжировать структуры, и в качестве такового может выступать критерий качества
модели: декларируется, что структура соответствует объекту настолько, насколько адекватна ему модель,
построенная с использованием этой структуры. Задача идентификации сводится к построению всех
возможных моделей и выбору из них лучшей.
47
Все приведенные методы идентификации используют параметрическое представление модели в
виде дискретной передаточной функции. Такие модели позволяют получать линейные приближения
реальных объектов. Структурная идентификация в этом случае заключается в выборе порядка модели.
Если предполагаемый класс моделей определен, то проблема нахождения подходящего порядка
модели внутри этого класса значительно упрощается. С этой целью используются специальные тесты,
которые имеют ярко выраженное поведение около истинного порядка системы. В случае отсутствия
шумов ситуация ясна: для правильно определенного порядка модели функция потерь минимальна и
равна 0, выходы процесса и модели совпадают, матрица моментов (корреляций) имеет полный ранг. В
случае присутствия шумов эти индикаторы имеют менее выраженный вид: функция потерь минимальна,
выходы процесса и модели близки, остатки представляют собой «белый шум» и нет корреляции между
остатками и входным сигналом.
Общие рекомендации при определении структуры модели состоят в том, чтобы «начинать с простого» и
переходить к большему порядку только тогда, когда более простая модель не прошла теста на
подтверждение.
5.1.
Методы определения порядка на основе функций потерь
Метод наименьших квадратов основан на минимизации квадратичной функции потерь для
данного порядка. Идея использования функций потерь для определения параметров может быть
расширена на выбор порядка модели:
где
и
есть ошибки предсказания. Величины
порядка модели. Если порядок моделей процесса и шума определен верно, то
и
зависят от
- «белый шум», в
противном случае - «цветной шум» и необходимо решить, приемлема ли модель, которая генерирует
такую последовательность ошибок, так как «цветная» ошибка предсказания содержит еще неучтенную и
неиспользованную информацию о модели.
Типичное поведение функции потерь показано на рис. 5.1, кривые а и б имеют схожее поведение,
их различие в более плохом соотношении сигнал/шум для случая а; ситуация с соответствует случаю,
когда есть малозначащая величина (малый корень). Очевидно, что чем больше особенностей, присущих
объекту, учитывает модель, тем меньше становится значение функции потерь. Однако даже после того,
как структура модели «захватывает» область истинных параметров системы, функция потерь продолжает
убывать, так как происходит подстройка дополнительных, несущественных параметров под конкретные
особенности данной реализации шума. Этот эффект называется «сверхсогласием», и, чаще всего, такое
избыточное согласие с данными не представляет никакой ценности, поскольку модель предполагается
использовать с данными, включающими различные реализации шумов. Согласно принципу возможного
упрощения модели, необходимо выбрать модель меньшего порядка, анализируя поведение графика
функции потерь в фрагменте типа «колено». Для графиков на рисунке5.1.,порядок выбирается g=2
48
Рис. 5.1.Поведение функции потерь
Лекция №13
5.2.
Методы определения порядка по некоррелированности остатков
Будем рассматривать процесс, описываемый уравнением:
и соответствующую модель в виде
Из обсуждения различных схем оценивания, использующихся в РММ и МИП, становится ясным,
что при соответствующем моделировании процесса и шума,
- «белый шум». Если оценивание
закончилось удачно, модели - адекватны, тогда есть все основания ожидать, что
имеет свойства
близкие к «белому шуму». Следовательно, используемые алгоритмы оценивания имеют результатом
«белую» ошибку предсказания. Существует два основания искать «белые» ошибки предсказания:
- схемы оценивания будут давать несостоятельные оценки, если ошибки предсказания не будут
«белыми» (некоррелированными);
- «цветная» ошибка предсказания содержит информацию, которая не представлена в модели. Это
довольно вредно, так как приводит к тому, что часть информации не используется в модели.
Для определения, является ли ошибка предсказания «белой», может быть использована оценка
автокорреляционной функции сигнала или оценка коэффициента автокорреляции
49
Очевидно, если
- некоррелированная, «белая» последовательность, то
при
и
и
(при условии, что N ∞ и
дисперсия белого шума)
Из статистического анализа данных известно, что для сигнала типа нормальный «белый шум»
оценки автокорреляционной функции и коэффициента автокорреляции тоже распределены по
нормальному закону с дисперсиями:
и
, при
Известно также, что для нормального распределения случайной величины выполняется правило
«трех сигм»: значение случайной величины попадает в интервал
с
вероятностью ≈ 95%.
Эти свойства могут быть использованы для определения порядка. Вычисляя
для какого-
нибудь отрезка , например
для различных порядков
модели и наблюдая за поведением
можно определить, стремится ли к нулю (входит в интервал
) оценка коэффициента корреляции при
или нет.
Изображая зависимость на графиках, можно сделать вывод, насколько , близок к «белому шуму»
и, начиная с какого порядка модели, вхождение в доверительный интервал начинает соблюдаться. В
случае, если даже для высокого порядка модели коэффициент автокорреляции не стремится к нулю,
необходимо задуматься о качестве идентификации, качестве исходных данных или виде выбранной
модели.
Если же, начиная с какого-то порядка
, значение
входит в доверительный интервал, а
дальнейшее увеличение порядка лишь «сглаживает» график коэффициента автокорреляции, то будет
вполне правомочно принять значение
за возможный истинный порядок системы. На рис. 5.2
представлены графические зависимости, полученные для модели третьего порядка.
50
Рис.5.2. Графические зависимости для объекта 3-его порядка.
51
Данный тест проверки остатков на некоррелированность можно рассматривать как
расширение тестов, использующих функцию потерь.
Лекция №14
5.3.
Метод определения порядка по характеристикам матрицы
моментов
Метод использует некоторые свойства
Некоторые определения и свойства матриц
квадратных
матриц.
Напомним
Будем предполагать, что матрицы А – квадратная, вещественная, размером n*n.
Определитель матрицы А (det A) – это сумма всевозможных произведений n
элементов, взятых по одному из каждой строки и столбца матрицы со знаком
,
где инверсия – это нарушение порядка следования индексов элементов матрицы, входящих в
произведение, формирующее определитель. Так, например, для матрицы второго порядка:
След матрицы А (Trace A) – это сумма диагональных элементов матрицы.
Ранг матрицы (range A) (в Mathcad – rank A) равен числу линейно-независимых
строк (столбцов) матрицы.
Вектора
;
…
коэффициенты:
- линейно зависимы, если можно найти такие не равные нулю
, что
…
+
будет равна нулю. Это означает,
что любой вектор является линейной комбинацией остальных векторов.
Если столбцы матрицы линейно независимы, то ранг матрицы равен ее порядку, т.е.
rang A=n.
Матрица называется невырожденной, если ее определитель не равен нулю, т.е. det A
0, в противном случае, матрица А – вырожденная.
Матрица называется плохо обусловленной, если ее определитель близок к нулю.
Собственными значениями матрицы А называются такие значения скалярного
параметра , для которых выполняется равенство
Вектора
, для
которых
собственными векторами:
.
соблюдается приведенное выше равенство, называются
.
Если определитель матрицы слева равен нулю, т.е.
, то из
приведенного уравнения можно найти собственные значения и собственные вектора
матрицы.
52
Уравнение
называется характеристическим уравнением
матрицы А.
Подобными матрицами являются матрицы
и
, если существует невырожденная
матрица Т, для которой выполняется равенство:
. Преобразование подобия
сохраняет определитель, характеристическое уравнение, собственные значения и вектора,
след матрицы.
Любую квадратную матрицу преобразованием подобия можно привести к верхней
треугольной форме, на диагонали которой будут стоять собственные значения матрицы.
Если собственные значения различны, то матрица будет диагональной.
Матричное тождество
Пусть
- блочная матрица. Тогда имеет место тождество:
.
Тождество можно доказать умножением матрицы М справа на
матрицу:
, в результате которого получим:
=
.
Отсюда
, что доказывает
матричное тождество.
Некоторые
тесты
основаны
на
анализе
поведения
матрицы
моментов
(корреляций):
В случае, свободном от шумов, матрица
входной сигнал постоянно возбуждающий, то
- вырожденная при
имеет ранг равный n=2
. Если
+1 Однако
использование ранга для определения порядка часто затруднено наличием в системе шумов, тогда
матрица
не становится вырожденной при достижении истинного порядка, и ее строки не
становятся линейно зависимыми. Кроме того, как всегда при работе с матрицами, желательно
использовать некоторые скалярные функции (например, детерминант или след) для объяснения
происходящих явлений, тем более, что
не только квадратная матрица, но еще и симметричная.
Соответствующий метод определения порядка по наблюдению за детерминантом матрицы
имеет следующий алгоритм. Конструируется ряд матриц
, где
изменяется в пределах
53
, максимальный порядок определяется или из соображений предполагаемых свойств
объекта или из чисто вычислительных возможностей. Далее для каждого значения
детерминант соответствующей матрицы. В точке истинного порядка
после которого
. Если строить график
График зависимости
от
, то
ищется
принимает значение,
.
представлен на рис. 5.3. Порядок объекта в данном
случае равен 2.
Рис. 5.3. Поведение функции log(det( ) для =2
Таким образом, вычисление и построение детерминанта матрицы моментов может служить
ориентиром при исследовании величины истинного значения порядка системы.
Приведем матричное тождество, которое будет использоваться при дальнейшем изложении
материала:
Строгую математическую связь между тестами определения порядка при помощи матрицы
моментов и с помощью функции потерь установил Вудсайт. С этой целью рассматривались матрицы
наблюдений в зависимости от значения порядка. Запишем вектор параметров модели в следующей
форме ( -порядок модели, порядок числителя равен порядку знаменателя)
тогда матрицы наблюдений будут выглядеть так
54
Матрица моментов:
Введём обозначения:
Для вычисления определителя матрицы Н воспользуемся матричным тождеством,
приведенным ранее:
Запишем выражение для функции потерь для
разделив сумму квадратов ошибок уравнения
отсчетов в несколько измененном виде,
не на
, а на N , что не повлияет на
результат, но поможет исключить неопределенность, связанную с исследованиями при
изменяющемся значении порядка модели :
Следовательно,
≈N V )
Таким образом, показана тесная связь между тестом функции потерь и определением порядка
с помощью вычисления детерминанта матрицы моментов. Кроме того, следует отметить, что значение
55
определителя Q сильно зависит от уровня мощности (амплитуды) входного сигнала, поэтому более
правильно наблюдать за поведением отношения определителей
.
Q(u,y,g
)
2g+3
Некоторое отличие метода определения порядка на основе анализа матрицы моментов от
других методов, изложенных в данной работе, состоит в том, что он не использует алгоритма
параметрической идентификации для определения параметров модели в явной форме (в неявной
форме используется МНК). На рис. 5.4 приведены графики изменения логарифмов
и
.
Рис. 5.4. Поведение функций log(det( ) и
для =2
Лекция №15
56
5.4.
Метод определения порядка по анализу диаграммы полюсов и
нулей дискретной передаточной функции
Принцип метода структурной идентификации по анализу диаграммы полюсов и нулей визуальное наблюдение за поведением нулей и полюсов дискретной передаточной функции модели и
отбрасывание избыточной информации.
Рассмотрим перепараметризованные модели (модели, порядок которых превышает истинный), общая
формула для них имеет вид:
Приведем модель шума к авторегрессионной модели
частями:
и
, которая представима двумя
, где
представляет доминирующие полюса-нули
. Результирующее выражение
для модели имеет вид:
, где
Параметры полученной модели могут быть определены любым оценивателем, дающим
несмещенные оценки. Полином
несущественен, но, тем не менее, им нельзя
пренебрегать, так как это приведет к смещенным оценкам. Полученная модель
будет иметь общие множители для порядков, больших истинного. Этот эффект называется
сокращением полюсов/нулей первого рода и он обусловлен присутствием шума. Сокращение
полюсов/нулей второго рода вызывает то, что процесс более низкого порядка может быть представлен
бесконечным числом процессов с более высокими порядками, чему соответствует следующая
структура:
которая содержит бесконечное число элементов, так как
может быть произвольным.
Положение полюсов/нулей первого рода на плоскости корней не изменяется при изменении
порядка модели, тогда как положение полюсов/нулей второго рода может меняться произвольно.
Для обнаружения общих множителей
и
на комплексной плоскости
строится диаграмма полюсов/нулей. Из-за действия аддитивного шума не происходит точного
сокращения пар полюсов/нулей. Корни, соответствующие истинному порядку модели, присутствуют
57
и для более высоких порядков. На рис.5.4 представлен пример диаграммы нулей/полюсов для объекта
2-го порядка без помехи (крестиками представлены полюса, кружочками – нули).
Нуль
объекта
Полюс
объекта
Сокращающиеся
нуль и полюс
второго рода
Рис. 5.4. Пример диаграмм нулей/полюсов для объекта 2-го порядка
6. Представление систем в пространстве состояний
6.1.
Представление одномерных систем в пространстве состояний
Пример: Рассмотрим одномерную линейную систему (рис.6.1):
z
Рис.6.1. Структурная схема исследуемой системы
Уравнения связи:
Принимаем за переменные состояния выходы звеньев с их производными:
58
Для звена 1 запишем:
.
Для звена 2 :
.
Уравнение сумматора:
-
.
Преобразуем уравнения к форме Коши таким образом, чтобы в левой части были
записаны производные сигналов, выбранных за переменные состояния, а в правой – только
переменные состояния и входные сигналы. Тогда получим следующие уравнения:
1’.
2’.
3’.
Как видим, в правую часть уравнений, помимо переменных состояния и входного
сигнала входят сигналы -
, которые нужно выразить через переменные состояния и
входной сигнал. Проделав это, получим:
1”.
2”.
3”.
.
Определим вектор:
;
;
Запишем уравнения в векторно-матричной форме, используя введенный вектор
состояния , системную матрицу А и вектора и .
,
Заметим, что u - входной сигнал (скаляр),d – скаляр.
Мы получили описание в пространстве состояний, описывающее систему 3-го
порядка с переменными состояния, равными выходам звеньев и их производным. Систему
можно представить множеством описаний (моделей) в пространстве состояний, используя
различные переменные состояния. Примем за переменные состояния выходной сигнал
вместе с его производными, полученными из уравнения «вход» - «выход» системы, записав
59
передаточные функции разомкнутой и замкнутой передаточной функции системы,
представленной на рис. 6.1.
;
;
Из последнего равенства получим дифференциальное уравнение, описывающее
замкнутую систему:
.
Опишем систему в виде системы дифференциальных уравнений 1-го порядка (в
форме Коши):
Вводя обозначения:
,
, A=
,
Получим описание в пространстве состояний в виде:
.
Модель, полученная с использованием в качестве переменной состояния выходного
сигнала и его производных приводит к необходимости дифференцирования входного
сигнала, что ограничивает возможности ее использования, что легко понять из схемы
модели, приведенной на рис. 6.2.
2
10
-1,1
-11,1
-2,1
Рис.6.2. Модель с переменными состояния - выходом системы вместе с его производными
60
Лекция №16
Наблюдаемая модель в пространстве состояний
Построим наблюдаемую модель в общем виде, записав передаточную функцию
моделируемой системы в виде:
.
Заметим, что при использовании ранее построенной модели требуется многократное
дифференцирование входного сигнала, поскольку
.
Общая схема наблюдаемой модели имеет вид рис.6.3.
Рис. 6.3. Наблюдаемая модель
Запишем дифференциальные уравнения для наблюдаемой модели (рис.6.3).
………………..
-….-
Вводя обозначения:
61
,
,
A=
,
d=
,
,
Параметры наблюдаемой модели
….
можно найти из следующего матричного
равенства:
, из которого легко получить:
=
, или
решая систему уравнений:
=
=
………………………………….
.
Поясним получение наблюдаемой модели на примере моделирования системы 1-го
порядка (упругого звена).
, записав соответствующее дифференциальное уравнение:
.
В соответствии с дифференциальным уравнением построим схему моделирования с
дифференцированием входного сигнала (рис.6.4а):
Рис. 6.4а. Схема моделирования системы 1-го порядка (упругого звена)
62
Преобразуем схему, перенеся дифференцирующее звено через интегратор и получив
схему, представленную на рис.6.4б.
Рис.6.4б. Преобразованная схема моделирования системы 1-го порядка
Для получения наблюдаемой модели последовательно перенесем сумматор через узел
и через звено с передаточной функцией
и представим это соответствующими схемами
(рис.6.4в, 6.4г).
u
Рис.6.4в. Преобразованная схема моделирования системы 1-го порядка
n=1
Место для формулы.
Рис.6.4г. Наблюдаемая модель системы 1-го порядка
63
Схема одномерных систем в пространстве состояний
В соответствии с описанием в пространстве состояний в векторно-матричной форме
представим систему одномерной системы в виде рис. 6.5.
y
u
Рис.6.5. Схема одномерной системы в пространстве состояний
Найдем передаточную функцию модели, представленной на рис. 6.5, для чего
предварительно найдем передаточную функцию соединения с обратной связью:
,
Характеристическое уравнение системы
определяющие поведение системы:
имеет вид:
имеет корни,
.
Лекция №17
6.2.
Представление многомерных систем в пространстве состояний
Рассмотрим описание в пространстве состояний многомерных систем на примере
двух систем с прямыми и перекрестными обратными связями.
Многомерная система с прямыми связями
На рис.6.6 представлена структурная схема описываемой системы.
W11(p)
u1
y1
W21(p)
W12(p)
y2
u2
W22(p)
Рис. 6.6. Схема многомерной системы с перекрестными обратными связями
64
,
Представим звено
,
.
, используя наблюдаемую модель, для чего вычислим
коэффициенты модели, используя векторно-матричное равенство:
, откуда
=
=
=
Таким образом, схема моделирования звена
имеет вид:
3
-2
-1
-1
Представим звено
, используя наблюдаемую модель, для чего вычислим
коэффициенты модели, используя векторно-матричное равенство:
=
, откуда
=
Таким образом, схема моделирования звена
имеет вид:
65
2
-3
-2
Используя полученные модели, составим структурную схему многомерной системы
(рис.6.6).
3
-2
-1
-1
4
2
-3
-2
-0,2
Рис. 6.6. Наблюдаемая модель многомерной системы с перекрестными связями
66
Запишем дифференциальные уравнения, описывающую модель рис.6.6.
,
,
B=
C=
,
A=
, D=
,
.
Описание в пространстве состояний многомерной системы имеет вид:
.
Лекция №18
Многомерная система с перекрестными связями
На рис.6.7 представлена структурная схема моделируемой системы.
W11(p)
u1
y1
W12(p)
W21(p)
u2
y2
W22(p)
Рис. 6.7. Структурная схема многомерной системы с перекрестными связями
67
,
Представим звено
,
.,
, используя наблюдаемую модель, для чего вычислим
коэффициенты модели, используя векторно-матричное равенство:
=
, откуда
=
Вычислим коэффициенты наблюдаемой модели для звена
Вычислим коэффициенты наблюдаемой модели для звена
.
=
, откуда
=
Вычислим коэффициенты наблюдаемой модели для звена
.
=
=
, откуда
.
68
=
Используя рассчитанные коэффициенты, построим схему наблюдаемой модели (рис.6.8).
10
-8
-1
-0,2
1,5
-0,25
-0,5
-0,25
0,625
0,5
-0,5
-0,5
Рис. 6.8. Схема многомерной системы с перекрестными связями с использованием
наблюдаемой формы
69
Запишем систему дифференциальных уравнений и составим описание в пространстве
состояний.
-0,5
Пересчитаем
, выразив его через переменные состояния и входные сигналы:
.
Аналогичным образом, пересчитаем
:
.
Пересчитаем
:
-0,125
.
Пересчитаем
Составим вектор состояния и запишем матрицы для описания модели в пространстве
состояния:
70
,
,
,
A=
, B=
C=
, D=
.
Описание в пространстве состояний многомерной системы имеет вид:
.
Уравнение описывает в общем виде многомерные системы в пространстве состояний,
для моделирования которых существует блок в Matlab (Simulink).
Лекция №19
Схема многомерных систем в пространстве состояний
В соответствии с описанием в пространстве состояний в векторно-матричной форме
представим систему одномерной системы в виде рис. 6.9.
B
C
B
Рис.6.9. Схема одномерной системы в пространстве состояний
Найдем передаточную функцию многомерной модели с p входами, g выходами
порядка n, представленной на рис. 6.9:
,
.
Матрица передаточных функций имеет вид:
71
.
Передаточные функции от j – го выхода к i – му входу имеет вид:
Характеристическое уравнение системы имеет вид:
определяющие поведение системы:
имеет корни,
.
6.3. Представление многомерных дискретных систем в пространстве
состояний.
Рассмотрим один из способов представления, заключающийся в замене первой
производной – конечной разностью по возрастания, т.е.замене:
.
Таким образом, непрерывное представление в пространстве
состояний:
,
можно заменить дискретным:
, где матрицы
,
имеют вид:
,
,
.
7. Модели многомерных линейных динамических систем
Модели, используемые для описания многомерных линейных динамических систем,
могут быть получены из соответствующих одномерных путем перехода к матричным
уравнениям. При этом каждая модель характеризуется набором целых чисел, определяющих
структуру модели, которые называются структурными индексами. От этих индексов зависит
число оцениваемых параметров.
72
Рассмотрим основные классы моделей, используемые для описания многомерных
динамических систем, при этом с помощью некоторого преобразования всегда можно
перейти от одного класса моделей к другому. Будем считать, что исследуемая система имеет
p входов, g выходов и порядок n .
Используем следующие обозначения:
u (k )
p мерный входной вектор в момент времени
;
y (k )
g мерный выходной вектор в момент времени
k;
оператор сдвига ( y (k
z
z y (k )) .
1)
Модель в виде матрицы передаточных функций
7.1.
Многомерная динамическая система порядка n может быть описана с помощью
передаточной матрицы W(z) :
y(k) W(z)u(k)
где W( z )
[Wij ( z )] g p
Bij ( z )
Aij ( z )
,
g p
Aij ( z), Bij ( z) полиномы от z:
Aij ( z ) a0, ij
Bij ( z ) b0, ij
a1, ij z .... anij , ij z
b1, ij z .... bmij , ij z
nij
mij
, nij
n
, mij
n
,
Структурными индексами, характеризующими передаточную матрицу, являются
порядки числителя и знаменателя каждого элемента матрицы.
Это представление имеет следующие характеристики:
простая физическая интерпретация;
единственность представления;
конечное число параметров;
полное описание динамики (при нулевых начальных условиях);
нелинейность модели по параметрам (в силу дробной рациональности выражений для
передаточных функций).
Модель в виде импульсной переходной функции
7.2.
Одномерная динамическая система может быть представлена в следующем виде:
y (k )
w( j )u (k
j 0
j ) – во временной области;
73
w( j ) z j .
y(k ) W ( z )u (k ) – в операторной форме, где W ( z )
j 0
Многомерная динамическая система также может быть представлена следующим
бесконечным рядом:
y(k) [M 0
M1z -1
.]u(k)
где M 0 , M1, – g p матрицы, элементы которых называются марковскими параметрами
системы.
Характеристики модели:
единственность представления;
линейность по параметрам;
теоретически бесконечное число параметров.
7.3.
Представление системы в пространстве состояний
Дискретная система описывается с помощью уравнений состояния следующим
образом:
w(k 1) Fw (k ) Gu(k )
y(k ) Hw (k ) Ku(k )
где
w (k ) – n мерный вектор состояния;
F – n n системная матрица;
G – n p распределительная матрица;
H – g n выходная или измерительная матрица;
K – g p матрица прямой связи входа-выхода.
Набор
матриц
называется
реализацией.
неединственно, так, применив неособое преобразование подобия
x(k ) Tw (k ) ,
получим эквивалентную систему уравнений состояния:
x(k 1) TFT 1x(k )
y (k )
HT 1x(k )
TGu (k )
Ku (k )
Это
представление
74
или
x(k 1) Ax (k ) Bu(k )
y(k ) Cx(k ) Du(k )
Реализация, имеющая наименьшую размерность системной матрицы, называется
минимальной. Реализация является минимальной тогда и только тогда, когда система
наблюдаема и управляема.
От представления системы в пространстве состояний можно перейти к описанию в
виде марковских параметров и передаточной матрицы
W( z) C( zI A) 1 B D
Представление в пространстве состояний имеет следующие характеристики:
неединственность представления;
нелинейность по параметрам;
полное описание динамики системы;
удобство цифрового моделирования.
Лекция №20
7.4. Дробно-матричное представление
Дробно-матричное представление (ДПМ) является декомпозицией передаточной
матрицы W (z ) на две полиномиальные матрицы P (z ) и Q(z ) :
W( z) P 1 ( z)Q( z) ,
где
P (z ) – g q невырожденная полиномиальная матрица,
Q(z ) – g p полиномиальная матрица.
называется левым дробно-матричным представлением, его степень равна
степени определителя матрицы
P.
Используя левое ДМП, можно записать:
P( z )y (k ) Q( z )u(k ) ,
откуда видно, что левое ДМП является разностным уравнением относительно входного и
выходного векторов, т.е. левое ДМП можно считать обобщением моделей одномерных
систем в виде разностного уравнения, или ARMAX- моделей (авторегресии и скользящего
среднего) для многомерного случая.
ДМП имеет следующие характеристики:
линейность по параметрам;
75
конечное число параметров;
неединственность представления.
Из анализа различных типов моделей многомерных линейных динамических систем
видно, что наиболее удобным для идентификации является дробно-матричное
представление, недостатком которого является его неединственность. Этот недостаток
можно преодолеть, используя канонические формы, благодаря которым можно уменьшить
число оцениваемых параметров за счет появления структурных нулей и единиц.
7.5. Канонические формы представления многомерных
динамических систем
Главной проблемой, возникающей при идентификации многомерных линейных
динамических объектов, является неединственность представления. Для разрешения этой
проблемы было предложено использовать уникальные канонические формы. Существует
одна каноническая форма, которая кроме уникальности по параметрам является уникальной
по структуре, т.е. никакая другая каноническая форма такого же порядка не является
эквивалентной этой модели. Есть и канонические формы ДМП, определяемые особыми
требованиями к структуре полиномиальной матрицы P (z ) . Любое ДМП
может быть преобразовано в каноническую форму умножением на соответствующую
матрицу.
Таким образом, благодаря специальной структуре канонических форм, выполняется
требование единственности. Кроме того, в результате наложенных ограничений получаем
блочную структуру некоторых матриц для моделей в пространстве состояний, а в дробноматричном представлении подчиняются определенным требованиям степени полиномов.
Поэтому применение канонических форм, кроме решения проблемы неединственности
представления, позволяет уменьшить число оцениваемых параметров, так как в них
появляются структурные нули и единицы и эти формы имеют минимальный порядок .
Наблюдаемая каноническая модель в пространстве состояний.
Рассмотрим дискретную полностью наблюдаемую многомерную систему,
описываемую уравнениями в пространстве состояний, где представим матрицу H
следующим образом:
h1T
H
hT2
.
hTg
Сформируем последовательность векторов
76
и выберем вектора в следующем порядке:
h1, h 2 , , h g , FT h1, FT h 2 , , FT h g , (FT ) 2 h1, , (FT ) 2 h g .
T S
оставляя вектор (F ) h i
только в том случае, когда он независим от ранее выбранных
векторов.
T l
При этом, если вектор (F ) h i зависим от ранее выбранных векторов, то все вектора
(FT ) k h i при k
l будут также зависимыми, поэтому в i -ом ряду после l-ого вектора
остальные более не рассматриваются.
Процедура выбора заканчивается, когда найдены зависимые вектора во всех
строках.
После этого мы получим уникальный, благодаря условию выбора, набор независимых
векторов.
Пусть v1
v2 v g – числа векторов, выбранных из первой, второй, , g -ой строк.
Тогда полученным набором независимых векторов будет:
v 1
h1, FT h1, , (FT )v1 1h1, h 2 , FT h 2 , , (FT )v2 1h 2 , , h g , FT h g , , (FT ) g h g
что следует из условий выбора.
Из условия полной наблюдаемости системы следует, что v1
v2 v g
n , vi
являются инвариантами по отношению к изменению базиса и называются инвариантами
Кронекера.
Для того чтобы представить систему в базисе, построенном с помощью инвариантов
Кронекера построим следующую матрицу подобия:
TT
v 1
h1, FT h1, , (FT ) v1 1h1, , h g , FT h g , , (FT ) q h g .
Эта матрица содержит n линейно независимых векторов и, следовательно, является
невырожденной.
Применяя преобразование подобия x
Tw , получим новое описание системы:
x(k 1) Ax (k ) Bu(k )
y(k ) Cx(k ) Du(k )
Видно, что
.
77
A TFT 1 , B TG , C HT 1 , D K .
Матрица C будет полностью определяться инвариантами Кронекера и будет иметь
следующий вид:
n
1 0 0 0 0 0 0
С
1
1
g
1
(v1
(v1
1)
vg 1
1)
который позволяет описать многомерную систему с g выходами в виде системы из g
разностных уравнений относительно выходов системы, т.е. получить модель, являющуюся
расширением АРСС-модели на многомерный случай, к которой можно применить
разработанные для одномерных моделей алгоритмы идентификации: МНК,МИП и др.
Характеристики модели:
1. Наблюдаемая каноническая форма является единственной;
2. По сформированной матрице состояния C можно найти порядки подсистем, т.е.
порядки 1-ого, 2-го и т.д. разностных уравнений, описывающих подсистемы и
связывающие выходные сигналы подсистемы с другими выходами и переменными
состояния.
Лекция №21
8. Переходы от непрерывных моделей к дискретным и
обратно. P-Z и Z-P переходы.
В результате идентификации получаются дискретные модели или дискретные
передаточные функции, но наиболее традиционным является использование непрерывных
моделей и передаточных функций. Поэтому возникает задача перехода из непрерывной
области в дискретную и обратно.
8.1. Постановка задачи p-z и z-p преобразований
Задачу преобразований можно продемонстрировать схемой, представленной на рис.8.1.
u(t)
y(t)
W(p)
T
T
W*(
)
u*(t)
Рис.8.1. Схема сравнения непрерывных и дискретных моделей (при идеальном импульсном элементе)
78
Рис.8.2. Входные сигналы, действующие на модели
Задачей p-z и z-p преобразования является минимизация ошибки
. Точное
равенство возможно, если на вход одной и второй моделей будет действовать
последовательность
функций.
Связь между дискретной и непрерывной передаточной функциями
p-z и z-p переходы основаны на дискретном преобразовании Лапласа ( при наличии
идеального импульсного элемента), которое проводится в соответствии со следующими
этапами:
w(t)
Таким образом, переходы производятся по формулам:
Выходы моделей будут равны, если на входы обоих моделей поступают
противном случае, получим ошибку
функции. В
, не равную нулю.
8.1.1. p-z и z-p переходы при неидеальном импульсном элементе
Предполагаем, что формирователь импульсов имеет неидеальную некую форму
импульса
, которая определяется его весовой функцией.
u(t)
W(p)
y(t)
T
T
G(p)
W*(
)
u*(t)
)
Рис.8.3. Схема сравнения непрерывных и дискретных моделей (при неидеальном импульсном
элементе)
79
- передаточная функция формирователя импульсов;
.
Таким образом, при неидеальном импульсном элементе переходы производятся по
формулам:
Переходы при неидеальных импульсных элементах
Различаются в зависимости от формирователей импульсов, т.е. от форм импульсов.
Рассмотрим различные формы импульсов, которые можно просмотреть по виду
сигнала
(рис.8.4).
Рис.8.4. Сигналы на выходе импульсных элементов
0 – сигналы на выходе идеального импульсного элемента;
1,4 – сигналы на выходе неидеального импульсного элемента с прямоугольной
формой импульсов;
2 ,3- сигналы на выходе неидеального импульсного элемента с треугольной формой
импульсов;
Для этих приближений можно записать формулы аппроксимации функции u(t) на
временном диапазоне от nT до (n+1)T.
01-
80
234Поскольку использование аппроксимаций 2 и 4 требует знания сигнала на
последующем шаге, то будем рассматривать 1 и 3 аппроксимации.
Лекция №22
p-z и z-p переходы при формирователе импульсов нулевого порядка (1)
g(t)
1
t
T
В соответствии с приведенной выше формулой переходов при неидеальном
импульсном элементе получим:
.
Полиномы от
инвариантны по отношению к дискретному преобразованию
Лапласа, т.е. их можно выносить из под знака преобразования. Получим формулы переходов:
p-z и z-p переходы при формирователе импульсов первого порядка (3)
81
=
- реакция импульсного элемента, соответствующего 3-му варианту при подаче на вход
сигнала
.
.
Преобразуем по Лапласу:
82
Сведем в таблицу все варианты приближения сигнала
к сигналу
в
виду следующие соотношения:
1
1
1
p
2
4
p
Примеры переходов
В качестве примера примем инерционное звено с непрерывной передаточной
функцией:
.
Проведем переход, соответствующий приближению 1:
83
.
Воспользуемся формулами разложения для определения непрерывных весовых
функций, которые имеют вид:
Для нашего примера n=1,
,
.
.
,
=
После преобразования получим
=
;
.
Проведем переход, соответствующий приближению 3:
В соответствии с выведенными формулами запишем выражения для переходов от
непрерывных в дискретным моделям и обратно:
84
.
Для
определения
найдем
разложение
на
простые
дроби
методом
неопределенных коэффициентов.
=
.
Приравнивая коэффициенты полиномов числителей, получим:
,
,
.
Таким образом, весовая функция имеет вид:
.
;
И, окончательно,
+
.
Некоторые подходы p – z и z – p – преобразований
1.
. Учитывая разложение экспоненты в ряд:
Используем линейную часть разложения, при этом получим:
2.
Билинейное преобразование:
откуда
.
Примеры
Для инерционного звена с передаточной функцией
получим:
85
1.
2.
3.
Следует отметить, что коэффициент усиления дискретной модели равен k,т.е.
коэффициенту усиления непрерывной модели, а точность дискретных моделей
обеспечивается при малых T.
Лекция №23
9. Традиционные методы идентификации
9.1. Метод идентификации, основанный на уравнении ВинераХопфа
Уравнение Винера-Хопфа связывает корреляционные функции входного/выходного
сигнала объекта с его весовой функцией. Для его вывода запишем выражение взаимной
корреляционной функцией входного/выходного сигнала (рис.8.1) усреднением по времени:
(
x
W(p)
y
Рис.9.1 Идентифицируемый объект
Используя уравнение свертки, запишем:
.
При условии, то сигнал x(t) начинает действовать с нулевого момента времени, т.е. при t<0
он равен 0, верхний предел можно заменить бесконечным:
Подставляя последнее уравнение в первое, получим:
86
.
Таким образом, получаем:
(
. Заменяя
на ,
получим уравнение Винера-Хопфа:
(
.
Уравнение Винера-Хопфа используется для идентификации при подаче на вход объекта
случайных сигналов. При этом можно рассмотреть два случая.
1. На вход объекта действует сигнал типа «белый шум», для которого
В этом случае
(
.
, т.е. весовая функция равна взаимной корреляционной
функции.
Варианты использования модели
Использование интеграла свертки;
Разложение по временным функциям (экспонентам, функциям Лаггера), для которых
известно преобразование Лапласа.
Переход к спектральной характеристике (комплексному коэффициенту усиления).
2. На вход объекта действует «цветной шум». Для этого случая предлагается находить
ординаты весовой функции объекта из системы линейных уравнений, для получения
которых ограничим бесконечный предел в уравнении Винера-Хопфа временем
делим полученный временной отрезок на n отрезков длиной .
Получим систему уравнений:
Решая систему уравнений, получаем оценку ординат весовой функции.
и
87
Из-за сглаживающего эффекта интеграла в правой части уравнения Винера-Хопфа
наличие ошибок измерения в левой части (даже довольно незначительные) дает большую
погрешность при определении весовой функции. Решение интегрального уравнения ВинераХопфа относительно весовой функции является некорректно поставленной задачей, а само
уравнение относится к уравнениям Фредгольма первого рода, для решения которого было
предложено использовать сглаживающий функционал. Применительно к непрерывному
уравнению он имеет вид:
- коэффициент регуляризации. Наибольшая сложность при использовании сглаживающего
функционала – найти значение . Малое значение не сглаживает весовую функцию, а
большое – может выровнять весовую функцию до постоянной функции, имеющей нулевую
производную. Заметим, что уравнение Винера-Хопфа использовалось как при пассивной, так
и при активной идентификации, в том числе при подаче на вход объекта псевдо - случайных
сигналов.
9.2.
Псевдо - случайные сигналы и их характеристики
Сигналы типа «белый шум» широко используются при идентификации. Но их трудно
генерировать и записывать их реализации для последующей идентификации. Псевдо –
случайные сигналы (ПСС) обладают характеристиками, похожими на характеристики
«белого» шума, но легко реализуются аппаратным путем и, фактически, являются
детерминированными.
Математический аппарат ля генерирования ПСС – последовательности максимальной
длины, использующие дискретное преобразование Лапласа. Псевдо –случайные сигналы
принимают фиксированное число значений (р уровней). При р=2 имеет место псевдо –
случайный двоичный сигнал (ПСДС), принимающий 2 значения: 0 и1.В основе
генерирования ПСДС лежит логическая функция исключающее «или», или «сложение по
модулю 2» (
x
1
1
y
1
1
2), которое
x
1
1
2
y
задается таблицей истинности:
Генерирование псевдослучайных двоичных сигналов производится
в соответствии с разностным уравнением подобно генерированию
незатухающих гармонических сигналов в соответствии с
дифференциальным уравнением (при =0):
.
При =0 получаем незатухающие гармонические колебания, соответствующие
характеристическому уравнению:
.
88
В основе генерирования псевдослучайных сигналов лежат характеристические
уравнения от z, позволяющие генерировать сигналы с разными периодами повторений
последовательности (N):
Характеристическое
уравнение
Порядок k
Период N
2
3
4
5
6
Продемонстрируем генерирование сигнала на основе генерирующего полинома
третьего порядка, для чего запишем соответствующее ему разностное уравнение:
Для выделения сигнала
результате которого получим:
сложим уравнение по модулю 2 с уравнением
и разностное уравнение :
.
Генерирование сигнала проводится аппаратным путем с помощью соединения
сдвиговых регистров:
Продемонстрируем полученную с помощью сдвиговых регистров
последовательность, приняв за исходное начальное значение (1 1 1). Изобразим
полученную последовательность графически:
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
,в
89
Этот сигнал неудобен для идентификации, т.к. имеет ненулевое среднее значение.
При замене «1» на «-1», а «0» на «+1» с учетом неединичной амплитуды получаем xинв:
Автокорреляционная функция псевдослучайного сигнала имеет вид:
При условии, что N – большое число автокорреляционная функция похожа на
автокорреляционную функцию белого шума, спектральная характеристика которого имеет
вид:
,т.е. представляет собой квантованный сигнал с частотой
квантования
, представленный на рисунке:
Лекция №24
Многоуровневые псевдо – случайные сигналы
P – число уровней псевдо – случайного сигнала, которое принимает нечетные
значения (3,5,7 и т.д.). В основе генерирования ПСС лежит сложение по модулю p, которое
может быть получено из обычного сложения возвратом в поле (0,1,2,…p-1). При p=3
получаем псевдо - случайный троичный сигнал (ПСТС).
Приведем некоторые генерирующие полиномы:
Генерирующий полином
Порядок k
Период N
90
4
5
6
7
В основе генерирования ПСТС лежит логическая функция «сложение по модулю 3»
(
3),
которое задается таблицей истинности:
x
y
1
2
1
2
1
2
1
1
1
2
2
2
x
1
2
2
2
1
3
y
Продемонстрируем генерирование сигнала на основе
генерирующего полинома четвертого порядка, для чего запишем
соответствующее ему разностное уравнение:
Для выделения сигнала
уравнением
сложим уравнение по модулю 3 с
, в результате которого получим:
и разностное уравнение :
.
Генерирование сигнала проводится аппаратным путем с помощью соединения
сдвиговых регистров:
Продемонстрируем полученную с помощью сдвиговых регистров
последовательность, приняв за исходное начальное значение (1 1 1 1).
Через 80 тактов последовательность повторяется. Среднее значение такого сигнала не
равно 0, поэтому применяется инвертированный сигнал, при котором «2»- заменяется «-1», а
при изменении уровня значением а. Изобразим полученную последовательность графически:
1
2
1
2
1
1
1
1
2
1
2
1
1
1
1
2
1
2
1
1
1
1
2
1
91
2
1
2
2
2
2
1
1
2
1
2
2
2
2
1
1
2
1
2
2
2
2
1
1
2
1
2
2
Заметим, что на периоде N=80 на 27 тактах сигнал принимает значение +а, на 27
тактах - -а и на 26 тактах – 0.
В общем случае при
ненулевые значения
=
число тактов, на которых сигнал принимает
, а нулевые -
=
.
Частота повторений различных уровней равна:
,
- для p- уровневого сигнала.
,
Выводы
Спектральные и корреляционные функции многоуровневых ПСС похожи на аналогичные
характеристики ПСДС, но эти сигналы имеют следующие преимущества:
1. Многоуровневые инвертированные сигналы не дают смещения рабочей точки, т.к. их
математическое ожидание равно 0;
2. При одинаковых порядках генерирующих полиномов многоуровневые сигналы имеют
большие периоды, т.е. их характеристики ближе к характеристикам «белого шума».
ЛИТЕРАТУРА
1. Толчеев В.О., Ягодкина Т.В., Методика идентификации линейных одномерных
динамических систем, М.: Изд-во МЭИ, 1997
2. Льюнг Л., Идентификация систем. Теория для пользователя. М.: Наука, 1991
3. Штейнберг Ш.Е. Идентификация в системах управления. М.: Энергоатомиздат, 1987
4. Эйкхофф П., Основы идентификации систем управления. М.: Мир, 1975
92