Справочник от Автор24
Поделись лекцией за скидку на Автор24

Моделирование систем

  • ⌛ 2020 год
  • 👀 737 просмотров
  • 📌 720 загрузок
  • 🏢️ Федеральное государственное автономное образовательное учреждение высшего образования «Сибирский федеральный университет»
Выбери формат для чтения
Загружаем конспект в формате pdf
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Конспект лекции по дисциплине «Моделирование систем» pdf
Министерство науки и высшего образования РФ Федеральное государственное автономное образовательное учреждение высшего образования «Сибирский федеральный университет» КУРС ЛЕКЦИЙ Моделирование систем Укрупненная группа 270000 «Управление в технических системах», 150000 «Машиностроение» Направление 27.04.04 «Управление в технических системах», .03.04 «Автоматизация технологических процессов и производств» Институт космических и информационных технологий Кафедра систем автоматики, автоматизированного управления и проектирования Красноярск 2020 1 ОГЛАВЛЕНИЕ Предисловие ..................................................................................................................................... 3 РАЗДЕЛ 1 МОДЕЛИРОВАНИЕ КАК ОСНОВНОЙ МЕТОД ИССЛЕДОВАНИЯ И ПРОЕКТИРОВАНИЯ СИСТЕМ .................................. 4 Лекция 1 Введение в моделирование ....................................................................... 4 Лекция 2 Общие сведения о математическом моделировании ........ 11 Лекция 3 Основные подходы к построению математических моделей систем ............................................................................................................................... 19 Лекция 4 Идентификация математических моделей................................. 29 Лекция 5 Математическое моделирование и информационные технологии ................................................................................................................................... 39 РАЗДЕЛ 2 МЕТОДЫ МОДЕЛИРОВАНИЯ СИСТЕМ НА ОСНОВЕ ТИПОВЫХ МАТЕМАТИЧЕСКИХ СХЕМ .......................................................... 54 Лекция 6 Моделирование с помощью абстрактных автоматов ....... 54 Лекция 7 Статистические методы моделирования ..................................... 69 Лекция 8 Основы теории массового обслуживания .................................. 80 Лекция 9 Моделирование игровых ситуаций .................................................. 99 Лекция 10 Нейросетевые модели ........................................................................... 108 Лекция 11 Моделирование в условиях нечетко заданной информации ............................................................................................................................................. 127 Лекция 12 Сети Петри ..................................................................................................... 145 Литература .................................................................................................................................... 156 ПРИЛОЖЕНИЕ 1 Интерполяционные и статистические методы обработки данных ......................................................................................................................... 158 ПРИЛОЖЕНИЕ 2 Организация вычислительного эксперимента... 166 ПРИЛОЖЕНИЕ 3 Основные понятия теории вероятностей ............... 175 2 Предисловие Повышение технико-экономических показателей производства во многом определяется эффективностью используемых автоматизированных систем управления технологическими процессами, основой построения которых являются математические модели, описывающие технологические процессы и принципы функционирования автоматизированных систем управления. Внедрение новых информационных технологий в процесс разработки автоматизированных систем способствует дальнейшему развитию математического моделирования. Увеличивается многообразие используемых моделей, самостоятельной значение приобретают математические методы решения вычислительных задач. Совершенствуется и процесс моделирования с использованием не только больших ЭВМ, но и персональной техники, объединенной в информационно-вычислительные системы. Возникают новые перспективные направления в теории математического моделирования, ориентированные на анализ и синтез сложных систем. Математическое моделирование стало средством, позволяющим без капитальных затрат решать проблемы построения сложных систем и управления технологическими процессами. Причем, если раньше эти вопросы рассматривались преимущественно специалистами-учеными, занимающимися теоретическими и экспериментальными исследованиями, то в настоящее время методы математического моделирования становятся важным инструментом различных видов инженерной деятельности. Предлагаемый курс лекций подготовлен на основе опыта чтения лекций для студентов, обучающихся по программам подготовки бакалавров по направлениям 27.04.04 «Управление в технических системах» и 15.03.04 «Автоматизация технологических процессов и производств» на кафедре «Системы автоматики, автоматизированного управления и проектирования» Сибирского федерального университета. Данный курс лекций предназначен для изучения теоретического материала, предусмотренного рабочей программой дисциплины ''Моделирование систем''. Он состоит из двух разделов и включает в себя двенадцать лекций. Курс также снабжен тремя приложениями, которые содержат краткий справочный материал, касающийся основ организации вычислительного эксперимента и некоторых разделов математики. Каждый раздел снабжен контрольными вопросами и заданиями для закрепления изученного материала и самопроверки. 3 РАЗДЕЛ 1. МОДЕЛИРОВАНИЕ КАК ОСНОВНОЙ МЕТОД ИССЛЕДОВАНИЯ И ПРОЕКТИРОВАНИЯ СИСТЕМ Лекция 1. Введение в моделирование  Объект моделирования  Основные понятия и определения  Место и роль математического моделирования в задачах исследования, проектирования и оптимизации технологических систем  Использование моделирования при исследовании и проектировании АСУ  Классификация процессов как объектов моделирования и перспективы развития моделирования  Постановка задачи моделирования в общем виде Объект моделирования Все, на что направлена человеческая деятельность, называется объектом. Выработка методологии управления объектами направлена на упорядочение получения и обработки информации об объектах, которые существуют для нашего сознания и взаимодействуют между собой и внешней средой. Научно-техническое развитие в любой области обычно идет по пути наблюдения и эксперимент  теоретические исследования  организация производственных процессов. Такой подход позволяет получить целостное представление об объекте управления и выработать рекомендации по управлению технологической системой, позволяющие оптимизировать технологический процесс. Основные понятия и определения В наиболее общем смысле теория математического моделирования и оптимизации представляет собой совокупность фундаментальных математических результатов и численных методов, ориентированных на нахождение и идентификацию наилучших вариантов из множества альтернатив и позволяющих избежать полного перебора и оценки возможных вариантов. Например, необходимо построить цех по производству никеля. Это может быть реализовано путем строительства как электропечей различной установленной мощности, так и строительством ПМВ также различной мощности. Задача заключается в выборе еще на стадии проектирования наилучшего варианта из возможных. Процесс оптимизации лежит в основе всей инженерной деятельности, так как позволяет, с одной стороны, проектировать новые более 4 эффективные и менее дорогостоящие технические системы и, с другой стороны, разрабатывать методы повышения качества функционирования существующих систем. В теории моделирования нашли широкое применение следующие основные понятия. Гипотеза - определенное предсказание, основывающееся на небольшом количестве опытных данных, наблюдений. Так, небольшое количество экспериментальных данных, полученных на промышленных руднометрических печах, позволяет предположить возможность использования напряженности магнитного поля (Нм) наведенного с наружной стороны электропечи, для контроля уровня расплавов в электропечи. При формулировании и проверке правильности гипотез большое значение в качестве метода суждения имеет аналогия. Аналoгия - суждение о каком-либо частном сходстве двух объектов. Причем такое сходство может быть существенным и несущественным. В частности, в качестве аналогии можно рассмотреть дуговые электропечи для плавки черных металлов и электрокорунда. Данные печи обладают тем частным свойством, что для плавления шихты в них используется электрическая дуга трехфазного тока. Гипотезы и аналогии должны обладать наглядностью или сводиться к удобным для исследования логическим схемам или моделям. Строго говоря, моделью называется записанная на определенном языке (естественном, математическом и др.) совокупность наших знаний, представлений и гипотез о соответствующем объекте или явлении. Соответственно, моделирование - это замещение одного объекта другим с целью получения информации о важнейших свойствах объекта-оригинала с помощью объектамодели. В качестве модели можно, например рассмотреть "холодную" модель электролизера, в которой вместо расплава электролита используют раствор электролита. Такие модели с успехом используют для исследования электрических режимов электролизеров, для исследования токораспределения в ванне электролизера или руднотермической электропечи. Адекватность модели объекту есть показатель того, что результаты моделирования подтверждаются и могут служить основой для прогнозирования процессов, протекающих в исследуемых объектах. Место и роль математического моделирования в задачах исследования, проектирования и оптимизации систем Для исследования и оптимизации существующих и проектирования вновь разрабатываемых технологических систем их необходимо представить в виде, удобном для исследования. С этой целью вводят некоторые допущения (предположения), упрощающие описание данной технической системы. Наиболее часто такую систему (или ее часть), называемую системой автоматического управления, можно представить состоящей из 5 трех частей: цели управления, объекта управления (ОУ) и устройства управления (УУ) (рис. 1.1.). Рисунок 1.1. Структурная схема системы автоматического автоматического управления. Под ОУ применительно к инженерным задачам подразумевается техническое устройство, на выходе которого надлежит управлять процессом V(t), УУ обобщает все входящие в контур СУ элементы, используемые для организации процесса управления. На вход системы управления подается задающее воздействие x(t), определяющее желаемый характер управляемого процесса y(t), УУ на основании информации о процессах x(t) и y(t), а в ряде случаев и на основании данных о возмущениях (t), рассчитывает управляющее воздействие U(t), с помощью которого процесс V(t) ставится в соответствие с сигналом x(t) в рамках некоторого формального описания этого соответствия. Для решения большинства задач анализа и синтеза СУ необходимо иметь математическую модель ОУ. Построение математической модели заключается в установлении ряда соотношений, позволяющих при каждых входных воздействиях и начальных состояниях найти сигнал на выходе ОУ. Обычно модель получают как математическую формулировку физических законов, которым подчинена работа ОУ. В общем случае ОУ является многомерным и имеет l управляемых процессов V1(t), V2(t),… Vl(t), m входных управляющих воздействий U1(t), U2(t), …, Um(t), k внешних возмущений 1(t), 2(t), …, k(t) (рисунок 1.2.). 6 1 2 … k U1(t) U2(t) Um(t) V1(t) V2(t) Vl(t) СУ X Y (t) (t) Рис.1.2. Структурная схема управления объектом моделирования Математическая запись физических законов, определяющих свойства непрерывного объекта, в большинстве случаев приводит к системе нелинейных дифференциальных уравнений, связывающих входные и выходные процессы и их производные: i [V1 (t ),V1(1) (t ), ...,V1(l ) (t ),...,Vl ( n ) ;U1 ,U1(1) ,...,U1( n ) ,U 2 (t ),...,U 2( n ) ,U m (t ),...,U m( n ) , 1 , 1(1) ,..., 1( n ) , 2 (t ),..., (2n ) , m (t ),..., (mn ) )  0 или i [Vi (t ),Ui (t ), i (t )]  0, (1.1) i  1,2,..., l. При l = 1 объект называют одномерным. Если функции i являются линейными относительно управляемых и управляющих процессов и их производных, то объект называют линейным по управлению, аналогично линейным по возмущению. Математическая модель (1.1) в современной теории оптимальных и адаптивных систем получила ограниченное распространение. Гораздо чаще дифференциальные уравнения (1.1), из которых i-ое имеет порядок ni, (n  n  ni ) представляют в виде системы из n дифференциальных уравнений i 1 первого порядка, каждое из которых разрешено относительно производной. Использование моделирования при исследовании и проектировании АСУ Одна из проблем современной науки и техники  разработка и внедрение в практику проектирования новейших методов исследования характеристик АСУ различных уровней. При проектировании обеспечивающих и функциональных подсистем таких АСУ возникают многочисленные задачи, требующие оценки количественных и качественных закономерностей процессов функционирования систем, проведения структурного, алгоритмического и параметрического их синтеза. Ограниченность возможностей экспериментального исследования больших систем делает актуальной задачу разработки методики их модели7 рования, которая бы позволила в соответствующей форме представить процессы функционирования систем, описать протекание этих процессов с помощью математической модели, получить результаты экспериментов с моделями по оценке характеристик исследуемого объекта, Независимо от того, какие подсистемы составляют АСУ, при проектировании каждой из них необходимо выполнить внешнее проектирование (макропроектирование) и внутреннее проектирование (микропроектирование). На стадии макропроектирования должна быть разработана обобщенная модель процесса функционирования АСУ, позволяющая разработчику получить ответы об эффективности различных стратегий управления объектом при его взаимодействии с внешней средой, Например, управление энергетическим режимом электропечи может быть осуществлено с помощью изменения подводимого к электродам напряжения. На стадии микропроектирования разрабатывают модели с целью создания эффективных обеспечивающих подсистем АСУ. Выбор метода моделирования и необходимая детализация моделей существенно зависят от этапа разработки АСУ. На этапах разработки технического и рабочего проектов АСУ модели отдельных подсистем детализируются и моделирование служит для решения конкретных задач проектирования. Целевое назначение моделирования на этапе внедрения и эксплуатации АСУ - это проигрывание возможных ситуаций для принятия обоснованных и перспективных решений по управлению объектом. Моделирование также широко применяют при обучении и тренировке технологического персонала АСУ. В этом случае моделирование носит характер деловых игр. Классификация процессов как объектов моделирования и перспективы развития моделирования Процессы для управления которыми создаются АСУ можно подразделить на: непрерывные, которые характеризуются непрерывным режимом 1) работы (электролиз алюминия, электроплавка никелево-медного агломерата в РТП, спекание нефелинового концентрата); 2) полунепрерывные (непрерывно-дискретные), которые характеризуются полунепрерывным режимом работы. Например, при плавке оловянных концентратов в РТП происходит непрерывная загрузка шихты в течение определенного промежутка времени и затем выпуск продуктов плавки; 3) периодические, которые характеризуются дискретным режимом работы, например, периодической загрузкой материалов в печь, проведением технологического процесса и выгрузкой полученного продукта (например, выращивание монокристаллов кремния). 8 В соответствии с приведенной классификацией процессов АСУ подразделяются на АСУ непрерывными, полунепрерывными и периодическими процессами. С точки зрения автоматизации наибольшую сложность представляет автоматизация периодических процессов. Для реализации АСУ необходимо промоделировать описание данного технологического процесса. На стадии микропроектирования разрабатывают модели обеспечивающих подсистем АСУ. Выбор метода моделирования и необходимая детализация моделей существенно зависят от этапа разработки АСУ. На этапах разработки технического и рабочего проектов АСУ детализируются модели отдельных подсистем и решаются частные задачи проектирования. Целевое назначение моделирования на этапе внедрения и эксплуатации АСУ - это проигрывание возможных ситуаций для принятия обоснованных и перспективных решений по управлению объектом. Моделирование также широко применяют при обучении и тренировке технологического персонала АСУ. В этом случае моделирование носит характер деловых игр. Общие правила построения и способы реализации моделей Как уже отмечалось выше, процесс моделирования складывается из следующих этапов: 1) построение концептуальной модели системы и ее формализация; 2) алгоритмизация модели системы и ее машинная реализация; 3) получение результатов машинного моделирования и их интерпретация. На первом этапе моделирования формулируется модель, строится ее формальная схема и решается вопрос об эффективности и целесообразности моделирования системы на ЭВМ или АВМ. На втором этапе математическая модель воплощается в машинную, т. е. решается проблема алгоритмизации модели, ее рационального разбиения на блоки и организация взаимодействия между ними, а также задача получения необходимой точности и достоверности результатов при проведении машинных экспериментов. На третьем этапе ЭВМ используется для имитации процесса функционирования системы, сбора необходимой информации, ее статистической обработки и интерпретации результатов моделирования. На всех этапах моделирования переход от описания к машинной модели строится на эвристических принципах, охватывающих как механизм принятия решений, так и проверку соответствия принятого решения действительности. Эвристические принципы моделирования можно условно разделить на совокупность основных правил построения моделей систем и способов их машинной реализации. Причем правила определяют общие свойства, которыми должна обладать построенная машинная модель, а способы реализации дают конкретные приемы получения нужных свойств модели системы. Иерархическая структура взаимосвязи эвристических правил построения и практических способов реализации машинных моделей может быть условно представлена в виде схемы (рис. 5.2), которая задает цепь неформальных действий выполняемых при моделировании систем. 9 Рис. 5.2 Схема взаимосвязи правил построения и способов реализации машинных моделей На рисунке приняты следующие обозначения. Правила: 1 – соответствие точности и сложности модели; 2 – соразмерность погрешностей моделирования и описания; 3 – блочное представление модели; 4 – специализация моделей для конкретных условий; 5 – достаточность набора элементов модели; 6 – наглядность модели для исследователя и пользователя. Способы: 7 – минимизация обмена информацией между блоками; 8 – упрощение модели по критерию интерпретации (под критерием интерпретации или оценки понимается любой количественный показатель, по которому можно судить о результатах моделирования системы); 9 – удаление блоков с модификацией критерия; 10 – замена зависимых воздействий независимыми; 11 – проверка точности на условных моделях; 12 – проверка точности результатов по сложности модели; 13 – выбор эквивалента входных блоков; 14 – сравнение моделей различной сложности; 15 – параллельное моделирование вариантов системы. На схеме сплошными линиями показаны обязательные связи общих правил и способов с частными, пунктирными – возможные (необязательные) связи. Правило соответствия точности и сложности модели (правило 1) характеризует компромисс между ожидаемой точностью и достоверностью результатов моделирования и сложностью модели системы с точки зрения ее машинной реализации. Правило соразмерности погрешностей моделирования системы и ее описания (правило 2) представляет собой по сути «баланс точностей», определяемый взаимным соответствием точностей блоков моде10 ли; соответствием между систематической погрешностью моделирования на ЭВМ и погрешностью исходных данных, возникающей вследствие их неопределенности, а также случайной погрешностью результатов моделирования. Следует помнить, что сложность модели системы характеризуется затратами времени на ее построение и машинную реализацию, а также объемом памяти конкретной ЭВМ, используемой для моделирования. Сравнительный анализ сложности моделей осуществляется путем параллельного моделирования конкурирующих вариантов исследуемой системы с оценкой разностей соответствующих показателей качества функционирования (способ 15). Практическая реализация правил 1 и 2 возможна лишь при наличии гибкой системы, обеспечивающей достаточное разнообразие вариантов модели, т. е. при выполнении правила достаточности набора элементов модели (правило 5) – типовых процедур в математическом и программном обеспечении моделирования. Построение моделей во многом является творческой задачей, решаемой человеком, т. е. при ее решении должно быть соблюдено правило наглядности модели для исследователя (правило 6), выполнение которого дает возможность исследователю и пользователю (заказчику) оперировать с привычными представлениями об объекте моделирования, что позволяет избежать многих ошибок и упрощает трактовку полученных результатов. При переходе от описания системы к ее машинной модели наиболее рационально придерживаться правила блочного представления модели (правило 3), в соответствии с которым надо находить блоки, удобные для автономного моделирования (на ЭВМ, АВМ), и блоки, допускающие исследование натурными методами. Это правило позволяет оценивать важность каждого блока для модели системы и принимать решение о модернизации или исключении блока из модели. Разбиение на блоки с точки зрения дальнейшей реализации модели целесообразно проводить, минимизируя по возможности число связей между блоками модели, т. е. способом минимизации обмена информации (способ 7). Вопрос о допустимости исключения блоков из модели решается способом упрощения машинной модели по критериям интерпретации (способ 8). Согласно этому способу несущественными считаются блоки, которые слабо влияют на критерий интерпретации результатов моделирования и в силу этого могут быть удалены из модели. Способы удаления блоков различаются в зависимости от характера взаимодействия этих блоков с оставшейся частью системы. Удаляя, например, блоки, описывающие взаимодействие системы с внешней средой, необходимо учитывать это при формировании критерия интерпретации результатов моделирования, т. е. удалять блоки с модификацией критерия (способ 9). Некоторые блоки (например, блоки управления исследуемой частью системы) не являются автономными и их нельзя моделировать независимо от 11 остальной части системы. Но в ряде случаев удается указать диапазон изменения переменных и многократно моделировать исследуемую часть системы при различных значениях переменных внутри данного диапазона. Это соответствует способу замены зависимых воздействий независимыми (способ 10). При реализации машинной модели системы необходимо выбрать способ формализации входных воздействий (способ 13). Таким способом может быть, например, введение упрощающих предположений относительно структуры связей входных переменных с другими частями модели или построение вероятностного эквивалента входных воздействий на основе их предварительного исследования (частичного моделирования). До сих пор рассматривались только блоки, реализующие структурное разделение модели на непересекающиеся части, но можно использовать и временное разделение на пересекающиеся блоки (условные подмодели), которые отражают различные этапы или режимы функционирования системы. В ряде случаев выделение условных подмоделей позволяет упростить реализацию машинной модели, сузить разброс результатов моделирования и тем самым сократить требуемое количество экспериментов. На основе условных подмоделей можно сформулировать правило специализации для конкретных условий (правило 4), т. е. определения набора частных условных подмоделей, которые дают возможность судить о системе в целом по совокупности соответствующих частных показателей. При этом специализация полной модели системы позволяет в отдельных случаях проверить точность ее упрощенного блочного представления, откуда вытекает способ проверки точности на условных подмоделях (способ 11). Динамика моделирования системы может быть определена как движение в некотором подпространстве моделей {M}. Причем при исследовании систем движение идет в сторону усложнения модели. Это приводит к способу проверки точности модели по сходимости результатов (способ 12), т. е. проверки точности результатов моделирования, получаемых на моделях возрастающей сложности. Такой способ позволяет двигаться от простой модели к более сложным в пределах ограничений вычислительных ресурсов до тех пор, пока различие моделей не станет достаточно мало. Это отражает суть способа сравнения моделей с различной сложностью (способ 14). Рассмотренные эвристические правила и способы моделирования задают общую схему построения и реализации моделей систем управления и информационных систем. Постановка задачи моделирования в общем виде С развитием системных исследований с расширением экспериментальных методов изучения реальных объектов большое значение приобретают математические методы анализа и синтеза. Подобие и моделирование позволяют по-новому описать реальный процесс и упростить экспериментальное его изучение. 12 Моделирование базируется на некоторой аналогии реального и мысленного эксперимента (выявление влияния изменения химического состава шихты на TЭП процесса плавки). Для объяснения реальных процессов выдвигаются гипотезы, для подтверждения которых ставится эксперимент, под которым понимается некоторая процедура организации и наблюдения явлений, которые осуществляют в условиях, близких к реальным или имитируют их. Токораспределение при электролизе расплавов солей можно оценить на моделях, использующих электролиз водных растворов электролитов. В основе любого вида моделирования лежит модель, имеющая соответствие, базирующееся на некотором общем качестве, которое характеризует реальный объект; например, описание с помощью дифференциальных уравнений процессов массопереноса. В основе моделирования лежат информационные процессы, поскольку само создание модели базируется на информации о реальном объекте. В процессе реализации модели одновременно получается информация об ОУ, которая сравнивается с моделью и на основе сравнения данных вырабатывается управляющее воздействие, которое воздействует на процесс. Поэтому можно сказать, что реализация модели осуществляется в темпе с процессом. При постановке задачи моделирования можно выделить следующие характерные признаки. 1. Цель функционирования, которая определяет степень целенаправленности поведения модели. В этом случае модели могут быть разделены на одноцелевые и на многоцелевые. 2. Сложность, которую можно оценить по общему числу элементов в системе и связей между ними. 3. Целостность, указывающая на то, что создаваемая модель является одной целостной системой, включает в себя большое количество составных частей, находящихся в сложной взаимосвязи друг с другом. 4. Неопределенность, которая проявляется в системе, оцениваемая энтропией и позволяющая в ряде случаев оценить количество управляющей информации, необходимой для достижения заданного состояния. 5. Поведенческая страта, которая позволяет оценить эффективность достижения системой доставленной цели. В зависимости от наличия случайных возмущений можно различать детерминированные и стохастические системы, по своему поведению - непрерывные и дискретные. 6. Адаптивность (приспосабливаемость) к различным внешним возмущающим факторам в широком диапазоне изменения воздействий внешней среды. При этом система управления должна компенсировать изменение случайных факторов. Например, АСУ теплового режима электропечи должна стабилизировать температуру расплава как при изменении влажности шихты в рабочем диапазоне, так и при изменении содержания олова в концентрате, загружаемом в электропечь. 7. Организационная структура системы моделирования, которая во многом зависит от сложности модели и степени совершенства средств моде13 лирования. 8. Управляемость модели, вытекающая из необходимости обеспечивать управление со стороны экспериментов для получения возможности рассмотрения протекания процесса в различных условиях, имитирующих реальные. К этому можно отнести управление технологическим процессом, как в нормальном, так и в предаварийном состоянии. 9. Возможность развития модели, которая позволяет создавать мощные системы моделирования для исследования многих сторон функционирования реального объекта. Модель должна позволять усложнять систему путем включения в ее состав, например, подсистем управления энергетическим и тепловым режимами, шихтоподготовкой и выпуском металла и т.д. Одним из наиболее важных аспектов построения систем моделирования является проблема цели. Любую модель строят в зависимости от цели моделирования, поэтому одной из основных проблем при моделировании это проблема целевого назначения. При создании АСУ целью оптимизации может быть: максимальная производительность, минимум потерь цветных металлов, снижение себестоимости продукции и некоторые другие цели. 14 Лекция 2. Общие сведения о математическом моделировании  Основные этапы математического моделирования  Общая классификация моделей  Структурно-параметрическое описание и назначение параметров объекта  Дискретные и непрерывные модели Основные этапы математического моделирования Процесс моделирования можно представить в виде следующих основных этапов. 1. Содержательное описание объекта моделирования и разработка содержательной модели. 2. Формулирование законов, связывающих элементы объекта моделирования, и их формализация. 3. Исследование математических задач, к которым приводит модель. 4. Проверка адекватности модели. 5. Модернизация модели в связи с накоплением новых знаний. Из приведенных выше пунктов основным является разработка содержательной модели, которая определяет подход к построению моделей. Общая классификация моделей В основе моделирования лежит теория подобия, которая утверждает, что абсолютное подобие, может иметь место лишь при замене одного объекта другим, точно таким же. При моделировании невозможно добиться абсолютного подобия и нужно стремиться к тому, чтобы модель достаточно хорошо отражала исследуемую сторону функционирования объекта (процесс восстановления, осаждение металла). Поэтому в качестве одного из признаков классификации видов моделирования можно выбрать степень полноты модели и разделить модели в соответствии с этим признаком на полные, неполные и приближенные. В основе полного моделирования лежит полное подобие, которое проявляется как во времени, так и в пространстве. Для неполного моделирования характерно неполное подобие модели изучаемому объекту («горячая» модель электролизера). Приближенное моделирование опирается на приближенное подобие, при котором некоторые стороны функционирования реального объекта не моделируется совсем (холодная модель электролизера). В зависимости от характера изучаемых процессов в системе все виды моделирования могут быть сведены в схему, представленную на Рисунке 2.1. 15 МОДЕЛИРОВАНИЕ СИСТЕМ ДЕТЕРМИНИРОВАННОЕ СТОХАСТИЧЕСКОЕ СТАТИТИЧЕСКОЕ ДИНАМИЧЕСКОЕ ЛИНЕЙНОЕ НЕЛИНЕЙНОЕ ДИСКРЕТНОНЕПРЕРЫВНОЕ ДИСКРЕТНОЕ НЕПРЕРЫВНОЕ ФИЗИЧЕСКОЕ В НЕРЕАЛЬНОМ МАСШТАБЕ ВРЕМЕНИ КОМПЛЕКС. ИСПЫТАНИЯ ПРОИЗВОДСТВЕННЫЙ ЭКСПЕРИМЕНТ НАУЧНЫЙ ЭКСПЕРИМЕНТ НАТУРНОЕ ИМИТАЦИОННОЕ КОМБИНИРОВАННОЕ МАТЕМАТИЧЕСКОЕ АНАЛИТИЧЕСКОЕ ЗНАКОВОЕ ЯЗЫКОВОЕ СИМВОЛИЧЕСКОЕ МАКЕТИРОВАНИЕ АНАЛОГОВОЕ ГИПОТЕТИЧЕСКОЕ НАГЛЯДНОЕ ДИСКРЕТНОЕ В РЕАЛЬНОМ МАСШТАБЕ ВРЕМЕНИ МЫСЛЕННОЕ Рис. 2.1. Классификация моделей Детерминированное моделирование отображает детерминированные процессы, т.е. процессы, в которых предполагается отсутствие всяких случайных воздействий. Стохастическое моделирование отображает вероятностные процессы и события. Статическое моделирование служит для описания поведения объекта в какой-либо момент времени (в статике). Динамическое моделирование отражает закон изменения состояния объекта во времени. Дискретное моделирование служит для описания дискретных процессов. Непрерывное моделирование позволяет отразить непрерывные во времени процессы. Дискретно-непрерывное моделирование используемся для случаев, когда хотят выделить наличие как дискретных, так и непрерывных 16 процессов (непрерывный процесс плавки и периодический выпуск продуктов плавки). Линейное моделирование применяют для описания линейных процессов, т.е. процессов, связь между входными и выходными параметрами которых линейна. Нелинейное моделирование предназначено для описания нелинейных процессов, в которых связь между выходом и входом системы нелинейна. В зависимости от формы представления объекта можно выделить мысленное и реальное моделирование. При реальном моделировании используется возможность исследования характеристик либо на реальном объекте, либо на его части. Оно подразделяется на натурное и физическое. Физическое моделирование отличается от натурного тем, что исследования проводятся на установках, которые сохраняют природу явления и обладают физическим подобием. Физическое подобие может протекать в реальном и нереальном масштабе времени (моделирование процесса электролиза). Натурное моделирование подразделяют на научный эксперимент (широкое применение средств вычислительной техники), комплексные испытании и производственный эксперимент, реализованные на основе теории подобия и обладающие высокой достоверностью. Мысленное моделирование часто является единственным способом моделирования объектов, которые либо не реализуемы в заданном интервале времени, либо существуют вне условий, возможных для их физического создания. Оно может быть наглядным, символическим и математическим. При наглядном моделировании создаются модели наглядные, которые отображают явления и процессы, протекающие в объекте. Наглядное моделирование подразделяется на гипотетическое (в основе гипотезы), аналоговое (аналогии различных уровней) и макетирование (мысленный макет). Символическое моделирование представляет собой искусственный процесс создания логического объекта, который замещает реальный и выражает его основные свойства. Под математическим моделированием принимают процесс установления соответствия данному реальному объекту некоторого математического объекта, называемого математической моделью и исследование этой модели, позволяющее получать характеристики рассматриваемого реального объекта. Математическое моделирование для исследования характеристик процесса функционирования систем можно разделить на аналитическое, имитационное и комбинированное. Для аналитического моделирования характерно то, что процесс функционирования элементов системы (физико-химические превращения, загрузка, выпуск, тепло- массоперенос) записываются в виде некоторых функциональных соотношений (алгебраических, дифференциальных, конечноразностных) или логические условий. Аналитическая модель может быть исследована следующими методами: 17 1) аналитическим, когда искомые характеристики пытаются получить в общем виде; 2) численным, когда, не зная решения в общем виде, стремятся получить числовые результаты при конкретных исходных данных; 3) качественным, когда, не имея решения, в явном виде, можно найти некоторые свойства решения. Аналитический метод широко применяется для простых систем, с усложнением систем использование аналитического метода возможно при упрощении первоначальной модели. Численный метод по сравнению с аналитическим позволяет исследовать более широкий класс систем, но при этом полученные решения являются приближенными и носят частный характер. Численный метод особенно эффективен при использовании ЭВМ. При имитационном моделировании имитируются элементарные явления, составляющие процесс с сохранением их логической структуры и последовательности протекания во времени. Основным преимуществом имитационного моделирования по сравнению с аналитическим является возможность решения более сложных задач. Имитационные модели позволяют относительно просто учитывать следующие факторы: наличие дискретных и непрерывных элементов, нелинейные характеристики элементов системы, многочисленные случайные воздействия. Если для получения имитационной модели используются реализации случайных величин и функций, то для машинной реализации имитационной модели используют метод статистического моделирования (вероятностные методы). Методом статистического моделирования называется метод машинной реализации имитационной модели, а методом статистических испытаний (Монте-Карло) называется численный метод решения аналитической задачи. Особенно эффективно применение вероятностных методов при неполной информации о процессе и для прогнозирования. Комбинированное моделирование позволяет, объединить при моделировании достоинства аналитического и имитационного моделировании. При этом часть подсистем описывается аналитическими моделями, а часть имитационными. Модели математического программирования являются используемым классом моделей, применяемых для решения оптимизационных задач. В самом общем случае модели задач математического программирования имеют следующий вид: найти точки максимума (или минимума) функции Z  Z ( x1, x2 ,..., xn ) при ограничениях 18 gi ( x1 , x2 ,..., xn )  0, i  1,2,..., m, h j ( x1 , x2 ,..., xn )  0, j  1,2,..., l. Здесь Z  Z ( x1, x2 ,..., xn )  целевая функция, x  ( x1, x2 ,..., xn )  вектор управляемых и неуправляемых переменных. Для нахождения оптимального решения данной задачи в зависимости от вида структуры целевой функции и ограничений используются 1) методы линейного программирования, если функции Z, gi и hj линейные относительно переменных x; 2) методы нелинейного программирования, если какие-либо из функций Z, gi и hj нелинейные относительно переменных x; 3) методы динамического программирования, если целевая функция Z аддитивная; 4) методы стохастического программирования, когда вектор неуправляемых переменных x случаен; 5) сетевые модели, сетевые модели позволяют отобразить объем практических взаимообусловленных работ, последовательность их выполнения, а также логическую взаимосвязь. Структурно-параметрическое описание и назначение параметров объекта Применение вычислительной техники и математических методов при проектировании сложных технических систем возможно только в том случае, если имеются их адекватные математические модели. Возможность построения иерархии моделей играет важную роль в процессе автоматизированного проектирования и создания САПР. В математической модели проектируемого объекта выделяют cтруктурно-параметрическое описание собственно объекта и описание поведения объекта во времени и внешней среде. Таким образом, математическая модель проектируемого объекта состоит из двух частей: структурно-параметрического описания объекта с помощью набора проектных параметров и модели функционирования. Под структурно-параметрическим описанием ОУ будем понимать такое его описание, которое показывает, из каких подсистем, блоков, агрегатов, деталей состоит данный объект, как эти компоненты соединены и взаимодействуют между собой, каковы их весовые, габаритные характеристики и т.д. Структурно-параметрическое описание должно давать возможность генерировать множество альтернатив ОУ, быть достаточно подробным, соответствующим этапу проектирования и доставлять информацию для моделей функционирования. Для сложных объектов предложены различные методы структурнопараметрического описания ОУ: систематического покрытия поля, отрицания и конструирования, морфологического ящика, комбинаторного файла и т.д. 19 При построении модели наряду со структурным возникает необходимость в параметрическом описании ОУ. Обычно такое описание дается конечным набором параметров, варьируя значения параметров в определенных пределах с учетом необходимых ограничений, удается отразить возможность включения в структуру ОУ различных по характеристикам подсистем. Параметрическое описание объекта включает в себя выделение совокупности входных переменных (внешних параметров) Х1, Х2, …, Хn, управляющих воздействий U1, U2, …, Uk, влияющих на процесс, выходных переменных (зависимых параметров) Y1, Y2, …, Ym, характеризующих протекание процесса, а также внутренних параметров модели P1, P2, …, Pl. Управляющие воздействия U1, U2, …, Uk являются целенаправленно изменяемыми переменными и формируются на основе информации о входных переменных, которые называются управляемыми. Остальные входные переменные относятся к возмущающим воздействиям, а выходные переменные – к неуправляемым. Внутренние параметры модели – это внутренние характеристики объекта, не зависящие от процесса моделирования, например, конструктивные параметры агрегатов, теплофизические свойства объектов и т.п. Возмущающие воздействия и неуправляемые переменные могут быть контролируемыми (наблюдаемыми) и неконтролируемыми (ненаблюдаемыми). В математическом моделировании используется различный математический аппарат в зависимости от характера моделируемого процесса или объекта. Модели функционирования управляемых динамических систем описываются обыкновенными дифференциальными уравнениями. Этот класс систем характеризуется тем, что содержит модели, адекватно отражающее функционирование современных изделий машиностроения, технологических систем и т.д. Модели функционирования подразделяются на модели без управления, Y = f(t,z,x), используемые для создания систем контроля, диагностики и прогнозирования технических систем, где z – вектор фазовых состояний; t – время; x – набор параметров; управлением, применяемые для создания систем автоматического управления: Y= f(t,z,x,u,μ), где μ – возмущение; u – управляющее воздействие. Для описания процессов, протекающих в технологических агрегатах, используют математические выражения, которые составляют математическую модель процесса или объекта управления. В зависимости от того, какие 20 математические формулы используют для описания процессов, математические модели подразделяют на линейные и нелинейные модели. Линейной моделью называется такая математическая модель описания объекта или процесса, для построения которой используют линейные дифференциальные или другие уравнения, т.е. уравнения, в которых связь между входными и выходные параметрами является линейной (пропорциональной). Нелинейной моделью называется такая математическая модель описания объекта или процесса, для построения которой используют нелинейные уравнения, т.е. уравнения, в которых связь между входными и выходными параметрами является нелинейной. С помощью линейной модели можно описать, например, реакции, протекающие в объеме ванны металлургического агрегата, теплопроводность стенок печного агрегата и т.д.: d (V1 )  V1C A  V2C A , dt d (V2 )  V1CB  V2CB , dt где A и B взаимодействующие вещества, которые имеют концентрации CA и CB; V1 и V2 – скорости изменения объекта. Линейные модели могут использоваться для описания взаимосвязи входных и выходных параметров с помощью вероятностных (регрессионных) уравнений парных и множественных следующего вида: T  a0  a1 p; П  b0  b1 p  b2G  b3Ck  b4T  b5Y , где Т - температура, П - производительность, p,G,C - технологические параметры, а и b - коэффициенты регрессионного уравнения, определенные экспериментальным путем. При описании нелинейных моделей могут использоваться выражения, содержащие степенные , показательные, логарифмические, гиперболические, тригонометрические, обратные тригонометрические и другие функции, а также интегралы, производные и другие выражения. Например, работу газа можно описать следующим соотношением: A V2 V2 V1 V1  pdV   V ПRT dV  nRT ln 2 , V V1 21 где n  число молей газа в объеме V:R  универсальная газовая постоянная; Т – абсолютная температура; V1 и V2  изменение объема. С помощью нелинейных моделей можно описать сложные физикохимические процессы, протекающие в технологических агрегатах (печь обжига, восстановительно-окислительные процессы), и процессы массопереноса и физических превращений. Многие взаимосвязи между входными и выходными параметрами могут быть описаны с помощью нелинейных регрессионных уравнений вида: n  a0  a1T  a2T 2  a3T 3 , где T – температура электролита; a i – коэффициенты регрессии, определенные экспериментально, i = 1, 2, 3. Дискретные и непрерывные модели При построении моделей сложных систем большое значение имеет идея прерывности, на основе которой сложные явления поддаются описанию, как закономерно составленные из простых частей. Подчеркивая преобладающую роль принципа прерывности, нельзя игнорировать непрерывность модели, где отражение одного из важнейших свойств системности, заключающегося в том, что система не есть простая сумма составляющих ее элементов. Идея прерывности нашла применение при описании процессов с сосредоточенными и распределенными параметрами. Применяя принципы соответствия, конкретности и прерывности для систем управления отдельными агрегатами, цехами к моделированию управления более крупной надсистемой (например, заводом), можно построить расчленённые модели, обозримые как в целом, так и для каждой из структурных единиц. Чем сложнее система, тем более крупную структурную единицу нужно рассматривать на каждой ступени иерархии, а модель всей системы может представляться как система подмоделей. Например, децентрализованная система управления процессом электролиза включает управление электролизерами на базе микропроцессоров и управление корпусом путем изменения установок электролизеров. При этом между структурными единицами нужно оставить лишь минимум необходимых связей, учитывая, что внутри каждой единицы существует саморегулирование, например, при децентрализованной системе управления электролизерами ЭВМ верхнего уровня освобождается от управления МПР и питанием электролизеров глиноземом, что возлагается на микропроцессорные системы управления. При этом в функции ЭВМ верхнего уровня остается координация работы микропроцессоров. 22 23 Лекция 3. Основные подходы к построению математических моделей систем  Формальная модель системы, параметры системы.  Типовые математические схемы. Формальная модель системы, параметры системы Применение вычислительной техники и математических методов при проектировании сложных технических систем возможно только в том случае, если имеются их адекватные математические модели. Возможность построения иерархии моделей играет важную роль в процессе автоматизированного проектирования и создания САПР. В математической модели проектируемого объекта выделяют cтруктурно-параметрическое описание собственно объекта и описание поведения объекта во времени и внешней среде. Таким образом, математическая модель проектируемого объекта состоит из двух частей: структурно-параметрического описания объекта с помощью набора проектных параметров и модели функционирования. Под структурно-параметрическим описанием объекта понимается такое его описание, которое показывает, из каких подсистем, блоков, агрегатов, деталей состоит данный объект, как эти компоненты соединены и взаимодействуют между собой, каковы их весовые, габаритные характеристики и т.д. Исходной информацией при построении модели являются данные о назначении и условиях работы исследуемой системы. Эта информация определяет основную цель моделирования системы. Каждая система S характеризуется набором свойств, под которыми понимаются величины, называемые параметрами системы, которые отражают поведение системы и учитывают условия функционирования во взаимодействии с внешней средой E. Учет всех параметров системы может быть затруднителен, а иногда вообще невозможен. Кроме того, модели, включающие все параметры системы, как правило, чрезвычайно сложны и малоэффективны. Упрощение модели помогает выделить основные свойства системы, отбросив второстепенные. Выбор границы «система S – среда E» регулирует полноту модели системы. Модель системы S можно представить в виде множества параметров, описывающих процесс функционирования реальной системы и образующих следующие подмножества: - входные воздействия xi  X, i = 1, …, nX; - воздействия внешней среды vl  V, l = 1, …, nV; - внутренние параметры hk  H, k = 1, …, nH; - управляющие параметры uk  U, k = 1, …, nU; - выходные характеристики системы yj  Y, j = 1, …, nY. В общем случае параметры xi, vl, hk, yj содержат как детерминированные, так и стохастические составляющие. Все параметры системы можно 24 разделить на экзогенные или независимые и эндогенные или зависимые (рис. 3.1). Процесс функционирования системы S описывается во времени t оператором FS (отображением), который преобразует экзогенные переменные в эндогенные в соответствии с соотношениями вида y(t) = FS(x, v, h, t). (3.1) Параметры Экзогенные (независимые) Эндогенные (зависимые) x(t) = (x1(t), x2(t), …, xnX (t)) y(t) = (y1(t), y2(t), …, ynY (t)) v(t) = (v1(t), v2(t), …, vnV (t)) h(t) = (h1(t), h2(t), …, hnH (t)) u(t) = (u1(t), u2(t), …, unU (t)) Рисунок 3.1 Параметры системы. Соотношения (3.1) называются законом функционирования системы и обозначаются FS. Закон FS может быть задан в виде а) функции, б) функционала, в) логических условий, г) алгоритмического описания, д) таблицы, е) словесного правила соответствия. Метод получения значений выходных параметров на основе закона (3.1) при заданных x, v, h называется алгоритмом функционирования системы и обозначается AS. Если состояние системы меняется во времени, ее математическая модель описывается соотношениями (3.1) и называется динамической моделью. Для статических систем, состояние которых не меняется во времени, математическая модель записывается как y = FS(x, v, h) 25 Таким образом, под математической моделью системы понимают конечное подмножество параметров (x(t), v(t), h(t), y(t)) вместе с математическими связями между ними. Типовые математические схемы Приведенные выше математические соотношения представляют собой математические схемы общего вида и позволяют описать широкий класс систем. Однако в практике моделирования объектов на первоначальных этапах исследования системы рациональнее использовать типовые математические схемы: D-схемы, F-схемы, P-схемы, Q-схемы, N-схемы, A-схемы. D-схемы (непрерывно-детерминированные модели). При непрерывно-детерминированном подходе в качестве математических моделей используются дифференциальные уравнения. Дифференциальными называются уравнения, в которые входят неизвестные функции одной или нескольких переменных и их производные различных порядков. Если неизвестные – функции многих переменных, то модели описываются уравнениями в частных производных. При рассмотрении функций только одной независимой переменной используются обыкновенные дифференциальные уравнения. Использование D-схем позволяет формализовать процесс функционирования непрерывных детерминированных систем и оценить их основные характеристики с помощью аналитических или численных методов. F-схемы (дискретно-детерминированные модели). Особенности дискретно-детерминированного подхода позволяют при моделировании процесса функционирования систем использовать в качестве математического аппарата теорию автоматов. На основе этой теории система представляется в виде автомата, перерабатывающего дискретную информацию и меняющего свои внутренние состояния лишь в дискретные моменты времени. F-схемы являются математической абстракцией, удобной для описания широкого класса процессов функционирования реальных объектов в автоматизированных системах обработки информации и управления. В качестве таких объектов в первую очередь следует назвать элементы и узлы ЭВМ, устройства контроля, регулирования и управления, системы временной и пространственной коммутации в устройствах передачи информации. Для всех перечисленных объектов характерно наличие дискретных состояний и дискретный характер работы во времени. Однако этот подход непригоден для описания процессов принятия решений, переходных процессов в динамических системах и стохастических элементов. P-схемы (дискретно-стохастические модели). При дискретно-стохастическом подходе к моделированию процесса функционирования систем время остается дискретным аналогично F-схемам. Влияние случайных факторов на систему приводит к использованию другой 26 разновидности автоматов – вероятностным (стохастическим) автоматам. В общем виде вероятностный автомат можно определить как дискретный потактовый преобразователь информации, функционирование которого в каждом такте может быть описано статистически. Применение схем вероятностных автоматов имеет важное значение для разработки методов проектирования дискретных систем, проявляющих случайное поведение, а также моделирования случайных воздействий внешней среды. Q-схемы (непрерывно-стохастические модели). Непрерывно-стохастический подход при моделировании процесса функционирования систем предполагает использование в качестве типовых математических схем систем массового обслуживания, которые называют Qсхемами. В качестве процесса обслуживания могут быть представлены различные по своей физической природе процессы функционирования экономических, производственных, технических и других систем. К таким процессам относятся потоки вызовов на телефонной станции, потоки комплектующих изделий на сборочном конвейере, потоки запросов на сервер от удаленных терминалов и т. д. Характерным для работы таких объектов является случайное появление заявок на обслуживание и завершение обслуживания в случайные моменты времени, т. е. стохастический характер процесса функционирования. N-схемы (сетевые модели). В практике моделирования объектов часто приходится решать задачи, связанные с формализованным описанием и анализом причинноследственных связей в сложных системах, где несколько процессов протекает одновременно. В настоящее время самым распространенным математическим аппаратом, описывающим структуру и взаимодействие параллельных систем и процессов, являются сети Петри и теория графов (N-схемы). A-схемы (комбинированные модели). Наиболее общим подходом к формальному описанию процессов функционирования систем является подход, который базируется на понятии агрегативной системы, представляющей собой формальную схему общего вида, называемую A-схемой. При агрегативном описании сложный объект (система) разбивается на конечное число частей (подсистем), сохраняя при этом связи, обеспечивающие их взаимодействие. Если некоторые из полученных подсистем оказываются в свою очередь еще достаточно сложными, то процесс их разбиения продолжается до тех пор, пока не образуются подсистемы, которые в условиях рассматриваемой задачи моделирования могут считаться удобными для математического описания. В результате такой декомпозиции сложная система представляется в виде многоуровневой конструкции из взаимосвязанных элементов, объединенных в подсистемы различных уровней. 27 В качестве элемента A-схемы выступает агрегат, а связь между агрегатами (внутри системы S и с внешней средой E) осуществляется с помощью оператора сопряжения R. Очевидно, что агрегат сам может рассматриваться как A-схема, т. е. может разбиваться на элементы (агрегаты) следующего уровня. Таким образом, рассмотренные выше типовые математические схемы позволяют формализовать достаточно широкий класс больших систем, с которыми приходится иметь дело в практике их исследования и проектирования. 28 Лекция 4. Идентификация математических моделей  Понятие идентификации  Методы структурной идентификации  Методы проверки гипотезы об адекватности структуры модели  Параметрическая идентификация для случаев статической детерминированной модели  Параметрическая идентификация стохастических объектов  Динамические модели Понятие идентификации Под идентификацией объектов понимается построение оптимальных в некотором смысле математических моделей по реализации их входных и выходных сигналов. В конечном счете задача идентификации сводится к количественной оценке степени идентичности модели реальному объекту, что можно представить в следующем виде (рис. 4.1). Рис. 4.1 Структурная схема процесса идентификации: F0 – истинная характеристика ОУ; Fм – оценка объекта по его математической модели; y0(t) – выход реального объекта; yм(t) – выход модели. Критерием соответствия модели и объекта является минимум ошибки модели (остатков модели):  M (t )  y0 (t )  ym (t ) . В зависимости от характера априорной информации об объекте различают задачи идентификации в узком и широком смысле. Задача идентификации в узком смысле сводится к оценке параметров объекта по результатам наблюдений за входными и выходными сигналами, полученными в условиях функционирования объекта. При этом априорная информация должна быть достаточно велика. Задача идентификации в широком смысле ставится в случаях, когда априорная информация об объекте недостаточна, возникает необходимость выбора структуры системы и задания класса моделей, оценки степени и формы влияния входных переменных на выходные. 29 Построение хорошей модели – это, как правило, многоэтапный процесс, заключающийся в последовательной постановке и проверки гипотез о структуре и параметрах объекта. В настоящее время широкое распространение получили подстраиваемые модели, которые непосредственно используются в контуре управления (рисунок 4.2). Корректировка структуры таких моделей и ее параметров (вручную или автоматически) проводится с целью свести к минимуму ошибку модели em (t )  Ym (t )  y0 (t ) , где Ym(t)  рассчетное значение, y0(t)  реальное значение выходного параметра. x(t ) y0 (t ) ОУ em (t ) ММ Ym (t ) Блок постройки Рисунок 4.2. Структурная схема идентификации объекта методом подстраиваемой модели Методы структурной идентификации Роль структуры модели трудно переоценить, так как при неудачном выборе структуры становится неэффективной параметрическая идентификация. Среди задач, связанных с определением структуры объекта, можно выделить следующие. Выделение объекта из среды. Процесс выделения объекта определяется целями, для достижения которых строится модель. Ранжирование входов и выходов объекта по степени их влияния на конечный целевой показатель. При построении структуры в нее целесообразно включать не все входные и управляющие параметры, а только те, которые оказывают определяющее влияние на целевой показатель. Определение рационального числа входов и выходов объекта, учитываемых в модели. Не следует вводить в модель несущественные параметры, т.к. это приводит к усложнению и значительному отклонению модели от экспериментальных данных. Определение характера связи между входом и выходом модели объекта, т.е. вида модели y=F(x). Рассмотрим каждую из этих задач. Процесс выделения объекта из среды прежде всего определяется целями, для которых строится модель. Выделение объекта из среды или разделение на подобъекты должно осуществляться таким образом, чтобы каждый из них имел минимум связей со средой или другими подобъектами. Процесс выделения объекта из среды может осуществляться как последовательный 30 переход от простейших форм объекта к более сложным. В качестве простейшей формы можно рассматривать такую часть среды, которая несет информацию, необходимую для проверки выполнимости поставленной цели. Далее происходит расширение объекта за счет присоединения части среды. Рассмотрим в качестве примера процесс нагрева металла в камерной печи, Допустим, целью управления является получение равномерно прогретой заготовки. Если при этом в качестве объекта управления выделить лишь саму заготовку, то заданная цель не достижима. Входным параметром является температура рабочего пространства, выходным - температура центра заготовки. Для комплексного решения задачи необходимо знать расход топлива, запыленность отходящих газов и их температуру. Даже в этом случае процесс создания модели должен решаться комплексно. Важное значение для определения структуры модели имеет отбор входных и выходных параметров модели, затем из них отбирают наиболее существенные. При определении структуры модели, могут сравниваться несколько конкурирующих моделей. Гипотезы о структуре модели выдвигаются с учетом физических, физико-химических и других теоретических представлений о конкретных объектах, а для проверки этих гипотез используют экспериментально-статистические методы. Методы проверки гипотезы об адекватности структуры модели Построение хорошей модели – это, как правило, многоэтапный процесс, заключающийся в последовательной постановке и проверке гипотез о структуре и параметрах объекта. В настоящее время широкое распространение получили подстраиваемые модели. Корректировка структуры таких моделей и ее параметров (вручную или автоматически), проводится с целью свести к минимуму ошибку модели. Роль структуры модели трудно переоценить, так как при неудачном выборе структуры модель не будет соответствовать действительности. Критерием соответствия модели и объекта является минимум относительной ошибки модели (остатков модели): M t   y0  t   Yм  t  y0  t  , где y0(t) – выход реального объекта; Yм(t) – выход модели. В статистическом моделировании используется средняя относительная невязка: M 1  nY 31  Yi  Yi , n i 1 ~ ~ где n – число экспериментальных данных, Yi – текущее значение параметра Y, вычисленное по математической модели; Yi – текущее значение параметра Y, полученное на объекте, Y – выборочное среднее значений, полученных на объекте. Об адекватности структуры модели можно также судить по статистической оценке коэффициента корреляции r или корреляционного отношения . Коэффициент корреляции r характеризует степень тесноты линейной ~ связи между Y и Y. Несмещенной точечной оценкой для r является величина r n n ~ ~ n n YiYi   Yi  Yi i 1 i 1 i 1 2 2  n  n ~   n 2  n   ~ 2 n Yi    Yi   n Yi    Yi        i 1  i 1    i 1  i 1    . Корреляционное отношение  характеризует степень тесноты нелиней~ ной связи между переменными Y и Y:  Yi  Y  n  ~ i 1 n 2  Yi  Y  . 2 i 1 Здесь Y – выборочное среднее значение, Y  1 n Yi . n i 1 Следует иметь в виду, что коэффициент корреляции является частным случаем корреляционного отношения и используется обычно только при исследовании линейных моделей. Выводы о степени адекватности модели делаются на основании значения коэффициента корреляции, или корреляционного отношения. При корреляционном отношении, равном 0, ~ связь между Y и Y отсутствует. Модель считается адекватной экспериментальным данным, если 0,9  |r|  1 или, соответственно, 0,9    1. Высокое значение коэффициента корреляции, или корреляционного отношения, свидетельствует об адекватности модели. Другим критерием адекватности модели является анализ остатков модели. Он состоит в построении статистического распределения остатков модели в зависимости от 32 входного параметра X. Если закон распределения остатков близок к нормальному закону с математическим ожиданием равным систематической погрешности метода, которым был получен исходный статистический материал, то модель считается адекватной экспериментальным данным. В грубом приближении о законе распределения можно судить по гистограмме распределения остатков. В случае адекватной модели она имеет колоколообразную форму (рис. 4.3.). При неадекватности модели форма гистограммы характеризуется четко выраженной асимметрией или наличием второго горба. Рис. 4.3. Гистограмма распределения остатков: а) адекватной модели ; б) неадекватной модели. Содержательный анализ остатков модели состоит в построении распределения остатков модели в зависимости от входного параметра X (рис. 4.4). Рисунок 4.4 Графики зависимости остатков от t: а) эффект времени, не влияет на ошибку; б) дисперсия не постоянна, необходимо использование взвешенного метода наименьших квадратов; в) необходимо включить в модель линейный член; г) необходимо включить в модель линейный и квадратичный члены 33 Попадание большинства данных в горизонтальную полосу свидетельствует, что наши предположения оправданы, т.е. модель адекватна ОУ. Графики для случаев неадекватности модели ОУ имеют вид, аналогичный рисунку 4.4 б)-г). Графики остатков по каждой из независимых переменных x строят и анализируют соответствующим образом. Большой интерес при исследовании остатков могут представлять выбросы, то есть значительные отклонения параметров от установленного закона распределения. С точки зрения получения устойчивых средних значений выбросы за зону шириной  3 (  среднее квадратическое отклонение) рекомендуется не учитывать. Методы параметрической идентификации С помощью методов структурной идентификации не всегда удается достичь необходимой адекватности (идентичности) объекта и его математической модели. Поэтому при невозможности использования в дальнейшем методов структурной идентификации одним из рациональных подходов является отбор методов параметрической идентификации по их целевой направленности, т.е. в зависимости от свойств объектов, отражением которых является математическая модель определенных классов. С точки зрения методов параметрической идентификации математические модели классифицируются как  статические или динамические;  детерминированные или стохастические;  линейные или нелинейные;  непрерывные или дискретные. В зависимости от структуры связи между входом и выходом объекта и его свойств выбор методов параметрической идентификации осуществляется на основе следующих признаков:  активность (активные и пассивные методы);  адаптивность (неадаптивные и адаптивные);  дискретность (непрерывные и дискретные). Поэтому число возможных сочетаний моделей и методов довольно велико. Однако из всего многообразия реальных ситуаций можно выделить, типовые случаи. Например, идентификация объекта, описываемого статической, детерминированной линейной моделью проводится более простыми методами, чем для случаев динамической стохастической нелинейной моделью. Рассмотрим некоторые наиболее характерные методы идентификации применительно к металлургическим объектам. 34 Параметрическая идентификация детерминированной модели Физический смысл параметрической идентификации заключается в изменении (подстройке) внутренних параметров модели в случае несоответствия расчетного значения выходного параметра модели ~y его истинному (действительному) значению у, полученному на реальном объекте в процессе его функционирования. Рассмотрим пример. Допустим, что поведение объекта моделирования описывается регулярной зависимостью, связывающей вход х и выход у: Тогда его модель также должна представлять собой некоторую регулярную функцию F, т.е. ym=Fm(x). Рассмотрим, например, линейную модель объекта с n входными и m выходными параметрами:  y1  b10  b11xi  ...  b1n x n ,  y  b  b x  ...  b x ,  2 20 21 i 2n n (4.1)  .......... .......... .......... .......... ...   y m  bm0  bm1 xi  ...  bmn x n , где идентифицируются m(n+1) коэффициентов bij (i = 1, …, m; j = 0,1, …,n). В векторной форме система (4.1) имеет вид Y = b0 + BX, где X = (x1,…,xn), Y = (y1,…,ym), b0 = ( b10,…,bm0), B  матрица коэффициентов bij, i = 1, 2, …, m, j = 1, 2, …, n. Рассмотрим случай n >1, m =1, т.е. модель объекта с одним выходом, которая в векторной форме имеет вид Y = b0 + (B, X) (4.2) где (B,X) - скалярное произведение векторов B и X. Она содержит k=n+1 неизвестных параметров которые могут быть оценены на основе информации о работе объекта. Рассмотрим сначала неадаптивный шаговый метод применительно к решению этой задачи, для чего приравниваем выходы модели и объекта в каждом из N опытов: n b0   bi xij  y j ( j  1,...,N ). i 1 В результате получаем систему из N уравнений с n+1 неизвестным, которая имеет единственное решение, если ранг матрицы 35 x11 x12 ... x1N x 21 x 22 ... x2 N ... x n1 ... x n 2 ... ... ... x nN равен n+1, т.е. имеется n+1 линейно независимая строка этой матрицы. Это условие может быть нарушено, если ряд факторов в некоторых опытах окажутся застабилизированными (не изменяют своего значения) по условиям технологии. Выходом из этой ситуации является увеличение числа опытов, чтобы получить недостающие комбинации, или снижение числа идентифицируемых параметров. В качестве критерия идентификации стохастических моделей чаще всего используется суммарная квадратичная невязка (остаток) модели и объекта N Qb    q 2j b  j 1 где qj - локальная невязка на j-том опыте. n q j  b0   bi xij  y0 j i 1 Модель считается адекватной, если относительная невязка  N  Q0 (b)  Q(b)   y 2j   j 1    1 не превышает 5%. В случае неадекватности модели необходимо изменить регулируемые параметры, т. е. коэффициенты уравнения (4.2). Для непрерывного процесса идентификация сводится к решению системы дифференциальных уравнений dB  J B, X t , Y t  . dt Здесь J  заданная вектор-функция переменных B, X(t)  заданный вектор входных параметров, Y(t)  заданный вектор выходных параметров. Если в качестве критерия идентификации принять квадратичную невязку, а в качестве алгоритма минимизации невязки  метод наискорейшего спуска, то эта система уравнений принимает вид: 36 dB   grad qt2 Bt . dt Параметрическая идентификация стохастических объектов Сначала рассмотрим задачу идентификации для статического стохастического объекта, модель которого может быть представлена в виде Y = F0(X, B, E), где E - вектор случайных факторов, порожденных либо самим объектом, либо средствами сбора и передачи информации; X – входной параметр объекта, B  вектор внутренних параметров. Для простоты остановимся на таких объектах, у которых регулярная составляющая F0(X, B) и случайная E1 могут быть разделены, т.е. представлены в виде Y=F0(X, B)+E1. При этом предполагается, что свойства случайной составляющей не зависят от входа Y, т.е. полностью оцениваются определенной плотностью вероятности f(t), чаще всего плотностью нормального закона распределения. Для объекта с одним выходом Y (m=1), плотность нормального распределения случайной величины E1 характеризуется двумя параметрами: математическим ожиданием m и дисперсией 2.  m  M      y  f  d , 2  M [( E1  m )2 ] .  В двумерном случае (для объекта, имеющего два выхода y1 и y2 и две случайных составляющих (1, 2), нормальный закон распределения характеризуется пятью параметрами: координатами центра рассеяния m1  M 1 ; m2  M  2 ; дисперсиями составляющих 12  M [(1  m1 )2 ]; 22  M [(2  m2 )2 ]; и корреляционным моментом K1,2  M 1  m1 1  m2 ; 37 Идентификация объектов с несколькими выходами значительно затрудняется при коррелированности помех, действующих на разные выходы. Преодолеть этот недостаток можно с помощью процедуры "декорреляции". Смысл декорреляции состоит в следующем. Пусть 1 и 2 - коррелированные случайные величины с нулевыми математическими ожиданиями, дисперсиями 12 и  22 и корреляционным моментом К12, который предполагается известным. Построим такое линейное преобразование системы случайных величин с матрицей a12  a  , A   11 a a  21 22  чтобы новые случайные величины 1  a111  a12 2 , 2  a211  a22 2 были некоррелированы. Корреляционный момент этих величин R1 , 2   a11a2112  a12a22 22  a11a21  a12a22 K12 равен 0, если выполняется условие a12 a22 12  K12  2 . a11 a21  2  K12 Таким образом, с помощью указанного линейного преобразования можно избавиться от корреляции помех на выходах и рассматривать задачу идентификации для каждого выхода отдельно. При этом необходимо подчеркнуть, что оценки идентифицируемых параметров в среднем совпадают с их точными значениями, когда математическое ожидание помехи m=0 и она не коррелирована ни с одним из входов xi . В реальных условиях такая ситуация часто имеет место. Для определения параметров В после этапа структурной идентификации, на котором выбирается вид функций F, решается задача оптимизации невязки выхода модели и объекта на каждом измерении:   q j B   F X j , B  Y j .  j  1,...,N. Оцениваемые параметры выбираются таким образом, чтобы все эти невязки были минимальны по модулю, т.е. решается задача минимизации N функций: 38 q j B   min  j  1,...,N  . Эта задача является многокритериальной и может быть решена только при свертывании критерия, что можно сделать одним из следующих способов: N Q1 B    q j B  (модульный критерий); j 1 N Q2 B    q 2j B  (квадратичный критерий); j 1 Q3 B   Q4 B   N  q j B  p (показательный критерий); j 1 max j 1,2,...,N N q j B  (минимальный критерий); Q5  B     j q j  B  , j >0 p (взвешенный критерий). j 1 Последний критерий обобщает все предыдущие. Динамические модели Большой интерес представляет идентификация динамических объектов. С этой целью рассмотрим методы идентификации объектов, оператор которых имеет память, т.е. выход Y в момент времени t отражает не столько состояние входа Х в этот момент, сколько его значение в предыдущие моменты времени, например, содержание никеля в шлаке не может мгновенно изменяться при изменении состава загружаемой шихты. При идентификации следует различать параметрические и непараметрические модели объектов. Параметрическая модель определяется набором параметров (коэффициентов), которые оцениваются в процессе идентификации. Непараметрическая модель определяется в общем случае непрерывной функцией (чаще всего функцией времени), может быть задана также точками или в виде разложения в ряд по некоторой системе функций. При построении моделей исходной информацией для идентификации являются состояния входов Хi(t) и выхода Y(t) объекта в промежутке 0  t  T . Например, при идентификации процесса обжига нефелинового концентрата исходной является информация о количестве загружаемой шихты, ее химическом составе, подаче топлива, воздуха в момент времени t = 0. Выходным параметром является количество полученного глинозема в момент времени t = Т. Как и в предыдущих случаях, задачу идентификации можно свести к минимизации функции невязки в виде 39 T 2  Qc    Y (t )   bi X i (t ) dt .  i 0 0  l 40 Лекция 5. Математическое моделирование систем и информационные технологии  Информационные технологии сбора и обработки информации  Информационные технологии хранения данных. Системы управления базами данных  Модельные системы поддержки принятия решений  Экспертные системы Известно, что компьютеры изначально были созданы для удовлетворения нужд крупных учреждений при реализации большого объема вычислений, для которых существенными являлись точность и время вычислений. Как правило, вычисления представляют собой длинные цепочки итераций и требуют сохранения высокой точности (примерами таких вычислений могут служить решение дифференциальных уравнений, операции с матрицами и векторами, решение задач математического программирования и т.п.). Такие вычисления характерны для числовой обработки. Становление этого направления способствовало развитию математического моделирования технологических процессов, идентификации методов численного решения сложных математических задач, развитию языков программирования и т.п. Однако по мере распространения компьютеров и их совершенствования возникло другое направление использования средств вычислительной техники, которое предполагает отсутствие большого объема вычислений и их высокой точности. Однако объем хранимых данных велик. Кроме того, необходимо предварительно найти требуемую запись, обработать ее и определить форму вывода обработанных данных. Для этого требуются такие операции, как поиск и сортировка. Весь этот процесс характеризует нечисловую обработку данных на основе соответствующих моделей представления данных и знаний. Информационная система по своему составу напоминает предприятие по переработке данных и производству информации. Как и в любом производственном процессе, в информационной системе присутствует технология преобразования данных в другую информацию (рисунок 5.1). Рис. 5.1. Информационная технология как аналог технологии переработки материальных ресурсов 41 Под информационной технологией понимается система методов и способов сбора, накопления, хранения, поиска, обработки и передачи информации на основе применения средств вычислительной техники. Целью информационной технологии является производство информации для ее анализа человеком и принятия на его основе решения по выполнению какого-либо действия. Информационные технологии, могут отличаться по типу обрабатываемой информации, но могут объединяться в интегрированные технологии (рисунок 5.2). Рисунок 5.2. Классификация информационных технологий в зависимости от типа обрабатываемой информации Классификация, предложенная на этом рисунке, в известной мере условна, поскольку большинство информационных систем, как мы увидим в дальнейшем, позволяет поддерживать и другие виды информации. Так, табличные процессоры могут обрабатывать не только цифровую, но и текстовую информацию, а также обладают встроенным аппаратом генерации графиков. Однако каждая из этих технологий все-таки в большей мере акцентирована на обработку информации определенного вида. Рассмотрим назначение и дадим краткую характеристику основным типовым информационным технологиям. Информационные технологии сбора и обработки информации Анализ, что задачи, решаемые информационными системами, тесно связаны с задачами автоматизированных систем управления (АСУ). Особенностью создания цифровой системы промышленного предприятия является необходимость тесной интеграции автоматизированных систем управления технологическими процессами (АСУТП) и автоматизированными системами управления предприятием (АСУП). 42 Автоматизированная система управления (АСУ)  это человекомашинная система, обеспечивающая автоматизированный сбор и обработку информации, необходимой для оптимизации управления в различных сферах человеческой деятельности. Обычно среди АСУ выделяют автоматизированные системы управления производством (АСУП) и автоматизированные системы управления технологическими процессами (АСУ ТП). АСУП предназначена для основных задач управления производственно-хозяйственной деятельностью предприятия в целом и (или) его самостоятельных частей на основе применения математических методов и средств вычислительной техники. АСУ ТП предназначены для выработки и реализации управляющих воздействий на технологический объект управления в соответствии с принятым критерием управления. В наиболее общем случае АСУ ТП представляет собой замкнутую систему, обеспечивающую автоматизированный сбор и обработку информации, необходимой для оптимизации управления технологическим объектом в соответствии с принятым критерием, и реализацию управляющих воздействий на технологический объект. Функции АСУ ТП подразделяются на информационные, управляющие и вспомогательные. Информационные функции АСУ ТП - это функции системы, направленные на сбор и представление информации для последующей обработки. К информационным функциям АСУ ТП относят централизованный контроль и измерение технологических параметров, вычисление параметров процесса, формирование и выдачу текущих и обобщающих технологических и экономических показателей оперативному персоналу АСУ ТП, подготовку и передачу информации в смежные системы управления. К управляющим функциям АСУ ТП относят регулирование (стабилизацию) отдельных технологических параметров, логическое управление операциями или аппаратами, программное логическое управление оборудованием, оптимальное управление установившимися или переходными режимами или отдельными стадиями процесса, адаптивное управление объектами в целом и др. Вспомогательные функции состоят в обеспечении контроля состояния и функционирования технических и программных средств системы. Областью интересов информационных систем являются информационные и вспомогательные функции, в то время как управляющие функции не рассматриваются в информационных системах, а являются прерогативой теории управления, кибернетики и т.д. В зарубежной практике типовая архитектура АСУ ТП, как правило, включает в себя следующие уровни: - уровень Input Output, т.е. непосредственного взаимодействия с технологическим объектом, на котором осуществляется сбор данных от датчиков и воздействие на технологический процесс с помощью исполнительных меха43 низмов и регулирующих органов; - уровень Control, на котором осуществляется непосредственное управление технологическими параметрами. На этом уровне часто используются программируемые логические контроллеры  ПЛК (PLC  Programmable Logic Controllers) с открытой архитектурой или свободно программируемые контроллеры различных отечественных и зарубежных фирм: - уровень автоматизированного рабочего места оператора, включающий диспетчерскую систему сбора данных и управления технологическим процессом (SCADA-система). Это верхний уровень управления в системе АСУ ТП, на котором собирается необходимая информация от многих источников низшего уровня и который включает контуры управления и принятия решения не только на основе вычислительных средств, но и человека (оператора). На этом же уровне предусматривается решение задач оптимизации, прогнозирования технологического процесса. Здесь предусматривается использование мощных вычислительных ресурсов в экспертных и моделирующих системах реального времени. Заметим, однако, что в России, чаше всего, первые четыре уровня относят к АСУ ТП, а пятый уровень - к АСУП. Исторически сложилось так, что самый верхний уровень MPR (Manufacturing Resource Planning) и нижние три развивались независимо друг от друга и, следовательно, между собой никак не стыковались, т.е. фактически отсутствовал достаточно интеллектуальный интерфейс, который бы их объединял. Это стало тормозящим фактором на современном этапе развития промышленности, когда для эффективной работы производственного предприятия и для принятия на верхнем уровне как стратегических, так и тактических решений требуется его комплексная автоматизация. Основными недостатками традиционного варианта построения АСУ ТП является: - множество интерфейсов, сложность и запутанность связей между объектами; - несовместимость форматов данных и структуры сообщений; - сложность внесения изменений, что может вызвать переработку большого объема программ. Структурированный (системный) подход обеспечивает - нормализацию данных; - стандартные формы сообщений; - гибкие средства интеграции приложений, включая АСУП. Такой модульный систематизированный подход к построению АСУ ТП обеспечивает возможность эффективной модернизации системы, облегчает внесение в нее изменений, что в совокупности гарантирует защиту ранее вложенных инвестиций и уменьшает стоимость информационной системы в целом. Эволюция структуры управления технологическими процессами от традиционных АСУ ТП к структурированным показана на рисунке 5.3. Структу44 рированный подход предполагает многоуровневую организацию связей и каналов передачи информации. Рисунок 5.3. Эволюция структуры управления: а  традиционный подход; б  структурированный подход На самом нижнем уровне на вход управляющего вычислительного комплекса от датчиков (термопар, индуктивных датчиков, счетчиков продукции и др.) поступает измерительная информация о текущих значениях параметров, характеризующих ход технологического процесса (состояние и параметры заготовок, качество обработанных деталей, их количество и др.). Компьютер обрабатывает эту информацию в соответствии с принятым законом управления (алгоритмом управления), определяет управляющие воздействия, которые необходимо приложить к исполнительным механизмам для изменения управляемых параметров, с тем, чтобы управляемый процесс протекал оптимальным образом. Многие первичные преобразователи вырабатывают свои сигналы в виде напряжения, силы тока, сопротивления, угла поворота и т.п. в форме непре45 рывного (аналогового) сигнала. Подводимые к исполнительным механизмам управляющие воздействия должны вырабатываться в форме напряжений, т.е. также в аналоговой форме. Так как процессор компьютера оперирует с цифровыми величинами, то поступающие на его вход величины должны предварительно быть преобразованы в цифровую форму, а вырабатываемые управляющим вычислительным комплексом величины управляющих воздействий  из цифровой формы в аналоговую или дискретную, т.е. в соответствующие напряжения. Некоторые входные параметры (например, выдаваемые конечными выключателями, фотореле и др.) и некоторые выходные управляющие сигналы (например, включение двигателей) имеют релейный характер. Неотъемлемой частью автоматизированной системы управления технологическими процессами являются устройства связи с объектом, назначение которых заключается в сопряжении датчиковой аппаратуры и исполнительных механизмов контролируемого объекта и/или технологического процесса с вычислительными средствами системы. Устройство связи с объектом представляет собой комплекс в виде специализированных функциональных блоков, осуществляющий необходимый информационный обмен между технологическим объектом и управляющей информационной системой. Распределенность физических параметров и широкий диапазон их видов и размерностей на технологических объектах требуют многовариантного подхода к организации измерительных схем. Так, в одном случае превращение многоканальной информации в одноканальную осуществляется с помощью многоканального аналогового коммутатора, подключаемого на вход одного аналого-цифрового преобразователя, а в другом случае на каждый канал включается индивидуальный аналого-цифровой преобразователь. Преобразование многоканальной информации в одноканальную осуществляется с помощью цифрового мультиплексора. На этот мультиплексор данные поступают либо от аналого-цифрового преобразователя, либо от микропроцессорного измерительного блока. Ядром же многопроцессорной измерительной системы является аналого-цифровой преобразователь, входящий в состав любой современной измерительной процедуры. Современная идеология построения сложных автоматизированных систем управления технологическими процессами развивается в направлении применения распределенных принципов построения систем в противоположность централизованным. Объясняется это различными причинами, наиболее важными из которых являются: - значительное сокращение общих затрат на кабельную сеть, включающих как стоимость самих подключаемых кабелей, так и стоимость монтажных работ; - стремительное удешевление вычислительной техники, позволившее применять автономные вычислители в каждом из узлов АСУ ТП в непосредственной близости от исполнительных устройств и датчиков. 46 Появление распределенных АСУ ТП привело к необходимости разработки специальных сетевых решений, ориентированных на эксплуатацию в промышленных условиях (Fieldbus - промышленная сеть). Основными требованиями к ним являются: высокая помехозащищенность, достаточная скорость передачи и низкая степень стоимости соединительного кабеля. Сегодня никакой производитель не может поставлять всю номенклатуру изделий, требующихся в современных информационных системах. От специалистов требуется умение применять для построения информационных систем высокотехнологичные изделия различных компаний, и эти изделия должны быть совместимыми. Для гарантии совместимости изделий различных производителей необходимы открытые стандарты аппаратных и программных средств. Системы, являющиеся уникальными (их делает и поддерживает только один производитель), работающие по уникальным протоколам связи, получили название «Закрытые системы» (closed systems). Большинство таких систем зародилось во времена, когда проблема интеграции изделий других производителей не была актуальной. «Открытые системы» (open systems) приводят специфические требования в соответствие интересам всех. Только при использовании принципов открытых систем интеграция изделий разных производителей в одну сеть может быть решена без особых проблем. Открытость означает: - отсутствие патентов или авторских прав на спецификацию стандарта и его расширений; - отсутствие лицензионной платы за использование стандарта; - широкий доступ к спецификациям стандарта и его расширениям; - получение спецификаций в результате открытого обсуждения и конкурса между экспертами крупнейших промышленных ведущих мировых фирм-производителей и пользователей; - принадлежность прав собственности некоммерческим профессиональным национальным и международным организациям. Таким образом, архитектура современных информационных систем технологических процессов должна удовлетворять требованиям: - открытости: - стандартности; - модульности; -распределенности. Информационные технологии хранения данных. Системы управления базами данных По мере распространения компьютеров и их совершенствования (главным образом, запоминающих устройств, сохраняющих информацию после выключения электрического питания) возникло направление использования 47 средств вычислительной техники, которое предполагает отсутствие большого объема вычислений и их высокой точности. Однако объем хранимых данных велик. Кроме того, необходимо предварительно найти требуемую запись, обработать ее и определить форму вывода обработанных данных. Для этого требуются такие операции, как поиск и сортировка. Весь этот процесс характеризует нечисловую обработку данных. В этом случае информационная система - это программно-аппаратный комплекс, функциями которого являются: - надежное хранение информации в электронном виде; - предоставление доступа к информации пользователям системы; - выполнение функций по преобразованию информации, специфичных для данного приложения: - предоставление удобного интерфейса для конечных пользователей. В сегодняшних условиях устройства хранения информации стремительно дешевеют, что оказывает существенное влияние на развитие информационных систем. Современные информационные системы характеризуются тем, что они - имеют дело с большими объемами информации, которые во много раз превышают объем оперативной памяти, вся информация расположена на устройствах внешней памяти; - работают, как правило, в многопользовательском режиме и в реальном времени; - относятся к классу mission-critical applications, то есть приложений, нестабильность работы которых ведет к серьезным убыткам; - развиваются, как правило, постепенно, а не сразу целиком, что повышает ответственность проектировщика и разработчика; - обеспечивают «среднее» время ответа для всех пользователей, причем время ответа существенно не увеличивается при росте числа одновременно работающих пользователей. Сложность таких систем состоит не в алгоритмах обработки данных, а в том, что они велики сами по себе, то есть широки по номенклатуре и объему обрабатываемой информации, сложны по структуре аппаратной платформы и программного обеспечения, а также часто территориально распределены. Все это требует особенной тщательности при планировании, проектировании и реализации. Ошибки на начальных стадиях создания информационной системы особенно дороги. Cовременный подход к организации данных предполагает использование концепции централизованного управления данными. Создание базы данных, ее поддержка и обеспечение доступа пользователей к ней осуществляется с помощью специального программного инструментария  системы управления базами данных (СУБД). К основным задачам, которые решаются СУБД, относятся: - хранение информации; - контроль и защита информации; 48 - просмотр и поиск нужной информации; - выборка необходимых данных: - ввод и редактирование информации; - формирование отчетов. Таким образом, система управления базами данных  это комплекс программных средств, необходимых для создания баз данных, поддержки их в требуемом состоянии и организации поиска в них необходимой информации. Модельные системы поддержки принятия решений Модельные системы поддержки принятия решений и соответствующие им информационные технологии появились в основном в 70-80-е годы, чему способствовали развитие теории моделирования, математики, в особенности численных методов решения, широкое распространение персональных компьютеров, стандартных пакетов программ. Модельные системы поддержки принятия решений представляют собой вид компьютерных информационных систем, которые создаются на основе данных и математических моделей и помогают лицу, принимающему решение (ЛПР), осуществлять выбор наилучших альтернатив в условиях плохо структурированных задач. Задачи считаются хорошо структурированными, если лицу, принимающему решение, известны все их элементы и взаимосвязи между ними. Обычно при таком высоком уровне понимания задачи удается выразить ее содержание в форме математических моделей и точных алгоритмов решения. Целью использования информационных систем для решения структурированных задач является практически полная автоматизация их решения. Решение хорошо структурированных задач по жестким, раз и навсегда созданным алгоритмам, производится компьютером и, в принципе, не требует участия технолога (ЛПР). Задачи, по которым ЛПР не удается выделить отдельные элементы и установить связи между ними, называются неструктурированными. Для решения неструктурированных проблем компьютер оказывается бесполезным, здесь основная работа остается за технологом (человеком). В практике управления технологическими процессами имеется сравнительно немного полностью структурированных или совершенно неструктурированных задач. О большинстве же задач можно сказать, что ЛПР имеет о них неполное представление, зная лишь часть их элементов и связей между ними. Такие задачи называются плохо структурированными. Именно такие задачи чаше всего и возникают при управлении технологическими процессами, качеством продукции и т.п. Решение плохо структурированных задач требует использования компьютера совместно с усилиями человека (производственного персонала, лица, принимающего решение). При этом информационные системы 49 могут оказывать лицу, принимающему решение, три вида поддержки: информационную, модельную и экспертную. Главной особенностью модельных систем поддержки принятия решений является качественно новый метод организации взаимодействия человека и компьютера. Выработка решения, что является основной целью этой технологии, происходит в результате итерационного процесса (рисунок 5.4), в котором участвуют: • система поддержки принятия решений в роли вычислительного звена и объекта; • человек как управляющее звено, задающее входные данные и оценивающее полученный результат вычислений на компьютере. Рисунок 5.4 Технология модельной системы поддержки принятия решений как итерационный процесс Окончание итерационного процесса происходит по воле человека (оператора, технолога, лица, принимающего решение). Рассмотрим в самом общем виде структуру модельной системы поддержки принятия решений. В состав модельной системы поддержки принятия решений входят три главных компонента (рисунок 5.5): 1) база данных; 2) база моделей; 3) система управления интерфейсом между пользователем и компьютером. Рисунок 5.5 Основные компоненты модельной системы поддержки принятия решений 50 База данных в модельной системе поддержки принятия решений играет важную роль, поскольку данные могут использоваться непосредственно пользователем для расчетов при помощи математических моделей. База моделей (комплекс различных моделей) используется для описания и оптимизации процесса. Без моделей осуществлять процессы в информационных системах можно только методом проб и ошибок, что неприемлемо на современном производстве. Заметим, что комплекс математических моделей является основой модельной системы поддержки принятия решения. Пользователь имеет возможность получить недостающую ему информацию для принятия решения с помощью модели, что облегчает выработку и оценку альтернатив. Система управления базой моделей (СУБМ) должна обладать следующими возможностями: создавать новые модели или изменять существующие, поддерживать и обновлять параметры моделей (осуществлять идентификацию параметров). Система управления интерфейсом определяет язык пользователя, язык сообщений компьютера, организующий диалог на экране дисплея. Язык пользователя - это те действия, которые пользователь производит в отношении системы путем использования возможностей клавиатуры, мыши и т.п. Язык сообщений - это то, что пользователь видит на экране дисплея, данные, полученные на принтере, звук и т.п. В процессе диалога пользователь должен реализовать свои знания. Сюда относится не только план действий, находящийся в голове у пользователя, но и инструкции, справочные данные, запрашиваемые у системы. Инструкции и справочные данные, выдаваемые системой по просьбе пользователя, обычно не стандартны, а специализированы с точки зрения сложившейся ситуации. Экспертные системы Наибольший прогресс среди компьютерных информационных систем отмечен в области разработки экспертных систем, основанных на использовании искусственного интеллекта. Термин "искусственный интеллект" впервые ввел Джон Маккарти, профессор Стэндфордского университета, автор многих ярких работ по программированию. Он же провел и первую конференцию по искусственному интеллекту. Интерес к теории искусственного интеллекта и его созданию во всем мире существенно возрос после того, как Япония объявила в 1979 г. о проекте создания ЭВМ пятого поколения, обладающих возможностью интеллектуального диалога с непрограммирующими пользователями. Под искусственным интеллектом обычно понимают способности компьютерных систем к таким действиям, которые назывались бы интеллектуальными, если бы исходили от человека. Чаше всего здесь имеются в виду способности, связанные с человеческим мышлением. Работы в области 51 искусственного интеллекта включают в себя создание роботов, систем, моделирующих нервную систему человека, способность к обучению, распознавание образов и т.д. В промышленности наибольшее распространение получили, так называемые экспертные системы. Главная идея использования экспертных систем заключается в том, чтобы получить от эксперта его знания, формализовать их на основе соответствующих математических моделей представления знаний и, загрузив их в память компьютера, использовать всякий раз, когда в этом возникнет необходимость. Знания существуют в двух видах - коллективный опыт и личный опыт. Если большая часть знаний в предметной области представлена в виде коллективного опыта (например, теория тепломассопереноса), то эта предметная область не нуждается в экспертных системах (рисунок 5.6). Рисунок 5.6 Предметная область, не пригодная для создания экспертных систем Если в предметной области большая часть знаний является личным опытом специалистов высокого уровня – экспертов или эти знания по какимлибо причинам слабо структурированы, то такая предметная область, скорее всего, нуждается в экспертной системе (рисунок 5.7). Рисунок 5.7 Предметная область, пригодная для создания экспертных систем Являясь одним из основных приложений искусственного интеллекта, экспертные системы предназначены для моделирования или имитации поведения опытных специалистов-экспертов при решении задач по какому-либо узкому вопросу. 52 Таким образом, экспертные системы представляют собой компьютерные программы, трансформирующие опыт экспертов в какой-либо области знаний в форму эвристических правил. Заметим, что в экспертных системах мы имеем дело с использованием принципиально нового компонента информационных технологий - базы знаний, которая содержит факты, описывающие проблемную область, а также логическую взаимосвязь этих фактов. Напомним, что знания - это выявленные закономерности предметной области (принципы, законы, связи), позволяющие решать задачи в этой области. Заметим, что наряду с числовой обработкой данных (используемых в основном при математическом моделировании процессов) и нечисловой обработкой данных (в системах управления базами данных) компьютеры применяются в новой области  моделирование и хранение знаний. В последнем случае программно-технические средства используются для решения неформализованных задач, которые можно сформулировать и решить не в числовом виде, а лишь в смысловом представлении на ограниченном естественном языке. В самом общем виде структура экспертной системы представлена на рисунке 5.8. Она включает в себя интерфейс пользователя, базу знаний и интеллектуальный редактор базы знаний. Интерфейс пользователя – это комплекс программ, реализующий диалог пользователя с экспертной системой, как на стадии ввода, так и получения результатов. Интеллектуальный редактор базы знаний – программа, представляющая возможность эксперту создавать базу знаний в диалоговом режиме. Рисунок 5.8 Структура экспертной системы Экспертные системы похожи на модельные системы поддержки принятия решения в том смысле, что и те и другие обеспечивают высокий уровень поддержки принятия решений. Однако они имеют два существенных различия. Первое отличие связано с тем, что решение проблемы в рамках модельных систем поддержки принятия решений отражает уровень ее понимания пользователем и его возможности получить и осмыслить решение. Экспертная система, наоборот, предлагает пользователю принять решение, превосходящее его возможности. Второе отличие выражается в способности экспертной системы пояснять свои рассуждения в процессе получения решения. Очень часто эти пояснения оказываются более важными для пользователя, чем само решение. 53 Контрольные вопросы и задания 1. Что понимается под объектом моделирования? 2. Что такое гипотеза в моделировании? 3. Дайте определение модели. 4. Что такое математическая модель? 5. Приведите пример аналогии в физических процессах. 6. Дайте классификацию процессов как объектов моделирования. 7. Чем отличаются стохастические процессы от детерминированных? 8. Опишите постановку задачи моделирования в общем виде. 9. Дайте общую классификацию математических моделей. 10.Какова структура модели математического программирования? 11.Что понимают под структурно-параметрическим описанием объекта моделирования? 12.В чем состоит различие между линейными и нелинейными моделями?. 13.В каких случаях используется корреляционный коэффициент, а в каких  корреляционное отношение как критерий адекватности модели? 14.Дайте классификацию моделируемых процессов по характеру их протекания. 15.Какие параметры моделируемого процесса относятся к экзогенным? 16.Какие параметры относятся к эндогенным? 17.Перечислите типовые математические схемы для моделирования. 18.Дайте понятие идентификации в широком и узком смысле. 19.Опишите структурную схему процесса идентификации. 20.Что понимают под структурной идентификацией? 21.Перечислите методы структурной идентификации и дайте их краткое описание. 22.Охарактеризуйте особенности идентификации стохастических и динамических моделей. 23.Что является критерием идентичности модели и объекта? 24.Какие задачи необходимо решить при выборе структуры объекта? 25.Какова цель параметрической идентификации? 26.Что такое функция локальной невязки? 27.Какие критерии могут быть использованы в качестве суммарной невязки? 28.При каком значении относительной невязки модель считается адекватной? 29. Перечислите источники возникновения и распространения погрешностей. 54 РАЗДЕЛ 2. МЕТОДЫ МОДЕЛИРОВАНИЯ ИНФОРМАЦИОННЫХ ПРОЦЕССОВ НА ОСНОВЕ ТИПОВЫХ МАТЕМАТИЧЕСКИХ СХЕМ Лекция 6. Моделирование с помощью абстрактных автоматов  Общие сведения  Способы задания автоматов  Примеры абстрактных автоматов, выполняющих полезные действия  Регулярные выражения и конечные автоматы  Алгоритмы и машины Тьюринга  Клеточные автоматы Общие сведения Автоматом называют устройство (или совокупность устройств), которое без непосредственного участия человека выполняет процессы приема, преобразования и передачи энергии, материалов или информации в соответствии с заложенной в него программой. Для математического моделирования таких устройств используется аппарат теории абстрактных автоматов. Абстрактный автомат (дискретный преобразователь информации) представляет собой множество, состоящее из шести элементов: S = {X, Q, Y, δ, λ, q1} где S – абстрактный автомат; X – множество входных символов (входной алфавит автомата): X = {x1, ... , xm}; Q – множество состояний автомата: Q = {q1, ... , qn}; Y – множество выходных символов (выходной алфавит автомата): Y = {y1, ... , yp}; δ – функция переходов автомата из одного состояния в другое: qj = δ(qi, xk), qj – следующее (новое) состояние автомата; qi – текущее состояние автомата; xk – текущий входной символ; λ – функция выходов: yl = λ (qi, xk); q1 – начальное состояние автомата (применяется также обозначение q0). Автомат называется конечным, если множества X, Q, Y – конечны. В этом случае не только множества входных символов X, выходных – Y и состояний Q дискретны (рис. 6.1), но и множество моментов, в которые поступают входные символы, выдаются выходные символы и меняются состояния. Будем называть интервал T, разделяющий дискретные моменты, тактом ав55 томата. Тогда каждый момент tn = nT, n =1, 2,…. Если T = 1, то t = n, т. е. дискретное время сопоставляется упорядоченному ряду натуральных чисел. X S Y . 0 1 2 3 . . t Рисунок 6.1 Схема абстрактного автомата Абстрактный автомат можно рассматривать как "черный ящик" с одним входом и одним выходом, с которым можно экспериментировать, не зная, что находится внутри. Выходной символ (yl  Y) зависит не только от входного символа (x  X), но и от того, в каком состоянии (qi  Q) находится автомат. Автомат функционирует в дискретном времени; это означает, что элементы описания автомата заданы только в упомянутые выше дискретные моменты. Представим, что с некоторого начального, например, нулевого момента времени на вход автомата подаются входные символы, образующие входное слово некоторой длины (длина любого i-го слова измеряется числом символов). На выходе получаем выходное слово той же длины (рис. 6.2). . . .. 0 1 2 3 . . Xi 1 Xi 2 Xi 3 Xi 4 s Yi 1 Yi 2 Yi 3 Yi 4 Рисунок 6.2. Преобразование входных слов в выходные Сказанное означает, что автомат может рассматриваться как преобразователь входных слов в выходные с сохранением длины слов. Символы алфавитов, присутствующие на входе и выходе автомата, будем также называть входными и выходными сигналами. На практике широкое распространение получили две основные модели, описывающие функционирование абстрактного автомата: 1. Модель Мили; 2. Модель Мура. Модель Мили. Законы функционирования автомата Мили представлены следующим образом: q(t+1) = δ(q(t), x(t)), y(t) = λ(q(t), x(t)), где t – текущий момент времени; t+1 – следующий момент времени; q(t+1) – состояние автомата в следующий момент времени; q(t), x(t), y(t) – элементы описания автомата в текущий момент времени,  и   известные функции. 56 Модель Мура. Законы функционирования автомата Мура представлены следующим образом: q(t+1) = δ(q(t), x(t)) y(t) = λ(q(t)) В данной модели выходной сигнал явно зависит только от состояния, а косвенно – и от входного сигнала. Любой автомат можно спроектировать по той или иной модели. Способы задания автоматов Рассмотрим два основных способов задания автоматов: Табличный способ 1) Автомат Мили Для автомата Мили табличный способ заключается в построении двух таблиц: таблицы переходов и таблицы выходов (рис. 6.3). x\q … qi … . . . xk (qi,xk) . . . x\q … qi … . . . xk (qi,xk) . . . а б Рис. 6.3 Табличный способ: а – таблица переходов, б – таблица выходов. Например, таблица переходов может иметь следующий вид. x\q x1 x2 q1 q2 q3 q3 q1 q1 q2 q3 q2 Соответственно, таблица выходов может быть записана в следующей форме. x\q q1 q2 q3 x 1 y1 y1 y2 x 2 y1 y2 y1 2) Автомат Мура Таблица переходов и таблица выходов объединяются, и добавляется строка выходных сигналов, соответствующих состояниям автомата. На рисунке 6.4 показана таблица переходов и выходов для автомата Мура. 57 … (qi,xk) … x\q … . . . xk . . . … qi (qi,xk) Рисунок 6.4 Таблица переходов и выходов Например, таблицу переходов и выходов можно задать в следующем виде. y1 x\q q1 x1 q2 x2 q4 y1 q2 q5 q2 y3 q3 q5 q2 y2 q4 q3 q1 y3 q5 q3 q1 Способ задания графами Автомат представляется ориентированным связным графом (орграфом), вершины которого соответствуют состояниям автомата, а дуги – переходам из состояния в состояние. Обозначения входных и выходных сигналов распределяются в автоматах Мили и Мура по-разному. Построим графы для автоматов Мили и Мура по вышеприведенным таблицам (рисунки 6.5 и 6.6). x2/y 1 q1 q2 x1/y 1 x2/y 2 x1/y 2 x1/y 1 x2/y 1 q3 Рисунок 6.5. Представление автомата Мили в виде графа Следует заметить, что в автомате Мили выходной сигнал вырабатывается при переходе, а в автомате Мура присутствует в течение всего периода дискретного времени, пока автомат находится в данном состоянии. 58 x q 1 /y x 1 q 1 x x x 2 x 1 2 2 /y 1 1 x 2 q 5 /y 3 x x 1 q 3 2 /y 3 2 q 4 /y 2 x 1 Рис. 6.6. Представление автомата Мура в виде графа В данном курсе рассматриваются только детерминированные автоматы, т. е. автоматы, в которых имеется полная определенность переходов из всех состояний в зависимости от входных сигналов (под действием одного и того же сигнала автомат не может переходить из любого рассматриваемого состояния в различные состояния). Фрагмент графа, изображенный на рисунке 6.7, не может относиться к детерминированному автомату. x qr qi qs x Рисунок 6.7 Фрагмент графа, иллюстрирующий неопределенность переходов Состояние автомата qi называется устойчивым, если для любого входного сигнала хk , такого, что δ(qs , xk) = qi , справедливо соотношение: δ(qi , xk) = qi . (здесь qs – состояние, предшествующее qi). Это означает, что, автомат не изменяет своего состояния при повторении на следующем такте сигнала, приведшего его в состояние qi . Фрагмент графа, иллюстрирующий устойчивость состояния, приведен на рисунке 6.8. xk xk qi qs Рисунок 6.8 Устойчивое состояние автомата Автомат называется асинхронным, если каждое его состояние qi  Q (i = 1, … , n) устойчиво; в противном случае автомат называется синхронным. Синхронные автоматы важны для теории, а на практике чаще используются 59 асинхронные; устойчивость состояний в асинхронных автоматах достигается введением специальных сигналов синхронизации. Примеры абстрактных автоматов, выполняющих полезные действия Автомат для задержки сигнала на один такт (для запоминания на один такт) Опишем данный автомат таблицами и графом. Таблица переходов и таблица выходов: x\q q0 q1 x0 q 0 q 0 x1 q 1 q 1 x\q q0 q1 x0 y0 y1 x1 y0 y1 Поскольку автомат является двоичным, введем обозначения: x0 = y0 = 0; x1 = y1 = 1. Тогда граф автомата примет форму, изображенную на рисунке 6.9. 0/0 q0 1/0 0/1 q1 1/1 Рисунок 6.9 Граф автомата для задержки сигнала на один такт Простой анализ показывает, что выходной сигнал в текущем такте повторяет входной, который был на такт раньше. Автомат для проверки двоичной последовательности на четность. Опишем данный автомат таблицами и графом. Таблица переходов и таблица выходов: x\q q0 q1 x0 q 0 q 1 x1 q 1 q 0 x\q q0 q1 0 0 1 1 1 0 Граф автомата показан на рисунке 6.10. 60 0/0 q0 1/1 1/0 q1 0/1 Рисунок 6.10. Граф автомата для проверки двоичной последовательности на четность Анализ показывает, что «0» на выходе автоматически вырабатывается при четном числе единиц на входе, а «1» на выходе вырабатывается при нечетном числе единиц на входе. Оба рассмотренных автомата имеют "слабую" память, но слабую в разном смысле. У первого автомата "короткая" память во времени (помнит только один сигнал). У второго автомата память "длинная" (длина входной последовательности может быть любой), но он различает (распознает) лишь два класса последовательностей. Автомат для задержки сигнала на два такта. Автомат имеет четыре состояния, закодированных двумя двоичными разрядами: q0 = 00; q1 = 01; q2 = 10; q3 = 11 (рисунок 5.11). 0/0 00 1/0 01 1/0 1/1 0/0 10 0/1 11 1/1 0/1 Рисунок 6.11. Граф автомата для задержки сигнала на два такта Достоинства примененного кодирования:  первая цифра кода состояния показывает, какой сигнал выдает автомат (он легко преобразуется в автомат Мура); вторая цифра кода показывает, под действием какого сигнала автомат приходит в данное состояние.  легко проверить, что выходной сигнал повторяет входной через два такта. 61 Двоичный последовательный сумматор, реализованный для одного разряда входного кода. Автомат имеет два состояния (рисунок 6.12): q0 – нет переноса (сложение цифр операндов не требует учета единицы переноса из предыдущего разряда кода); q1 – есть перенос (единица переноса должна быть учтена). 1 0/1 0 1/1 0 0/1 1 0/0 q1 q0 1 1/0 0 0/0 0 1/0 1 1/1 Рисунок 6.12. Граф одноразрядного двоичного последовательного сумматора В числителе "дроби", записанной при каждой из дуг графа, указаны цифры слагаемых; в знаменателе – результат суммирования в текущем разряде. Сумматор позволяет суммировать двоичные последовательности произвольной длины. Регулярные выражения и конечные автоматы Рассмотрим структуру рекурсивных определений, которые применяются как средство строгого математического описания классов объектов. Рекурсивное определение некоторого класса K включают следующие части: база, рекурсия и ограничение. База определяет один или несколько простейших объектов класса К. Рекурсия состоит из одного или нескольких пунктов. В каждом пункте говорится, что если определенные виды объектов принадлежат классу К , то и другие объекты, построенные из первых по некоторому правилу, также принадлежат классу К. Число пунктов рекурсии соответствует числу правил. Ограничение устанавливает, что никакие объекты, кроме тех, которые построены посредством применения базы и рекурсии, не принадлежат классу К. Пример. Рекурсивное определение правильного скобочного выражения (ПСВ). БАЗА: ( ) – ПСВ; РЕКУРСИЯ: а) если А – ПСВ и В – ПСВ, то АВ – ПСВ; б) если А – ПСВ, то (А) – ПСВ; ОГРАНИЧЕНИЕ: никаких других ПСВ нет. Отметим, что в определении использованы метасимволы А и В, обозначающие любые ПСВ; выражение АВ обозначает конкатенацию (последовательную запись) А и В. 62 Существует тесная связь между возможностями конечных автоматов и теми входными последовательностями, которые автомат распознает. Будем говорить, что автомат S распознает последовательность входных сигналов, если эта последовательность приводит к тому, что автомат переходит в заранее обусловленное состояние или выдает обусловленный выходной сигнал. Можно построить автомат, распознающий, например, слова некоторого языка, то есть отличающий "правильное" входное слово от недопустимого в данном языке входного слова. Определим рекурсивно класс R регулярных выражений на заданном алфавите . БАЗА: Любой однобуквенный символ x   – регулярное выражение (x  R ). РЕКУРСИЯ: а) если E – регулярное выражение и F – регулярное выражение, то E  F (выбор) – регулярное выражение ((E  F)  R ); б) если E – регулярное выражение и F – регулярное выражение, то EF – регулярное выражение (EF  R ); в) если E – регулярное выражение, то и E* – регулярное выражение (E*  R ). ОГРАНИЧЕНИЕ: никаких других ПСВ нет. В приведенном определении E и F – метасимволы, обозначающие любые регулярные выражения; E* – любое число повторений E, включая и отсутствие E. Приоритет введенных операций возрастает в порядке их перечисления. Теорема Клини: 1. Конечный автомат может распознавать лишь регулярные множества последовательностей. 2. Любое регулярное множество последовательностей может быть распознано некоторым конечным автоматом. Принципиальная важность теоремы Клини заключается в том, что она устанавливает ограничения на возможности конечных автоматов; в теории алгоритмов доказано, что любое вычисление может быть сведено к распознаванию. Как уже отмечалось, автомат может рассматриваться как преобразователь слов в алфавитах; однако не всякое преобразование слов может быть реализовано автоматом. Другими словами, не всякое отображение входных слов в выходные является автоматным. Условия автоматности отображения: 1. Отображение должно быть однозначным: каждому входному слову сопоставляется единственное выходное слово. 2. Область определения отображения должна удовлетворять условиям полноты. Это означает, что если в область определения входит некоторое слово, то и все его начальные отрезки также входят в область определения. 63 3. Отображение должно сохранять длину слова (каждое входное слово отображается в выходное слово той же длины). 4. Отображение должно переводить любой начальный отрезок входного слова в начальный отрезок выходного слова той же длины. Условия автоматности накладывают жесткие ограничения на класс отображений, реализуемых автоматом. На практике большинство отображений не удовлетворяют условиям автоматности. Однако существует стандартный прием, который позволяет превратить любое алфавитное отображение в автоматное. При этом используются две операции. Операция выравнивания длин слов. Во входной и выходной алфавит добавляется по одной "пустой" букве (пропуск такта): ε, δ, соответственно; ε приписывается один раз или многократно к концу входных слов, δ приписывается один раз или многократно к началу выходных слов. В последовательной процедуре выравнивания на каждом шаге добавляется не более чем по одной букве ε и δ, с последующей операцией пополнения. Операция пополнения. Применяется к выровненным отображениям и заключается в распространении отображения на начальные отрезки слов. Пример: Проверим автоматность отображения: 000 –> 001, 001 –> 011. Решение: 0 –> 0, 00 –> 00, 00 –> 01. Из двух последних строк следует, что отображение не однозначно. Добавим по одной пустой букве к входным и выходным словам: 000ε –> δ001, 001ε –> δ011. Проверим выполнение однозначности: 0 –> δ, 00 –> δ0, 000 –> δ00, 001 –> δ01. Неоднозначность устранена – отображение удовлетворяет условиям автоматности. В данном примере мы применили последовательную процедуру приведения отображения к автоматному, при этом оказалось достаточным однократное приписывание пустых букв к входным и выходным словам. Существует стандартная процедура выравнивания: к входному слову приписывается столько букв ε, какова длина выходного слова, и, соответственно, к выходному слову приписывается столько букв δ, какова длина входного слова. Применительно к рассмотренному примеру автоматное отображение будет в этом случае следующим: 000 –> 001, 001 –> 011. 64 Алгоритмы и машины Тьюринга В данном разделе рассматриваются более мощные (по сравнению с конечными автоматами) модели устройств, выполняющих вычисления, – машины Тьюринга. Анализ показал, что с помощью машин Тьюринга можно реализовать любой алгоритм. Одновременно машина Тьюринга служит для уточнения самого понятия алгоритма и его формализации, поскольку, как установлено в теории вычислений, широко применяемые словесные определения алгоритма не являются точными и исчерпывающими. Рассмотрим, например, следующее определение. Алгоритм – это определенное на некотором языке конечное предписание (способ, рецепт), задающее дискретную последовательность исполнимых элементарных операций для решения проблемы. Процесс выполнения предписания состоит из отдельных шагов, на каждом из которых выполняется одна очередная операция. Это определение, понятное в интуитивном смысле, не является формальным. Употребленные в нем термины "предписание", "элементарная операция", а также объекты, к которым применяется алгоритм, требуют уточнения, если мы хотим говорить об алгоритмах строго. Алгоритмы в интуитивном смысле не являются математическими объектами, к ним не применимы формальные исследования и доказательства. Так, сравнение двух алгоритмов по эффективности, проверка их эквивалентности и т. д., возможны только на основе их формального представления. Машина Тьюринга представляет собой бесконечный автомат, благодаря бесконечной (потенциально) ленте, разбитой на ячейки (рисунок 6.13). В ячейках записываются символы некоторого алфавита машины Тьюринга. Имеется также конечный автомат с головкой записи и считывания (ГЗЧ). ГЗЧ обозревает одну ячейку ленты в текущий момент дискретного времени. - бесконечная лента МТ Рисунок 6.13. Машина Тьюринга Функции ГЗЧ: считывание символа из обозреваемой ячейки; запись символа в обозреваемую ячейку; передвижение влево или вправо на одну ячейку. В каждый момент времени машина Тьюринга описывается следующей пятеркой: (qi, sj, δ(qi, sj), λ(qi, sj), d(qi, sj)), где qi – состояние машины Тьюринга в текущий момент времени; sj – обозреваемый символ в текущий момент времени; δ – функция переходов, которая определяет следующее состояние; λ – функция выходов, определяющая запись нового символа в обозреваемую ячейку; d – функция, определя65 ющая передвижение головки влево (L) или вправо (R) на один шаг. Более краткое обозначение элементов пятерки: (qi , sj , qij , sij , dij). Тезис Тьюринга: Любой процесс, который было бы естественно назвать эффективной процедурой, может быть реализован машиной Тьюринга. Следует подчеркнуть, что тезис – это, в общем случае, правдоподобное утверждение, которое не обязательно математически строго доказано. Однако многие научные тезисы действенны, так как прошли проверку временем и практикой. Машина Тьюринга представляет собой простой базис для описания эффективных процедур, поскольку все шаги, регламентирующие поведение автомата, определяются четкими правилами. В современной терминологии, машина Тьюринга – простой базис для описания алгоритмов и уточнения самого понятия алгоритма. В приведенных выше примерах для каждого вычисления использовался свой специальный конечный автомат – так называемая конкретная машина Тьюринга. Конечный автомат в конкретных машинах Тьюринга играет роль алгоритма вычислений. Можно считать, что любая машина Тьюринга вычисляет некоторую функцию (заключительное содержимое ленты) от заданного аргумента (исходное содержимое ленты). В связи с этим возникло понятие: функция, вычислимая по Тьюрингу. Тьюринг показал, как построить универсальную машину Тьюринга, которая интерпретирует поведение любой конкретной машины Тьюринга и, следовательно, может вычислить любую функцию, которую вычисляет конкретная машина Тьюринга. Универсальная машина Тьюринга имеет структуру, показанную на рисунке 6.14. M qi sj ... q0 Рисунок 6.14. Структура Универсальной машины Тьюринга Левая часть ленты (до символа qi) имитирует ленту конкретной машины Тьюринга, правая – содержит описание автомата конкретной машины Тьюринга в виде пятерок. Символ М показывает расположение ГЗЧ конкретной машины Тьюринга; будем считать, что обозреваемый символ находится справа от символа М. Пара ячеек qi, sj – зона режима, указывающая текущее состояние и текущий обозреваемый символ (на рисунке это символ "0"). Работа универсальной машины Тьюринга: машина начинает работу с запоминания символов qi, sj зоны режима, затем ГЗЧ движется вправо до тех пор, пока не найдет пятерку, в которой первые два символа совпадают с символами зоны режима. Найдя такую пятерку, универсальная машина Тьюрин66 га запоминает qij, sij, dij , и ГЗЧ движется влево. Далее выполняются следующие действия: a) qi : = qij , т. е. в зону режима записывается символ, обозначающий новое состояние автомата конкретной машины Тьюринга; b) справа от М записывается sij ; c) выполняется сдвиг М согласно значению dij (L или R), что соответствует передвижению ГЗЧ имитируемой машины; d) запоминается новый обозреваемый символ (справа от М) и переносится в зону режима в качестве sj . Таким образом, зона режима оказывается обновленной, и указанные действия повторяются до останова машины. Вариант формулировки тезиса Тьюринга: Вычислимы те, и только те, объекты, которые могут быть вычислены универсальной машиной Тьюринга. Согласно Тьюрингу, алгоритмом можно считать только ту процедуру, закодированную для машины Тьюринга, которая приводит к останову машины. В связи с этим возникает вопрос: существует ли универсальный распознаватель алгоритмов, т. е. машина Тьюринга, которая для любой другой машины Тьюринга определит, остановится последняя или нет. Этот вопрос назван в теории машин Тьюринга проблемой останова. Доказано, что проблема останова неразрешима и, следовательно, универсального распознавателя алгоритмов не существует. Существуют и другие алгоритмически неразрешимые проблемы, к доказательству неразрешимости которых привлекается механизм вычислений, введенный Тьюрингом. Простые системы (базисы) для решения проблем вычислимости создали независимо друг от друга и другие выдающиеся исследователи в области теории алгоритмов: А. Черч (математический аппарат рекурсивных функций), А. А. Марков (нормальные алгорифмы, сводящиеся к преобразованию слов в некотором алфавите), Э. Пост (механизм преобразования двоичных последовательностей, подобный машине Тьюринга). Все названные системы равноценны с точки зрения их принципиальных возможностей и эквивалентны как формализмы для определения алгоритма. Клеточные автоматы Клеточные автоматы являются частным случаем конечных автоматов, используемых для моделирования динамического поведения однородных сред (движение однородной жидкости, распространение или размещение информации и т. д.). При этом пространство и время считаются дискретными, а физические величины в каждой точке моделируемой среды могут принимать конечное множество дискретных значений. Для клеточных автоматов существует достаточно развитая теория. В ее основу легли работы Дж. Фон Неймана, который в 1948 году ввел в науку само понятие клеточный автомат при 67 разработке первой компьютерной модели самовоспроизводства. Клеточный автомат можно представить, как регулярную решетку (или «таблицу») ячеек («клеток»), каждая из которых может находиться в конечном числе возможных состояний, например 0 или 1. Состояние системы полностью определяется значениями переменных в каждой клетке. Важными особенностями клеточных автоматов являются следующие:  состояние каждой ячейки обновляется в результате выполнения последовательности дискретных постоянных шагов во времени (тактов);  переменные в каждой ячейке изменяются одновременно («синхронно»), исходя из значений переменных на предыдущем шаге;  правило определения нового состояния ячейки зависит только от локальных значений ячеек из некоторой окрестности данной ячейки. Широко используются клеточные автоматы для моделирования динамического поведения двумерных сред. Каждой частице такой среды, занимающей некоторое пространство, ставится в соответствие элементарный автомат, имеющий форму квадрата (реже треугольника или шестиугольника) и именуемый клеткой. Совокупность всех клеток образует клеточное пространство, в котором функционирует клеточный автомат. Отдельная клетка имеет конечный набор состояний Q, а выходные сигналы клеток есть номера их состояний. Функция переходов  определяется текущим состоянием q клетки, а также состоянием ее окружения. В зависимости от свойств объекта выбирают различные типы окрестностей. В простейших случаях в качестве окрестности принимают четыре или восемь ближайших клеток (рисунок 6.15). Однако возможны ситуации, когда состояние клетки зависит от состояния более удаленных клеток. Рисунок 6.15 Типы окрестностей. Чтобы исключить особый вид окрестности для клеток, лежащих в крайних рядах, область замыкают, т.е. для клеток крайнего левого столбца соседями слева считают соответствующие клетки крайнего правого столбца, и наоборот. Аналогичное замыкание выполняют для клеток верхнего и нижнего ряда области. В результате можно считать, что рассматриваемая сово68 купность клеток лежит на поверхности тора. Подобный прием в моделировании называется заданием граничных условий циклического типа. Функцию переходов  для клетки принято называть множеством правил клеточного автомата. Наиболее известным примером клеточного автомата считается автомат «Жизнь», придуманный в 1970 г. Дж. Конвеем. Множество правил для этого автомата состоит в следующем:  клетка может находиться в двух состояниях – пассивном и активном;  в качестве окрестности рассматривается восемь соседних клеток;  если в окрестности пассивной клетки две активных, то данная клетка также становится активной («рождается»);  если в окрестности активной клетки три или более активных клеток, то она становится пассивной («умирает»). В начальный момент времени дается некоторое распределение активных и пассивных клеток. Исходя из текущего распределения активных и пассивных клеток, определяется состояние клеток на следующем шаге по времени (такте). В зависимости от вида начального распределения приходим к различным эволюциям состояний клеток. Рассмотренный пример клеточного автомата довольно сложно использовать в качестве имитаторов каких-то реальных объектов. Однако оказалось, что клеточные автоматы прекрасно подходят для моделирования поведения так называемых активных сред. Активные среды характеризуются непрерывным распределенным притоком энергии от внешнего источника и ее диссипацией (рассеиванием) среди активных элементов. Выделяют три типа простейших активных элементов: бистабильные, возбудимые и автоколебательные. Бистабильный (или тригерный) элемент обладает двумя устойчивыми состояниями, в каждом из которых он может находиться неограниченно долго. Если внешние воздействия превышают некоторое пороговое значение, то элемент может сменить свое состояние. Возбудимый (или мультивибраторный) элемент имеет несколько состояний, но устойчивым к достаточно слабым воздействиям является только одно из них. Если воздействие превышает некоторый порог, то возбудимый элемент совершает ряд переходов из состояния в состояние и лишь затем возвращается в первоначальному устойчивому состоянию. Автоколебательный элемент работает подобно «вечному двигателю», автономно совершая циклические переходы из одного состояния в другое. Внешние воздействия могут замедлить или ускорить эти переходы, но не могут остановить их. Рассмотрим пример клеточного автомата «Нейронная сеть», который имитирует явления в однородной двумерной нейронной сети, состоящей из возбудимых элементов. Поведение данного автомата основано на следующей совокупности правил:  клетка может находиться в трех состояниях: покоя, активности и восстановления; 69  в качестве окрестности рассматриваются восемь соседних клеток;  переход в состояние активности зависит от некоторого параметра, называемого уровнем активатора: в возбужденном состоянии клетки уровень активатора равен 1, в других состояниях он распадается на A% за такт;  если клетка была в покое и общее количество активатора в восьми соседних и в данной клетке превысило порог активации Tа, то клетка возбуждается на Tв тактов;  через Tв тактов клетка переходит в состояние восстановления на Tр тактов, а затем в состояние покоя. Как правило моделируемые сложные системы представляют собой открытые системы (т. е. обменивающиеся с внешней средой веществом, импульсом, энергией, информацией и т. д.), способные к диссипации подводимой энергии (вещества, информации и пр.). Единоборство этих двух механизмов приводит к появлению диссипативных структур из начального случайного «бульона» субстанции. Эти процессы лежат в основе явлений самоорганизации, происходящих в активных средах. 70 Лекция 7. Статистические методы моделирования      Основные понятия теории случайных величин Построение и исследование регрессионных моделей Регрессионный анализ при пассивном и активном эксперименте Факторный анализ Кластерный анализ Наиболее распространенными эксперименально-статистическими методами математического описания являются регрессионный анализ (применительно к активному и пассивному эксперименту), динамический корреляционный анализ (анализ случайных процессов), факторный анализ или идентификация и оценивание параметров и кластерный анализ. Они нашли широкое применение при построении прогнозирующих моделей сложных технологических процессов и систем. Все процессы, происходящие в природе, являются результатом взаимодействия многих факторов. Для того, чтобы изучить эти процессы и в дальнейшем ими управлять, необходимо выяснить, какую роль в рассматриваемом процессе играет каждый фактор в отдельности. Таким образом, математические методы изучения взаимодействующих факторов требуют умения выражать действия различных факторов количественно. Однако даже самый тщательно подготовленный эксперимент не позволяет выделить интересующий нас фактор в чистой виде, так как всегда присутствует элемент случайности, например, изменение температуры воздуха. В основе методологии построения математических моделей стохастических процессов и зависимостей, отражающих взаимосвязи между данными, полученными экспериментальным путем лежит теория случайных величин и регрессионный анализ. Построение и исследование регрессионных моделей Зависимость между случайными величинами называется регрессией. Она понимается как зависимость между математическими ожиданиями этих величин. Форма связи между случайными величинами определяется линией регрессии, показывающей, как в среднем изменяется величина Y при изменении величины Х, что характеризуют условным математическим ожиданием my/x величины Y, вычисляемым при Х=х. Таким образом, кривая регрессии Y на Х есть зависимость условного математического ожидания Y от известного значения Х. Задача регрессионного анализа ставится следующим образом: для каждого i-го опыта имеется набор значений входных параметров X1i, X2i,…,Xni. и соответствующего этому набору значений выходного параметра Yi. 71 Необходимо определить зависимость выходного параметра Y от входных факторов X1i, X2i,…,Xni, которая в случае, например, линейной связи может иметь следующий вид: Y=b0+b1X1+b2X2+…+bnXn Такая зависимость называется линейной регрессией. Любая другая зависимость называется нелинейной регрессией. Задача сводится к тому, чтобы при измеренных во время опытов значениях входных переменных X1, X2,…,Xn и выходной переменной Y определить коэффициенты уравнения регрессии b0, b1, b2,…bn, которые с определенной степенью вероятности будут отражать влияние аргументов X1, X2,…,Xn на Y. Регрессионная зависимость вида Y=f(Xi) называется однофакторной или парной и описывает связь между двумя переменными: входной Х и выходной Y. Регрессионная зависимость вида Y=f(X1, X2,…,Xn) называется многофакторной или множественной и описывает связь между несколькими входными X1, X2,…,Xn и одной выходной Y. Построение и исследование регрессионной модели можно разбить на четыре этапа. 1 этап. Убедиться, что исследуемые величины связаны между собой стохастически, Для этого, нужно определить по значению rxy существует ли корреляционная связь между Х и Y. 2 этап. Выбор вида уравнения регрессии. Вид уравнения регрессии выбирается исходя из особенностей изучаемой системы случайных величин. Одним из возможных подходов при этом является экспериментальный подбор типа уравнения регрессии по соответствующим критериям адекватности. В случае же, когда имеется определенная априорная (доопытная) информация об объекте, более эффективным является использование для этой цели теоретических представлений о процессах и типах связей между изучаемыми параметрами. 3 этап. Расчет параметров (коэффициентов) уравнения регрессии. Для определения параметров (коэффициентов) уравнения регрессии, используется метод наименьших квадратов (МНК). Сущность метода заключается в том, что выбирается такая линия регрессии, при которой сумма квадратов разностей между экспериментальными значениями выходной переменной Yi, полученными на объекте, и значениями рассчитанными по выбранной регрес~ сионной формуле (модели) Yi  f ( X i ) будет минимальной: n  ~ q   Yi  Yi i 1 2  min , где n – количество экспериментальных данных; q – критерий близости модели и объекта, называемый невязкой модели. Задача построения линейной модели сводится к минимизации функции невязки следующего вида: 72 n q   Yi  (b0  b1 x1i  b2 x2i  ...  bn xni )2  min . i 1 В качестве нелинейных регрессионных моделей чаще всего используются полиномы разной степени: Y  b0  b1 X  b2 X 2  ...  bm X 2 . 4 этап. Проверка адекватности структуры модели. Об адекватности структуры модели можно судить по коэффициенту корреляции r или корреляционному отношению , гистограмме распределения остатков и содержательному анализу остатков модели. Коэффициент корреляции r характеризует степень тесноты линейной связи между Y~ и Y и приближенное значение r определяется по формуле: n n ~ ~ n n  YiYi   Yi  Yi r i 1 i 1 i 1 2  2  n n  n   n  n Y~i 2    Y~i   n  Yi2    Yi        i 1  i 1    i 1  i 1    , где n – число экспериментальных данных. Коэффициент корреляции изменяется от –1 до +1. К о р р е л я ц и о н н о е о т н о ш е н и е  характеризует степень тесноты нелинейной связи между переменными Y~ и Y:  Yi  Y  n  i 1 n ~ 2  Yi  Y  , 2 i 1 ~ Yi где – текущее значение параметра Y, вычисленное по математической модели; Yi – текущее значение параметра Y, полученное на объекте; Y – выборочное среднее значение, 1 n Y   Yi . n i 1 Корреляционное отношение изменяется от 0 до +1. Следует иметь в виду, что коэффициент корреляции является частным случаем корреляционного отношения и используется обычно только при исследовании линейных моделей. Выводы о степени адекватности модели делаются на основании значения коэффициента корреляции, или корреляционного отношения, исследования закона распределения и гистограммы остатков модели, содержательного анализа остатков. 73 Дисперсия и стандартные ошибки коэффициентов Знание дисперсий и стандартных ошибок позволяет анализировать точность оценок, строить доверительные интервалы для теоретических коэффициентов, проверять соответствующие гипотезы. Поскольку истинное значение дисперсии σ2 по выборке определить невозможно, оно заменяется соответствующей несмещенной оценкой S  2  ei2 n  m 1 , (7.1) где т - количество входных переменных модели. Следовательно, по выборке мы можем определить лишь выборочные дисперсии эмпирических коэффициентов регрессии Sb2j  S 2 z jj , j  0,1,...,m , (7.2) где z jj - j - й диагональный элемент матрицы Z 1  ( X T X )1 . Как и в случае парной регрессии S  S 2 называется стандартной ошибки регрессии. S b  S b2 называется стандартной ошибкой коэффициj j ента регрессии. Анализ качества эмпирического уравнения множественной линейной регрессии. Проверка статистического качества оцененного уравнения регрессии проводится по следующим направлениям: - проверка статистической значимости коэффициентов уравнения регрессии; - проверка общего качества уравнения регрессии; - проверка свойств данных, выполнимость которых предполагалась при оценивании уравнения (проверка выполнимости предпосылок метода наименьших квадратов). Проверка статистической значимости коэффициентов уравнения регрессии Статистическая значимость коэффициентов множественной линейной регрессии с т объясняющими переменными проверяется на основе t - статистики b t j , Sb j имеющей в данной ситуации распределение Стьюдента с числом степеней свободы   n  m  1 ( n - объем выборки). При требуемом уровне значимости наблюдаемое значение t - статистики сравнивается с критической точкой t / 2 ,nm1 распределения Стьюдента. Если t  t / 2,nm1 , то коэффициент bj счи74 тается статистически значимым. В противном случае коэффициент bj считается статистически незначимым (статистически близким к нулю). Это означает, что фактор Xj линейно не связан с зависимой переменной Y. Поэтому после установки этого факта рекомендуется исключить из уравнения регрессии переменную Xj. Это не приведет к существенной потери качества модели, но сделает её более конкретной. Зачастую строгая поверка значимости коэффициентов заменяется простым сравнительным анализом. Если t  1(b j  Sb j ) , то коэффициент статистически незначим. Если 1  t  2(b j  2Sb j ) , то коэффициент относительно значим. В данном случае рекомендуется воспользоваться таблицей критических точек распределения Стьюдента. Если 2  t  3 , то коэффициент значим. Это утверждение является гарантированным при ν > 20 и α ≥ 0,05. Если t  3 , то коэффициент считается сильно значимым. Вероятность ошибки в этом случае при большом числе наблюдений не превосходит 0,001. Проверка общего качества уравнения регрессии Для этой цели используется коэффициент детерминации (оценка корреляционного отношения)  R  ( yi  Y ) 2  (Y i   Y) , 2 где Y - выборочное среднее экспериментальных значений Y , а y i - расчетное значение функции y .В общем случае 0  R  1. Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение Y. Проверка выполнения предпосылок метода наименьших квадратов Статистическая значимость коэффициентов регрессии и близкое к единице значение R не гарантируют сами по себе высокое качество уравнения регрессии. Для более точного анализа качества модели необходимо проверить выполнение предпосылок метода наименьших квадратов. Предпосылка 1. Математическое ожидание случайного отклонения равно абсолютной систематической погрешности d экспериментальных данных. Для проверки вычисляем верхнюю и нижнюю границу доверительного интервала для математического ожидания при уровне значимости равном α. Если доверительный интервал накрывает d, то можно принять, что математическое ожидание случайного отклонения равно d с доверительной вероятностью равной 1. Предпосылка 2. Модель является линейной относительно параметров. Выполнимость этой предпосылки следует из линейности построенной моде75 ли относительно коэффициентов bi , i  1,2,..,9. Предпосылка 3. Ошибки q j , j  1,2...,50 , имеют нормальное распределение N (d , S ) . В грубом приближении о законе распределения можно судить по гистограмме распределения остатков. В случае адекватной модели она имеет колоколообразную форму (рис. 7.1.). При 0.22 0.11 Рис. 7.1 Гистограмма распределения остатков адекватной модели неадекватности модели форма гистограммы характеризуется четко выраженной асимметрией или наличием второго горба. Регрессионный анализ при пассивном и активном эксперименте Задача регрессионного анализа при пассивном эксперименте ставится следующим образом. Для каждого i-го опыта имеется набор входных параметров x1,…xn и соответствующее значение выходного параметра y. Необходимо определить зависимость выходного параметра y от входных x. При этом следует определить коэффициенты b0, b1, …,bn, которые находят путем решения системы уравнений. При этом коэффициенты могут быть получены двумя путями: в результате пассивного наблюдения за процессом или путем постановки активного эксперимента. При пассивном эксперименте данные получают путем наблюдения и регистрации в некоторые моменты времени значений входных и выходных переменных. Однако этот способ страдает следующими недостатками. Вопервых, входные величины x должны измеряться с точностью, значительно превышающей точность измерения. Они должны быть некоррелированны. Кроме того, выходной параметр y есть случайная величина, подчиняющаяся нормальному закону распределения. Дисперсия выходного параметра не зависит от его абсолютной величины. Так температура расплава при пирометаллургическом получении цветных металлов является одним из определяющих параметров. Однако измерение температуры в металлургических агрегатах в заводских условиях практически не осуществляется, что объясняется техническими трудностями. Поэтому для контроля температуры пирометаллургических процессов можно использовать корреляционный анализ вместо пассивного эксперимента. 76 При проведении активного эксперимента для определения уравнения регрессии линейного вида входные переменные, которые называются варьируемыми факторами, поддерживаются на двух заранее выбранных фиксированных уровнях: верхнем xmax  1 и нижнем xmin  1 .В зависимости от числа независимых переменных составляют матрицы планирования, в которых не должно быть ни одной повторяющейся комбинации уровней. Число комбинаций зависит от количества входных переменных: для двух переменных  4 комбинации, для трех  8 комбинаций и т.д. Выбор того или иного эксперимента (активного или пассивного) осуществляют в зависимости от конкретных условий. Факторный анализ Факторный анализ – это статистический инструмент, позволяющий определить наиболее «весомые» из ряда параметров, или метод многомерной математической статистики, применяющийся для измерения взаимосвязей между признаками и классификации признаков с учетом этих взаимосвязей. Главными целями факторного анализа являются сокращение числа переменных (редукция данных) и определение структуры взаимосвязей между переменными, т.е. классификация переменных. Назначение факторного анализа совпадает с целью любого научного исследования – отысканием экономного объяснения наблюдаемого многообразия явлений. Поэтому факторный анализ используется либо как метод сокращения данных, либо как метод классификации. С помощью факторного анализа не просто устанавливается связь изменения одной переменной с изменением другой переменной, а определяется мера этой связи и обнаруживаются основные факторы, лежащие в основе указанных изменений. Факторный анализ особенно продуктивен на начальных этапах научных исследований, когда необходимо выделить какие-либо предварительные закономерности в исследуемой области. Как метод, факторный анализ имеет определенные слабые стороны, в частности отсутствует однозначное математическое решение проблемы факторных нагрузок, т. е. влияния отдельных факторов на изменения различных переменных. С помощью факторного анализа в конкретном исследовании обычно решаются следующие задачи. Уменьшение размерности данных. Изучаемые объекты можно характеризовать бесконечным числом разнообразных признаков. Исследователя часто интересует вопрос, можно ли отыскать какой-то полезный способ сгруппировать признаки по смысловому сходству, отыскав, таким образом, небольшое число независимых параметров для описания объектов. Такое уменьшение размерности, когда от большого набора свойств переходят к гораздо меньшему перечню существенных признаков помогает устранить 77 дублирование информации, исключив малоинформативные или "шумящие" переменные. Задача снижения размерности возникает также и в том случае, когда исследователь хочет построить предварительную концептуальную схему слабоизученной области явлений. Объяснение разложением на составляющие. Факторный анализ позволяет расчленить не только значение любого признака у испытуемого на части, но и дисперсию отдельной переменной или корреляцию между ними, приписав каждую часть действию косвенно проявляющих себя факторов. Косвенное измерение. Факторный анализ базируется на предположении о том, что корреляция наблюдаемых переменных объясняется существованием какой-то стоящей за ними общей причины (или нескольких причин). Таким образом, наблюдаемые переменные рассматриваются в качестве косвенных индикаторов так называемых латентных переменных (т.е. переменных, которые непосредственно не измеримы). Факторный анализ позволяет не только получить информацию, помогающую идентифицировать латентные переменные, но и дает способ количественно оценить значение латентной переменной у испытуемых. Кластерный анализ Кластерный анализ – это совокупность математических методов, предназначенных для формирования относительно "отдаленных" друг от друга групп "близких" между собой объектов по информации о расстояниях или связях (мерах близости) между ними. Фактически "кластерный анализ" – это обобщенное название достаточно большого набора алгоритмов, используемых при создании классификации. В ряде изданий используются и такие синонимы кластерного анализа, как классификация и разбиение. Строго говоря, кластерный анализ – это математическая процедура многомерного анализа, позволяющая на основе множества показателей характеризующих ряд объектов сгруппировать их в классы (кластеры) таким образом, чтобы объекты, входящие в один класс, были более однородными, сходными по сравнению с объектами, входящими в другие классы. На основе числено выраженных параметров объектов вычисляются расстояния между ними, которые могут выражаться как в евклидовой метрике, так и в других метриках. Кластерный анализ широко используется в науке как средство типологического анализа. Кластерный анализ как метод находит применение в разнообразных научных направлениях: биология, медицина, экономика, и т.д. В последнее время к кластерному анализу проявляют бурный интерес специалисты разных областей науки и техники. Существуют три основные причины этого явления. Это появление мощной вычислительной техники, без которой кластерный анализ реальных данных практически не реализуем. Вторая причина заключается в том, что современная наука все сильнее опирается в своих построениях на различные классификации объектов. Причем 78 этот процесс все более углубляется, поскольку параллельно этому идет все большая специализация знания, которая невозможна без достаточно объективной классификации. Третья причина – углубление специальных знаний неизбежно приводит к увеличению количества переменных, учитываемых при анализе тех или иных объектов и явлений. Вследствие этого субъективная классификация, которая ранее опиралась на достаточно малое количество учитываемых признаков, часто оказывается уже ненадежной. А объективная классификация, с все возрастающим набором характеристик объекта, требует использования сложных алгоритмов кластеризации, которые могут быть реализованы только на базе современных компьютеров. Главной целью кластерного анализа является нахождение в выборке групп объектов схожих между собой. Предположим, что получились такие группы – кластеры (рис. 7.2). Рисунок 7.2 Кластеры. Одним из свойств кластеров является плотность распределения точек, наблюдений внутри кластера. Это свойство дает возможность определить кластер в виде скопления точек в многомерном пространстве, относительно плотное по сравнению с иными областями этого пространства, которые либо вообще не содержат точек, либо содержат малое количество наблюдений. Иными словами, насколько данный кластер является компактным, или же наоборот – достаточно разреженным. Несмотря на достаточную очевидность этого свойства, однозначного способа вычисления такого показателя (плотности) не существует. Наиболее удачным показателем, характеризующим компактность, плотность "упаковки" многомерных наблюдений в данном кластере, является дисперсия расстояния от центра кластера до отдельных точек кластера. Чем меньше дисперсия этого расстояния, тем ближе к центру кластера находятся наблюдения, тем больше плотность кластера. И наоборот, чем больше дисперсия расстояния, тем более разрежен данный кластер, и, 79 следовательно, есть точки находящиеся как вблизи центра кластера, так и достаточно удаленные от центра кластера. Следующее свойство кластеров – его размеры. Основным показателем размера кластера является его "радиус". Это свойство наиболее полно отображает фактический размер кластера, если рассматриваемый кластер имеет круглую форму и является гиперсферой в многомерном пространстве. На рисунке 7.2 круглую форму имеют красный и синий кластеры. Однако если кластеры имеют удлиненные формы (зеленый кластер на рисунке 7.2), то понятие радиуса или диаметра уже не отображает истинного размера кластера. Еще одно важное свойство кластера – их локальность, отделимость. Оно характеризует степень перекрытия и взаимной удаленности кластеров друг от друга в многомерном пространстве. В кластерном анализе широко используются межкластерные расстояния, вычисляемые по принципу ближайшего соседа, центра тяжести, дальнего соседа, медиан. Наиболее широко используются четыре метода: одиночной связи, полной связи, средней связи и метод Варда или метод Уорда. В методе одиночной связи объект будет присоединен к уже существующему кластеру, если хотя бы один из элементов кластера имеет тот же уровень сходства, что и присоединяемый объект. Отсюда и название метода – одиночная или единственная связь. Для метода полных связей присоединение объекта к кластеру производится лишь в том случае, когда сходство между кандидатом на включение и любым из элементов кластера не меньше некоторого порога. Для метода средней связи имеется несколько модификаций, которые являются некоторым компромиссом между одиночной и полной связью. В них вычисляется среднее значение сходства кандидата на включение со всеми объектами существующего кластера. Присоединение производится в том случае, когда найденное среднее значение сходства достигает или превышает некоторый порог. Наиболее часто используют среднее арифметическое сходство между объектами кластера и кандидата на включение в кластер. Многие из методов кластеризации отличаются между собой тем, что их алгоритмы на каждом шаге вычисляют разнообразные функционалы качества разбиения. Такие экстремальные задачи позволяют определить тот количественный критерий, следуя которому можно было бы предпочесть одно разбиение другому. Под наилучшим разбиением понимает такое разбиение, на котором достигается экстремум (минимум или максимум) выбранного функционала качества. Выбор такого количественного показателя качества разбиения опирается подчас на эмпирические соображения. В качестве таких функционалов часто берутся "взвешенная" сумма внутриклассовых дисперсий расстояний, сумма попарных внутриклассовых расстояний между внутрикластерными элементами и т.д. Популярный метод Варда построен таким образом, чтобы оптимизировать минимальную дисперсию внутрикластерных расстояний. На первом шаге каждый кластер состоит из одного объекта, в силу чего внутрикластерная дисперсия расстояний равна 0. Объединяются по 80 этому методу те объекты, которые дают минимальное приращение дисперсии, вследствие чего данный метод имеет тенденцию к порождению гиперсферических кластеров 81 Лекция 8 Основы теории массового обслуживания  Потоки событий  Обобщенная структурная схема системы массового обслуживания. Параметры и характеристики  Показатели эффективности системы массового обслуживания  Математические модели простейших систем массового обслуживания Потоки событий Поток событий – последовательность однородных событий, следующих одно за другим в какие-то случайные моменты времени. Примерами потока событий являются поток вызовов на телефонной станции, поток покупателей в магазине и т.д. Поток событий можно наглядно изобразить рядом точек на оси времени O t (рис. 8.1). Рис. 8.1 Изображение потока событий на оси времени Положение каждой точки случайно, и здесь изображена лишь какая-то одна реализация потока. Интенсивность потока событий – это среднее число событий, приходящееся на единицу времени. Рассмотрим некоторые свойства (виды) потоков событий. Поток событий называется стационарным, если его вероятностные характеристики не зависят от времени. В частности, интенсивность стационарного потока постоянна. Поток событий неизбежно имеет сгущения или разрежения, но они не носят закономерного характера, и среднее число событий, приходящееся на единицу времени, постоянно и от времени не зависит. Поток событий называется потоком без последствий, если для любых двух непересекающихся участков времени и (см. рис.2) число событий, попадающих на один из них, не зависит от того, сколько событий попало на другой. Другими словами, это означает, что события, образующие поток, появляются в те или иные моменты времени независимо друг от друга и вызваны каждое своими собственными причинами. 82 Поток событий называется ординарным, если события в нем появляются поодиночке, а не группами по нескольку сразу. Поток событий называется простейшим (или стационарным пуассоновским), если он обладает сразу тремя свойствами: 1) стационарен, 2) ординарен, 3) не имеет последствий. Простейший поток имеет наиболее простое математическое описание. Он играет среди потоков такую же особую роль, как и закон нормального распределения среди других законов распределения. А именно, при наложении достаточно большого числа независимых, стационарных и ординарных потоков (сравнимых между собой по интенсивности) получается поток, близкий к простейшему. Для простейшего потока с интенсивностью интервал T между соседними событиями имеет показательное (экспоненциальное) распределение с плотностью где - параметр показательного закона. Для случайной величины T, имеющей показательное распределение, математическое ожидание есть величина, обратная параметру, а среднее квадратичное отклонение равно математическому ожиданию Финальные вероятности состояний Рассматривая марковские процессы с дискретными состояниями и непрерывным временем, подразумевается, что все переходы системы S из состояния в состояние происходят под действием простейших потоков событий (потоков вызовов, потоков отказов, потоков восстановлений и т.д.). Если все потоки событий, переводящие систему S из состояния в состояние простейшие, то процесс, протекающий в системе, будет марковским. Итак, на систему, находящуюся в состоянии , действует простейший поток событий. Как только появится первое событие этого потока, происходит «перескок» системы из состояния в состояние (на графе состояний по стрелке ). Для наглядности на графе состояний системы у каждой дуги проставляют интенсивности того потока событий, который переводит систему по данной дуге (стрелке). - интенсивность потока событий, переводящий систему из состояния в . Такой граф называется размеченным. Пример размеченного графа приведен на рис.8.2. 83 Рис.8.2. Размеченный граф состояний системы: - интенсивности потока отказов; - интенсивности потока восстановлений. Пусть рассматриваемая система S имеет - возможных состояний . Вероятность i-го состояния - это вероятность того, что в момент времени система будет находиться в состоянии . Очевидно, что для любого момента времени сумма всех вероятностей состояний равна единице: Для нахождения всех вероятностей состояний как функций времени составляются и решаются уравнения Колмогорова – особого вида уравнения, в которых неизвестными функциями являются вероятности состояний. Правило составления этих уравнений приведем здесь без доказательств. Но прежде, чем его приводить, объясним понятие финальной вероятности состояния. Если пределы при существуют и не зависят от начального состояния системы, то они называются финальными вероятностями состояний. где n- конечное число состояний системы. Финальные вероятности состояний – это уже не переменные величины (функции времени), а постоянные числа. Очевидно, что Финальная вероятность состояния – это по существу среднее относительное время пребывания системы в этом состоянии. Например, система S имеет три состояния S1, S2 и S3. Их финальные вероятности равны соответственно 0,2; 0,3 и 0,5. Это значит, что система в пре84 дельном стационарном состоянии в среднем 2/10 времени проводит в состоянии S1, 3/10 – в состоянии S2 и 5/10 – в состоянии S3. Пользуясь уравнениями Колмогорова (7.4) (см. лекцию 7), напишем систему уравнений для графа, изображенного рисунке 8.2: Эту систему четырех уравнений с четырьмя неизвестными , казалось бы, можно вполне решить. Но эти уравнения однородны (не имеют свободного члена), и, значит, определяют неизвестные только с точностью до произвольного множителя. Однако можно воспользоваться нормировочным условием и с его помощью решить систему. При этом одно (любое) из уравнений можно отбросить (оно вытекает как следствие из остальных). Обобщенная структурная схема системы массового обслуживания. Параметры и характеристики Теория массового обслуживания изучает системы массового обслуживания (СМО) и сети массового обслуживания (СеМО). Рассматриваемые в этом разделе модели и математические схемы относятся к классу непрерывностохастических, т.е. это Q – схемы. Под системой массового обслуживания (СМО) понимают динамическую систему, предназначенную для эффективного обслуживания потока заявок (требований на обслуживание) при ограничениях на ресурсы системы. Модели СМО удобны для описания отдельных подсистем современных вычислительных систем, таких как подсистема процессор - основная память, канал ввода вывода и т. д. Вычислительная система в целом представляет собой совокупность взаимосвязанных подсистем, взаимодействие которых носит вероятностный характер. Заявка на решение некоторой задачи, поступающая в вычислительную систему, проходит последовательность этапов счета, обращения к внешним запоминающим устройствам и устройствам ввода – вывода. После выполнения некоторой последовательности таких этапов, число и продолжительность которых зависят от трудоемкости программы, заявка считается обслуженной и покидает вычислительную систему. Таким образом, вычислительную систему в целом можно представлять совокупностью СМО, каждая из которых отобража85 ет процесс функционирования отдельного устройства или группы однотипных устройств, входящих в состав системы. Совокупность взаимосвязанных СМО называется сетью массового обслуживания (стохастической сетью). Основными задачами, которые решаются в рамках теории массового обслуживания, являются задачи:  анализа, т. е. определение количественных характеристик СМО и СеМО при заданной структуре и заданных параметрах элементов структуры;  синтеза оптимальной структуры СМО или СеМО при заданных характеристиках и ограничениях на параметры элементов структуры. При исследовании СМО предполагаются известными некоторые их свойства, т. н. параметры СМО. В результате исследования определяются характеристики СМО, являющиеся функцией параметров. На вход СМО поступают заявки на обслуживание, образующие входящий поток. Первопричину заявок, какова бы ни была ее физическая природа, называют источником заявок. В зависимости от характера источника заявок различают разомкнутые и замкнутые СМО. В разомкнутых СМО число заявок, вырабатываемых источником, считается неограниченным. Поведение источника заявок не связано с состоянием СМО ни в данный, ни в какой-либо из предшествующих моментов времени. Для замкнутых СМО характерно конечное число заявок, циркулирующих в системе источник – СМО. Обслуженные заявки возвращаются в источник и через некоторое время могут вновь появиться на входе СМО. Поведение источника в замкнутых СМО является некоторой функцией состояния СМО. Рассмотрим обобщенную структурную схему разомкнутой СМО (рис.8.3), примером которой является многопроцессорная вычислительная система. Рис. 8.3 Обобщенная структурная схема СМО Помимо аппаратных средств (процессоры, память, устройства прерывания, периферийные устройства) в состав вычислительной системы входят программные средства, содержащие прикладные и системные управляющие про86 граммы. Прикладные управляющие программы реализуют алгоритмы обработки информации, их исполнение процессорами рассматривается как обслуживание заявок, поступающих в ВС. Системные управляющие программы осуществляют управление прохождением заявок через ВС (диспетчирование) и исполняются, как правило, одним из процессоров. Обычно выделяют две основные системные управляющие программы: «Диспетчер 1» (Д1) и «Диспетчер 2» (Д2), реализующие, соответственно, дисциплины ожидания и обслуживания. Система работает следующим образом. Появление на входе СМО заявки инициирует выполнение программы Д1, которая распознает приоритет поступившей заявки и ставит ее в соответствующую очередь Oj, реализованную в специально зарезервированной области памяти. Д2 анализирует состояние очередей Oj, O2,..., ON и состояние каналов K1, K2, ..., Km (процессоров). При наличии свободного канала Д2 выбирает заявку, имеющую преимущественное право на обслуживание, и инициирует соответствующий канал и необходимую прикладную программу. Инициирование происходит в моменты окончания исполнения прикладных программ и программы Д1. Параметры входящего потока Процесс поступления в СМО заявок на обслуживание является в общем случае случайным и может рассматриваться как поток однородных событий, происходящих через случайные промежутки времени. Случайные временные интервалы между поступлениями заявок могут подчиняться различным законам распределения. Наибольшее распространение в теории массового обслуживания получил простейший поток заявок, то есть поток, в котором интервал времени между двумя соседними заявками подчинен экспоненциальному закону распределения с интенсивностью : f   e   . (8.1) Привлекательность простейшего потока объясняется рядом обстоятельств. Допущение о простейшем потоке заявок позволяет получать аналитические зависимости характеристик СМО от параметров входящего потока, что затруднительно для других видов потока заявок. Если СМО обеспечивает желаемую эффективность функционирования системы при простейшем потоке заявок на входе, то обслуживание системой других случайных потоков заявок с одинаковой интенсивностью будет выполняться не хуже. Если входящий поток представляет собой совокупность М потоков заявок различных типов с интенсивностями i, (i = l, …, M), то его можно характеризовать суммарной интенсивностью 87 M    i . i 1 Степень важности заявок может быть различной. По этому признаку заявки делят на классы, каждому классу присваивается приоритет K (K = 1, …, N), причем наивысшим приоритетом обладают заявки первого класса, с увеличением K приоритет заявки падает. Различают «терпеливые» заявки, т. е. такие, на время пребывания которых в СМО не накладывается никаких ограничений, и «нетерпеливые», способные уйти из системы, не будучи обслуженными, если время пребывания их в СМО превысит допустимую величину. Параметры структуры СМО Каждая система массового обслуживания обладает определенной структурой, характеризующейся совокупностью параметров. Основным компонентом структуры СМО являются каналы обслуживания. В зависимости от числа каналов различают одноканальные и многоканальные СМО. В свою очередь, многоканальные СМО могут содержать одинаковые и различные по производительности каналы обслуживания. Производительность канала обслуживания обратна длительности обслуживания заявки, равной промежутку времени, необходимому каналу обслуживания для обслуживания заявки. В общем случае это случайная величина с функцией распределения F(o6), плотностью распределения f(o6) и математическим ожиданием об . Типы заявок различаются либо законами распределения, либо только математическими ожиданиями при одинаковых законах распределения. При этом принимается допущение о независимости длительностей обслуживания для различных заявок одного типа, вполне корректное для большинства реальных систем. Наряду с математическим ожиданием длительности обслуживания используется понятие интенсивности потока обслуживания  = 1/oб - величины, обратной средней длительности обслуживания и характеризующей количество заявок, которое может быть обслужено в единицу времени постоянно загруженным каналом обслуживания. При моделировании СМО наиболее часто используют длительность обслуживания с экспоненциальной плотностью распределения (8.1) при =. Если в момент появления заявки на входе СМО хотя бы один канал свободен от обслуживания, ее обслуживание может быть начато немедленно, без задержки. Однако вполне вероятна ситуация, когда заявка застает СМО полностью загруженной, то есть когда все m каналов обслуживания заняты обслуживанием. В этом случае начало обслуживания задерживается, заявка может занять место в соответствующей очереди. Таким образом, вторым важным компонентом структуры СМО является очередь, параметром которой является число мест в очереди п. В приоритетных системах общая очередь может быть 88 разделена на несколько очередей по числу различаемых системой приоритетов, для каждой из которых должно быть указано число мест ni,(i = 1, …, N). На число мест в очереди часто накладывается ограничение. Это может быть сделано как для каждой очереди в отдельности, так и для всей совокупности очередей в целом. При этом возможны конфликтные ситуации, решением которых является отказ системы принять заявку. В зависимости от числа мест в очереди различают СМО с отказами и, соответственно, СМО без отказов. В СМО с отказами число мест в очереди конечно и вследствие вероятностного характера, как входящего потока, так и процессов обслуживания, существует ненулевая вероятность того, что поступившая на вход СМО заявка застанет все каналы занятыми обслуживанием и все места в очереди занятыми ожидающими обслуживания заявками, то есть она получит отказ. В СМО без отказов заявка либо сразу назначается на обслуживание, если в момент ее поступления свободен хотя бы один канал обслуживания, либо принимается в очередь на обслуживание. Параметры законов управления процессами в СМО Процесс продвижения заявки от входа к выходу СМО происходит в соответствии с некоторым законом управления процессами в СМО, который задается дисциплинами ожидания и обслуживания. Дисциплина ожидания определяет порядок приема заявок в систему и размещения их в очереди, дисциплина обслуживания - порядок выбора заявок из очереди для назначения на обслуживание. В зависимости от принятых в СМО дисциплин ожидания и обслуживания различают СМО с бесприоритетными и приоритетными дисциплинами. В СМО с бесприоритетными дисциплинами все заявки считаются равноправными. Возможны следующие бесприоритетные дисциплины обслуживания, то есть правила выборки заявки из очереди при необходимости назначения на обслуживание:  выбирается первая в очереди заявка - дисциплина «первым пришел – первым вышел» (FIFO - First Input First Output);  выбирается последняя в очереди заявка - дисциплина «последним пришел - первым вышел» (LIFO - Last Input First Output);  заявка выбирается из очереди случайным образом. В приоритетных дисциплинах обслуживания заявкам некоторых типов предоставляется преимущественное право на обслуживание перед заявками других типов, называемое приоритетом. Различают относительные, абсолютные и смешанные приоритеты. Абсолютные приоритеты предполагают прерывание обслуживания низкоприоритетной заявки в момент поступления в СМО заявки с более высоким приоритетом, прерванная заявка ставится в начало либо общей очереди, либо очереди заявок соответствующего приоритета. Обслуживание прерванных заявок может проводиться либо от начала (повторное обслуживание), либо от 89 момента прерывания (дообслуживание), чаще используют второй способ дообслуживание прерванных заявок. Смешанные приоритеты предполагают сочетание рассмотренных видов приоритета, причем для отдельных заявок может быть использовано бесприоритетное обслуживание. Совокупность обслуженных и потерянных заявок образует выходящий поток СМО. В зависимости от структуры выходящего потока различают СМО без потерь («чистые» СМО) и СМО с потерями («смешанные» СМО). Для «чистых» СМО характерно отсутствие ограничений на число мест в очереди (бесконечная очередь) и на время пребывания заявки в системе («терпеливые» заявки). По этой причине выходящий поток будет состоять лишь из обслуженных заявок. Параметры выходящего потока Выходящий поток в общем случае распадается на поток обслуженных и поток потерянных заявок, каждый из которых характеризуется законом распределения длительности интервала между соседними заявками. Если входящий поток содержит заявки M типов с интенсивностями потока заявок типа i, (i = l, …, M) выходящий поток можно характеризовать суммарной интенсивностью потока обслуженных заявок M о   оi , i 1 где оi - интенсивность потока обслуженных заявок типа i, и суммарной интенсивностью потока потерянных заявок M п   пi , i 1 где пi - интенсивность потока потерянных заявок типа i. Очевидно, что оi  пi  i . В свою очередь, поток потерянных заявок может состоять из потока заявок, получивших отказ, и потока «нетерпеливых» заявок, покинувших систему, так как их время пребывания превысило допустимую величину, то у есть пi  отк i  i . Показатели эффективности СМО Под показателями эффективности понимаются количественные показатели, частично характеризующие уровень выполнения СМО возложенных на нее функций. На основании показателей эффективности может быть построен 90 некоторый критерий эффективности, совокупно характеризующий эффективность СМО при ограничениях на ее параметры. Эффективность СМО может характеризоваться большим числом различных показателей эффективности. Рассмотрим наиболее употребительные из них и их обозначения. Следует помнить, что все эти показатели отражают возможности СМО по обслуживанию заявок, отнюдь не характеризуя качество самого обслуживания. Вероятность обслуживания Pоб характеризует вероятность того, что произвольно выбранная из входящего потока с интенсивностью  заявка будет обслужена, то есть окажется в потоке обслуженных заявок с интенсивностью о: Роб = о/. Иногда вероятность обслуживания называют относительной пропускной способностью. Вероятность потери Pп характеризует вероятность того, что произвольно выбранная из входящего потока с интенсивностью  заявка окажется в потоке потерянных заявок с интенсивностью п , т. е. Pп= п/ = ( – о)/ = 1 – (о/) = 1 – Pоб и является суммой вероятностей потерь заявок по частным причинам: Pотк - вероятность отказа вследствие переполнения (насыщения) СМО, Pу - вероятность "ухода" нетерпеливых заявок из СМО. Pп = Pотк + Pу. Среднее время ожидания tож заявки (среднее время пребывания заявки в очереди) является математическим ожиданием времени ожидания. Время ожидания ^ заявки является случайной величиной и равно сумме длительностей интервалов времени, в течение которых заявка находится в очереди, начиная с момента появления заявки на выходе СМО и кончая моментом, когда заявка последний раз покидает очередь по причине назначения на обслуживание или ухода из очереди (в случае нетерпеливых заявок). Среднее время ожидания tож в общем случае является суммой двух сон ставляющих: среднего начального времени ожидания t ож , равного промежутку времени между моментом появления заявки на входе СМО и моментом первого назначения заявки на обслуживание или ухода из очереди, и среднего п времени ожидания в прерванном состоянии t ож , равного в общем случае сумме промежутков времени между моментами поступления завки, обслуживание которой было прервано, в очередь и моментами либо повторного назначения заявки на дообслуживание (продолжение обслуживания заявки с того состояния, в котором она находилась на момент очередного прерывания), либо потери заявки за счет ухода: 91 н п tож  tож  tож . Среднее время пребывания заявки в СМО tc является математическим ожиданием времени пребывания заявки в СМО. Время пребывания tc заявки в СМО равно промежутку времени от момента поступления заявки на вход СМО до момента появления ее в выходящем потоке. Среднее время пребывания заявки в СМО tс равно сумме среднего времени ожидания (пребывания в очереди) t ож и среднего времени обслуживания (пребывания в канале обслуживания) t об : tс  tож  tоб . Средняя длина очереди l представляет собой математическое ожидание числа заявок, находящихся в очереди, то есть длины очереди l. Для определения l в общем случае необходимо знание совокупности вероятностей Pожi где i = 0, …, n, то есть вероятностей нахождения в очереди i заявок. Для систем без потерь средняя длина очереди связана со средним временем ожидания t ож простым соотношением l  tож . Это выражение становится очевидным, если учесть, что за время ожидания t ож в СМО поступает в среднем tож  заявок. Среднее число занятых каналов обслуживания K равно математическому ожиданию числа занятых обслуживанием каналов обслуживания, являющегося случайной величиной, и характеризует степень загрузки обслуживающей системы. Для определения K в общем случае необходимо знание совокупности i вероятностей Pзан , i = 0, …, m, того, что в произвольный момент времени занято обслуживанием i каналов обслуживания. Важную роль в дальнейшем играет загрузка PSI - вероятность того, что в произвольный момент времени обслуживанием будут заняты все m каналов обслуживания: PSI  K . m Среднее число заявок в системе Z представляет собой математическое ожидание числа заявок, одновременно находящихся в очереди или в канале обслуживания. Оно представляет собой сумму средней длины очереди и среднего 92 числа занятых каналов обслуживания, так как с каждым каналом обслуживания в произвольный момент времени может быть связана только одна заявка Z  l  K. Для СМО без потерь среднее число заявок в системе связано со средним временем пребывания заявки в системе простым соотношением: Z  l  K  tож  tоб  tс . Математические модели простейших систем массового обслуживания Ниже будут рассмотрены примеры простейших систем массового обслуживания (СМО). Понятие «простейшие» не означает «элементарные». Математические модели этих систем применимы и успешно используются в практических расчетах. Аналитической моделью СМО является совокупность уравнений или формул, позволяющих определять вероятности состояний системы в процессе ее функционирования и рассчитывать показатели эффективности по известным характеристикам входящего потока и каналов обслуживания. Всеобщей аналитической модели для произвольной СМО не существует. Аналитические модели разработаны для ограниченного числа частных случаев СМО. Аналитические модели более или менее точно отображающие реальные системы, как правило, сложны и труднообозримы. Аналитическое моделирование СМО существенно облегчается, если процессы, протекающие в СМО, марковские (потоки заявок простейшие, времена обслуживания распределены экспоненциально). В этом случае все процессы в СМО можно описать обыкновенными дифференциальными уравнениями, а в предельном случае, для стационарных состояний - линейными алгебраическими уравнениями и, решив их, определить выбранные показатели эффективности. Одноканальная СМО с отказами Дано: система имеет один канал обслуживания, на который поступает простейший поток заявок с интенсивностью . Поток обслуживаний имеет интенсивность . Заявка, заставшая систему занятой, сразу же покидает ее. Найти: абсолютную и относительную пропускную способность СМО и вероятность того, что заявка, пришедшая в момент времени t, получит отказ. Система при любом t > 0 может находиться в двух состояниях: S0 – канал свободен; S1 – канал занят. Переход из S0 в S1 связан с появлением заявки и немедленным началом ее обслуживания. Переход из S1 в S0 осуществляется, как только очередное обслуживание завершится (рис.8.4). 93 Рис.8.4. Граф состояний одноканальной СМО с отказами Выходные характеристики (характеристики эффективности) этой и других СМО будут даваться без выводов и доказательств. Абсолютная пропускная способность (среднее число заявок, обслуживаемых в единицу времени): где  – интенсивность потока заявок (величина, обратная среднему промежутку времени между поступающими заявками - ); – интенсивность потока обслуживаний (величина, обратная среднему времени обслуживания ); Относительная пропускная способность (средняя доля заявок, обслуживаемых системой): Вероятность отказа (вероятность того, что заявка покинет СМО необслуженной): Очевидны следующие соотношения: и . Пример. Технологическая система состоит из одного станка. На станок поступают заявки на изготовление деталей в среднем через 0.5 ч . Среднее время изготовления одной детали равно . Если при поступлении заявки на изготовление детали станок занят, то она (деталь) направляется на другой станок. Найти абсолютную и относительную пропускную способности системы и вероятность отказа по изготовлению детали. 94 Решение. Это значит, что в среднем примерно 46 % деталей обрабатываются на этом станке. , т.е. в среднем примерно 54 % деталей направляются на обработку на другие станки. N – канальная СМО с отказами (задача Эрланга) Это одна из первых задач теории массового обслуживания. Она возникла из практических нужд телефонии и была решена в начале 20 века датским математиком Эрлангом. Дано: в системе имеется n – каналов, на которые поступает поток заявок с интенсивностью . Поток обслуживаний имеет интенсивность . Заявка, заставшая систему занятой, сразу же покидает ее. Найти: абсолютную и относительную пропускную способность СМО; вероятность того, что заявка, пришедшая в момент времени t, получит отказ; среднее число заявок, обслуживаемых одновременно (или, другими словам, среднее число занятых каналов). Решение. Состояние системы S (СМО) нумеруется по максимальному числу заявок, находящихся в системе (оно совпадает с числом занятых каналов): S0 – в СМО нет ни одной заявки; S1 – в СМО находится одна заявка (один канал занят, остальные свободны); S2 – в СМО находится две заявки (два канала заняты, остальные свободны); ... Sn – в СМО находится n – заявок (все n – каналов заняты). Граф состояний СМО представлен на рис. 8.5 95 Рис. 8.5 Граф состояний для n – канальной СМО с отказами Почему граф состояний размечен именно так? Из состояния S0 в состояние S1 систему переводит поток заявок с интенсивностью (как только приходит заявка, система переходит из S0 в S1). Если система находилась в состоянии S1 и пришла еще одна заявка, то она переходит в состояние S2 и т.д. Почему такие интенсивности у нижних стрелок (дуг графа)? Пусть система находится в состоянии S1 (работает один канал). Он производит  обслуживаний в единицу времени. Поэтому дуга перехода из состояния S1 в состояние S0 нагружена интенсивностью . Пусть теперь система находится в состоянии S2 (работают два канала). Чтобы ей перейти в S1, нужно, чтобы закончил обслуживание первый канал, либо второй. Суммарная интенсивность их потоков равна 2 и т.д. Выходные характеристики (характеристики эффективности) данной СМО определяются следующим образом. Абсолютная пропускная способность: где n – количество каналов СМО; p0– вероятность нахождения СМО в начальном состоянии, когда все каналы свободны (финальная вероятность нахождения СМО в состоянии S0). Для того, чтобы написать формулу для определения p0, рассмотрим рис.8.6. Рис.8.6. Граф состояний для схемы «гибели и размножения» 96 Граф, представленный на этом рисунке, называют еще графом состояний для схемы «гибели и размножения». Напишем сначала для p0 общую формулу (без доказательства): Кстати, остальные финальные вероятности состояний СМО запишутся следующим образом. Вероятность того, что СМО находится в состоянии S1, когда один канал занят: Вероятность того, что СМО находится в состоянии S2, т.е. когда два канала заняты: Вероятность того, что СМО находится в состоянии Sn, т.е. когда все каналы заняты. В случае n – канальной СМО с отказами имеем: ; … Относительная пропускная способность равна 97 Напомним, что Q – это средняя доля заявок, обслуживаемых системой. Имеем ; . Вероятность отказа, т. е. вероятность того, что заявка покинет СМО необслуженной, равна , поэтому . Среднее число занятых каналов (среднее число заявок, обслуживаемых одновременно) равно или . Пример. Имеется технологическая система (участок), состоящая из трех одинаковых станков. В систему поступают для обработки детали в среднем через 0,5 часа ( ). Среднее время изготовления одной детали . Если при поступлении заявки на изготовление детали все станки заняты, то деталь направляется на другой участок таких же станков. Найти финальные вероятности состояний системы и характеристики (показатели эффективности) данной СМО. Решение. Граф состояний системы представлен на рис. 8.7. Возможны четыре состояния системы: S0 – в СМО (на участке) нет ни одной заявки; S1 – в СМО (на участке) одна заявка; S2 – в СМО (на участке) две заявки; S3 – в СМО (на участке) три заявки (заняты все три станка). Находим среднее число заявок : , т.е. в среднем приходится две заявки на обработку деталей в час. Далее 98 . Рис. 8.7 Граф состояний. Вероятность того, что все станки свободны: Вероятность того, что один станок занят: Вероятность того, что два станка заняты: Вероятность того, что все три станка заняты: Т.е. в среднем в этой системе обрабатывается 1,82 дет/ч (примерно 91 % направляемых деталей), при этом примерно 9 % деталей направляется для 99 обработки на другие участки. Одновременно в среднем работает в основном один станок ( ). Но из–за случайных характеристик потока заявок иногда работают одновременно все три станка ( ), отсюда 9 % отказов. 100 Лекция 9 Моделирование игровых ситуаций     Основные понятия. Классификация игр Матричные игры с нулевой суммой Статистические игры Пример моделирования игровой ситуации Одна из характерных черт многих экономических и технологических процессов состоит в различии интересов участвующих в нем сторон (наличии разных точек зрения на сам процесс и его возможные исходы, борьба за ресурсы и пр.), в разнообразии действий, которые эти стороны могут осуществлять для достижения своих целей. Такие ситуации, обусловленные множественностью (несовпадением) интересов участников, стремлением как можно больше выиграть у конкурентов (получить наилучший индивидуальный результат), называют конфликтными ситуациями (конфликтами). Принятие управленческих решений в условиях конфликта требует специального исследования, основанного на использовании методов теории игр. Для таких ситуаций качество и количество имеющейся информации о данной ситуации (объекте управления и внешней среде) определяют, каким образом может быть формализована и решена задача принятия решения. Основные понятия. Классификация игр Формализация конфликтной ситуации в форме игры заключается в описании ее основных элементов, к которым относятся субъекты игры, называемые игроками, множество их стратегий (допустимые альтернативы), способы выбора стратегий, информация, которой обладает каждый игрок при осуществлении такого выбора, выигрыш каждого игрока при каждом наборе выбранных стратегий. Доступная игрокам информация о намерениях других игроков, их возможностях (могут ли они договариваться, действовать сообща против других игроков) может существенно повлиять на принимаемое решение. Всякая игра регламентирована определенными правилами, указывающими: порядок чередования действий (или «ходов») участников; правила выполнения каждого хода; количественный результат игры (выигрыш, проигрыш), к которому приводит данная совокупность ходов. Сформулировать реальную конфликтную ситуацию в игровой форме  это значит схематизировать ее так, чтобы ясно были видны возможные способы поведения участников (называемые стратегиями) и численный резуль101 тат (количественная оценка  платеж), к которому приводит каждая комбинация стратегий участвующих сторон. Формализованная схема конфликтной ситуации в математической форме представляет ее математическую модель. Целью теории игр является выработка рекомендаций для разумного поведения игроков в конфликтных ситуациях, т. е. определение оптимальной стратегии каждого из игроков. Оптимальной стратегией игрока называется такая стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш (или, что равносильно, минимально возможный средний проигрыш). При выборе игроком этой стратегии за основу берется предположение, что его противник (или противники) является вполне разумным (мыслящим рационально) и делает все, чтобы помешать ему (игроку) добиться своей цели. Основной принцип теории игр можно сформулировать следующим образом: выбирай свое поведение так, чтобы оно было рассчитано на наихудший для тебя образ действий противника. Итак, теория игр  это теория математических моделей принятия решений в условиях неопределенности, когда принимающий решение субъект («игрок») располагает информацией лишь о множестве возможных ситуаций, в одной из которых он в действительности находится, о множестве решений («стратегий»), которые он может принять, и о количественной мере того «выигрыша», который он мог бы получить, выбрав в данной ситуации данную стратегию. Содержание теории игр: установление принципов оптимального поведения в условиях неопределенности, доказательство существования решений, удовлетворяющих этим принципам, указание алгоритмов нахождения решений, их реализация. Формализация игровых ситуаций и поиск методов выбора приемлемых (или оптимальных в некотором смысле) стратегий приводит к выделению отдельных типов игр, группировке их в классы, определению общих средств исследования для выделенных классов. В современной теории игр существует множество классов игр с внутренним делением на подклассы (отдельные группы), для которых получены теоретические основы, определяющие существование оптимальных стратегий (оптимальных опять же в определенном смысле), разработаны алгоритмы поиска этих стратегий. Различные виды игр можно классифицировать, основываясь на том или ином признаке, характеризующим игру: По количеству игроков: парные игры и игры n игроков. Наибольшие успехи достигнуты при изучении парных игр. Трудности решения игровых задач с увеличением количества игроков повышаются. По количеству стратегий: конечные и бесконечные. Если каждый из игроков имеет конечное число возможных стратегий, то игра называется ко102 нечной. Если хотя бы один из игроков имеет бесконечное число возможных стратегий, то такая игра называется бесконечной. По характеру взаимоотношений: бескоалиционные, коалиционные, кооперативные. В бескоалиционных играх игроки не имеют права образовывать коалиции в отличие от коалиционных игр. В кооперативной игре коалиции определены заранее. По характеру выигрышей: игры с нулевой суммой (или антагонистические) и игры с ненулевой суммой (неантагонистические). В играх с нулевой суммой сумма выигрышей игроков в каждой партии равна нулю, цели игроков в ней прямо противоположны: выигрыш одного игрока происходит только за счет проигрыша другого. В играх с ненулевой суммой критерии для игроков различны, сумма выигрышей нулю не равна. По количеству ходов: одношаговые и многошаговые. В одношаговых играх каждый игрок делает только один ход, а далее идет распределение выигрышей. Многошаговые игры делятся на позиционные, стохастические, дифференциальные. В позиционных играх может быть несколько игроков, каждый из которых может последовательно во времени делать несколько ходов. Выигрыши определяются в зависимости от исходов игры. Если в игре производятся ходы, приводящие к выбору определенных позиций, причем имеется определенная вероятность возврата на предшествующую позицию, такая игра называется стохастической. Если в многошаговой игре допускается делать ходы непрерывно и действия игроков описываются дифференциальными уравнениями, такая игра называется дифференциальной. В зависимости от состояния информации: игры с полной и неполной информацией. Если на каждом шаге игры каждому игроку известно, какие выборы сделаны игроками ранее, то она называется игрой с полной информацией. Если игроку не все известно о предыдущих выборах, то речь идет об игре с неполной информацией. По виду функций выигрыша: матричные, биматричные, непрерывные игры. Матричная игра  это конечная игра двух игроков с нулевой суммой, в которой выигрыши первого игрока равны проигрышам второго и наоборот; задается в виде одной матрицы. Биматричная игра  это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока сосредоточены в матрице игры данного игрока; данный вид игр задается двумя матрицами. Непрерывной считается игра, в которой функция выигрышей каждого игрока непрерывно зависит от стратегий. Самое широкое деление игр выполняется на основе понятия координации игроков, участвующих в игре. Это бескоалиционные и коалиционные (кооперативные) игры. Бескоалиционные игры  это класс игр, в которых каждый игрок принимает решение независимо от других игроков (изолированно), не участвуя ни в каких переговорах и соглашениях с другими игроками. К бескоалиционным играм относятся статистические игры (игры с «природой»), антагони103 стические игры (игры с противоположными интересами сторон), игры с непротивоположными интересами (в том числе биматричные игры) и др. В коалиционных (кооперативных) играх, напротив, игроки могут принимать решения по согласованию друг с другом (им разрешается обсуждать перед игрой свои стратегии и договариваться о совместных действиях), они вправе вступать в коалиции. Образовав коалицию, игроки принимают взаимообязывающие соглашения о своих стратегиях. При этом они должны решить вопрос о дележе общего выигрыша между членами коалиции. Матричные игры с нулевой суммой Как отмечалось выше игрой называют упрощенную модель конфликтной ситуации. Суть игры состоит в том, что каждый из ее участников на основе определенных правил принимает такие решения, которые как он полагает, могут обеспечить ему наилучший результат (исход). Исход игры  это значение некоторой функции, называемой функцией выигрыша (платежной функцией). Если сумма выигрышей игроков равна нулю, то игру называют игрой с нулевой суммой. Игра, в которой участвуют два игрока, называется парной. Парная игра с нулевой суммой называется антагонистической или матричной. Пусть игроки A и B располагают конечным числом возможных действий  чистых стратегий. Обозначим их соответственно A1, …, Am и B1, …, Bn. Если игра состоит только из личных ходов, то выбор пары стратегий (Ai, Bj) однозначно определяет результат aij  выигрыш игрока A. При этом проигрыш игрока B составит aij. Если известны значения aij выигрыша для каждой пары чистых стратегий (Ai, Bj), то можно составить матрицу выигрышей игрока A (проигрышей игрока B) Стратегии A1 ... Am j B1 . Bn i . a1n 1 .. a11 .. . . . . . . . . . . . . . . . . . am1 . amn .. . 1 n .. .. . m В таблице дополнительно приведены числа i и j. Число i  минимальный возможный выигрыш игрока A, применяющего стратегию Ai (i = 1, …, m): 104 i  min aij . j Число j  максимальный возможный проигрыш игрока B, если он пользуется стратегией Bj (j = 1, …, n): i  max aij . i Число   max i  max min aij i j i называют нижней ценой игры (максимином), а соответствующую ему чистую стратегию  максиминной. Число   min i  min max aij j j i называют верхней ценой игры (минимаксом), а соответствующую чистую стратегию  минимаксной. Максимин не превосходит минимакса, то есть   . Если  = , то говорят, что игра имеет седловую точку в чистых стратегиях и чистую цену игры v =  = . Пару чистых стратегий Ai* и Bj*, соответствующих  и , называют седловой точкой матричной игры, а элемент ai*j* платежной матрицы, стоящий на пересечении i*-й строки и j*-го столбца  седловым элементом платежной матрицы. Стратегии Ai* и Bj*, образующие седловую точку, являются оптимальными. Тройку { Ai*; Bj*; v} называют решением игры. Для игр без седловых точек оптимальные стратегии игроков находятся в области смешанных стратегий. Смешанной стратегией игрока A называют вектор p = (p1, …, pm), компоненты которого удовлетворяют условиям pi  0, i  1,..., m; m  pi  1. i 1 Смешанной стратегией игрока B называют вектор q = (q1, …, qn), где q j  0, j  1,..., n; n  q j  1. j 1 Здесь pi и qj  вероятности, с которыми игроки A и B выбирают свои чистые стратегии Ai и Bj. При использовании смешанных стратегий игра приобретает случайный характер, случайной становится и величина выигрыша игрока A (проигрыша игрока B). Эта величина является функцией смешанных стратегий p и q и определяется по формуле 105 m n f (p, q)   aij pi q j . i 1 j 1 Функцию f(p, q) называют платежной или функцией выигрыша. Смешанные стратегии p* и q* называются оптимальными, если они образуют седловую точку для платежной функции f(p, q), то есть min max f (p, q)  max min f (p, q)  f (p*, q*). q p q p Величину f(p*, q*) = v называют ценой игры. Статистические игры Статистические игры образуют специальный класс матричных игр, в которых одним из участников является человек или группа людей, объединенных общностью цели (игрок A  статистик), а другим  «природа» (игрок П). Под термином «природа» подразумевается весь комплекс внешних условий, при которых статистику приходится принимать решение. Природа безразлична к выигрышу и не стремится обратить в свою пользу промахи статистика. Статистик располагает m стратегиями A1, …, Am, природа может реализовать любое из n различных состояний П1, …, Пn. Действуя против природы, статистик пользуется как чистыми Ai, так и смешанными p = (p1, …, pm) стратегиями. Если статистик имеет возможность численно оценить (величиной aij) последствия применения каждой своей чистой стратегии Ai при любом состоянии Пj природы, то игру можно задать платежной матрицей. При выборе оптимальной стратегии статистика пользуются различными критериями. Если вероятности qj состояний Пj природы известны, то пользуются критериями Байеса и Лапласа. В качестве оптимальной по критерию Байеса принимает чистая стратегия Ai, при которой максимизируется средний выигрыш статистика, то есть обеспечивается n max ai  max  aij q j . i i j 1 Если статистику представляются в равной мере правдоподобными все состояния Пj природы, то q1 = … = qn = 1/n и оптимальной по критерию Лапласа считается стратегия Ai, обеспечивающая n 1 max ai  max  aij . i n i j 1 106 При неизвестных вероятностях состояний природы пользуются критериями Ваальда, Сэвиджа, Гурвица. Оптимальной по критерию Ваальда (максиминному критерию) считается чистая стратегия Ai, при которой статистику обеспечивается   max min aij . j i Для смешанных стратегий критерий Ваальда формулируется так: оптимальной считается смешанная стратегия p*, найденная из условия m max min  aij pi . p j i 1 Оптимальной по критерию Сэвиджа считается та чистая стратегия Ai, при которой минимизируется величина максимального риска rij, то есть обеспечивается rij  max aij  aij . min max rij , i j i Для смешанных стратегий согласно критерию Сэвиджа оптимальной считается стратегия p*, найденная из условия m min max  rij pi . p j i 1 Оптимальной по критерию Гурвица считается чистая стратегия Ai, при выборе которой достигается   max   min aij  (1   ) max aij  , j i  j  где  принадлежит интервалу (0, 1) и выбирается из субъективных соображений. Анализ практических ситуаций проводится по нескольким критериям одновременно, что позволяет глубже исследовать суть явления и выбрать наиболее обоснованное решение. Пример моделирования игровой ситуации В процессе эксплуатации технологическая система может оказаться в одном из следующих состояний: 1) требуется текущий ремонт и наладка оборудования; 2) требуется частичная модернизация системы для повыше107 ния ее надежности; 3) вышла из строя система контроля за состоянием системы; 4) система находится в аварийном состоянии. В зависимости от сложившейся ситуации руководство фирмы может принять такие решения: 1) произвести ремонт и модернизацию своими силами, что потребует затрат, равных a11, a12, a13, a14 тысяч рублей в зависимости от состояния системы (в затраты включены стоимость модернизации оборудования, расходы на покупку новых комплектующих, убытки, связанные с ухудшением качества работы системы); 2) произвести ремонт и модернизацию с помощью специалистов-разработчиков, что вызовет затраты, равные a21, a22, a23, a24 тысяч рублей; 3) заменить систему новой, на что будет израсходовано a31, a32, a33, a44 тысяч рублей. Используя игровой подход, составить рекомендации по оптимальному образу действий руководства фирмы, если 1) накопленный опыт свидетельствует о том, что вероятности указанных состояний информационной системы составляют соответственно q1, q2, q3 и q4; 2) имеющийся опыт подтверждает, что все четыре состояния системы равновероятны; 3) вероятности указанных состояний информационной системы неизвестны. Рассматриваемая задача может быть формализована в виде статистической игры. Здесь в качестве статистика A выступает руководство фирмы, обладающее тремя стратегиями: A1  произвести модернизацию своими силами; A2  произвести модернизацию с помощью специалистовразработчиков; A3  заменить систему новой. Вторым игроком здесь следует считать «природу» П  комплекс внешних условий, в которых функционировала технологическая система и которые определили четыре возможных состояния П1, П2, П3 и П4 указанных в задаче. «Выигрышами» статистика A будут затраты, связанные с реализацией решений (стратегий) A1, A2 и A3 и составляющие платежную матрицу стратегии A1 A2 A3 П1 П2 П3 П4 a11 a21 a31 a12 a22 a32 a13 a23 a33 a14 a24 a34 Для выработки рекомендаций необходимо провести исследование игры. В случае заданных вероятностей состояний природы (п. 1) следует найти оптимальные чистые стратегии, пользуясь критерием Байеса, в п. 2  критерием Лапласа и при неизвестных вероятностях (п. 3)  критериями Вальда, Сэвиджа и Гурвица (значение параметра  в критерии Гурвица за108 дается). На основании результатов исследования игры по совокупности указанных критериев следует рекомендовать ту стратегию, которая оказывалась оптимальной чаще других. 109 Лекция 10 Нейросетевые модели     Общее представление о нейронной сети Модели нейронов Типы функций активации Представление нейронных сетей с помощью направленных графов  Архитектура сетей  Представление знаний  Обучение нейронных сетей Общее представление о нейронной сети Исследования по искусственным нейронным сетям (далее нейронные сети) связаны с тем, что способ обработки информации человеческим мозгом в корне отличается от методов, используемых обычными цифровыми компьютерами. Мозг представляет собой чрезвычайно сложный, нелинейный, параллельный компьютер (систему обработки информации). Он обладает способностью организовывать свои структурные компоненты, называемые нейронами (neuron), так, чтобы они могли выполнять конкретные задачи (такие как распознавание образов, обработку сигналов органов чувств, моторные функции) во много раз быстрее, чем могут позволить самые быстродействующие современные компьютеры. Примером такой задачи обработки информации может служить обычное зрение (human vision) [194], [637], [704]. В функции зрительной системы входит создание представления окружающего мира в таком виде, который обеспечивает возможность взаимодействия (interact) с этим миром. Более точно, мозг последовательно выполняет ряд задач распознавания (например, распознавание знакомого лица в незнакомом окружении). На это у него уходит около 100200 миллисекунд, в то время как выполнение аналогичных задач даже меньшей сложности на компьютере может занять несколько дней. Самую важную роль в работе нейронов в качестве единиц обработки информации в человеческом мозге играет пластичность (plasticity) мозга, то есть способность настройки нервной системы в соответствии с окружающими условиями. Аналогично, проводится работа с искусственными нейронами в искусственных нейронных сетях. В общем случае нейронная сеть (neural network) представляет собой машину, моделирующую способ обработки мозгом конкретной задачи. Эта сеть обычно реализуется с помощью электронных компонентов или моделируется программой, выполняемой на компьютере. Для того, чтобы добиться высокой производительности, нейронные сети используют множество взаимосвязей между элементарными ячейками вычислений  нейронами. Таким образом, можно дать следующее определение нейронных сетей, выступающих в роли адаптивной машины. 110 Нейронная сеть  это распределенный параллельный процессор, состоящий из элементарных единиц обработки информации, накапливающих экспериментальные знания и предоставляющих их для последующей обработки. Нейронная сеть сходна с мозгом с двух точек зрения. Знания поступают в нейронную сеть из окружающей среды и используются в процессе обучения. Для накопления знаний применяются связи между нейронами, называемые синаптическими весами. Процедура, используемая для процесса обучения, называется алгоритмом обучения (leaming algorithm). Эта процедура выстраивает в определенном порядке синаптические веса нейронной сети для обеспечения необходимой структуры взаимосвязей нейронов. Изменение синаnтических весов представляет собой традиционный метод настройки нейронных сетей. Однако нейронные сети могут изменять собственную топологию. Это обусловлено тем фактом, что нейроны в человеческом мозге постоянно отмирают, а новые синaптические связи постоянно создаются. Совершенно очевидно, что свою силу нейронные сети черпают, вопервых, из pacпараллеливания обработки информации и, во-вторых, из способности самообучаться, т.е. создавать обобщения. Под термином обобщение (generalization) понимается способность получать обоснованный результат на основании данных, которые не встречались в процессе обучения. Эти свойства позволяют нейронным сетям решать сложные (масштабные) задачи, которые в настоящее время считаются трудноразрешимыми. Однако на практике при автономной работе нейронные сети не могут обеспечить готовые решения. Их необходимо интегрировать в сложные системы. В частности, комплексную задачу можно разбить на последовательность относительно простых подзадач, часть из которых может решаться нейронными сетями. Использование нейронных сетей обеспечивает следующие полезные свойства систем. Нелинейность. Искусственные нейроны могут быть линейными и нелинейными. Нейронные сети, построенные из соединений нелинейных нейронов, сами являются нелинейными. Более того, эта нелинейность особого сорта, так как она распределена по сети. Нелинейность является чрезвычайно важным свойством, особенно если сам физический механизм, отвечающий за формирование входного сигнала, тоже является нелинейным. Обучаемость. Одной из популярных парадигм обучения является обучение с учителем. Это подразумевает изменение cинаптических весов на основе набора маркированных учебных примеров. Каждый пример состоит из входного сигнала и соответствующего ему желаемого отклика. Из этого множества случайным образом выбирается пример, а нейронная сеть модифицирует синаптические веса для минимизации расхождений желаемого выходного сигнала и формируемого сетью согласно выбранному статистическому критерию. При этом собственно модифицируются свободные парамет111 ры сети. Ранее использованные примеры могут впоследствии быть применены снова, но уже в другом порядке. Это обучение проводится до тех пор, пока изменения синаптических весов не станут незначительными. Таким образом, нейронная сеть обучается на примерах, составляя таблицу соответствий вход выход для конкретной задачи. Адаптивность. Нейронные сети обладают способностью адаптировать свои синаптические веса к изменениям окружающей среды. В частности, нейронные сети, обученные действовать в определенной среде, могут быть легко переучены для работы в условиях незначительных колебаний параметров среды. Более того, для работы в нестационарной среде (где статистика изменяется с течением времени) могут быть созданы нейронные сети, изменяющие синаптические веса в реальном времени. Очевидность ответа. В контексте задачи классификации образов можно разработать нейронную сеть, собирающую информацию не только для определения конкретного класса, но и для увеличения достоверности принимаемого решения. Впоследствии эта информация может использоваться для исключения сомнительных решений, что повысит продуктивность нейронной сети. Контекстная информация. Знания представляются в самой структуре нейронной сети с помощью ее состояния активации. Каждый нейрон сети потенциально может быть подвержен влиянию всех остальных ее нейронов. Как следствие, существование нейронной сети непосредственно связано с контекстной информацией. Отказоустойчивость. Нейронные сети, облаченные в форму электроники, потенциально отказоустойчивы. Это значит, что при неблагоприятных условиях их производительность падает незначительно. Например, если поврежден какой-то нейрон или его связи, извлечение запомненной информации затрудняется. Однако, принимая в расчет распределенный характер хранения информации в нейронной сети, можно утверждать, что только серьезные повреждения структуры нейронной сети существенно повлияют на ее работоспособность. Поэтому снижение качества работы нейронной сети происходит медленно. Незначительное повреждение структуры никогда не вызывает катастрофических последствий. Это  очевидное преимущество робастных вычислений, однако его часто не принимают в расчет. Масштабируемость. Параллельная структура нейронных сетей потенциально ускоряет решение некоторых задач и обеспечивает масштабируемость нейронных сетей в рамках технолоrии VLSI (very-large-scaleintegrated). Одним из преимуществ технолоrий VLSI является возможность представить достаточно сложное поведение с помощью иерархической структуры. Единообразие анализа и проектирования. Нейронные сети являются универсальным механизмом обработки информации. Это означает, что одно и то же проектное решение нейронной сети может использоваться во многих предметных областях. 112 Аналогия с нейробиологией. Строение нейронных сетей определяется аналогией с человеческим мозгом, который является живым доказательством того, что отказоустойчивые параллельные вычисления не только физически реализуемы, но и являются быстрым и мощным инструментом peшения задач. Нейробиологи рассматривают искусственные нейронные сети как средство моделирования физических явлений. С другoй стороны, инженеры постоянно пытаются почерпнуть у нейробиологoв новые идеи, выходящие за рамки традиционных электросхем. Модели нейронов Нейрон представляет собой единицу обработки информации в нейронной сети. На рисунке 10.1 показана модель нейрона, лежащего в основе искусственных нейронных сетей. В этой модели можно выделить три основных элемента: набор синапсов, сумматор и функция активация. Рисунок 10.1 Нелинейная модель нейрона Набор синапсов или связей, каждый из которых xарактеризуется своим весом или силой. В частности, сигнал xj на входе синапса j, связанного с нейроном k, умножается на вес wkj Важно обратить внимание на то, в каком порядке указаны индексы синаптического веса wkj. Первый индекс относится к рассматриваемому нейрону, а второй к входному окончанию синапса, с которым связан данный вес. В отличие от синапсов мозга синаптический вес искусственного нейрона может иметь как положительные, так и отрицательные значения. Сумматор складывает входные сигналы, взвешенные относительно соответствующих синапсов нейрона. Эту операцию можно описать как линейную комбинацию. 113 Функция активации ограничивает амплитуду выходного сигнала нейрона. Эта функция также называется функцией сжатия. Обычно нормализованный диапазон амплитуд выхода нейрона лежит в интервале [0,1] или [1, 1]. В модель нейрона, показанную на рис. 1.5, включен также пороговый элемент или порог, который обозначен символом bk. Эта величина отражает увеличение или уменьшение входного сигнала, подаваемого на функцию активации. В математическом представлении функционирование нейрона k можно описать следующей парой уравнений: 𝑣𝑘 = ∑𝑚 𝑗=0 𝑤𝑘𝑗 𝑥𝑗 , (10.1) 𝑦𝑘 = 𝜑(𝑣𝑘 ), (10.2) гдe 𝑥𝑗  входные сигналы; 𝑤𝑘𝑗  синаптические веса нейрона k, j = 1, 2, …, m; 𝑣𝑘  потенциал активации или индуцированное локальное поле; 𝑥0 = +1; 𝑤𝑘0 = 𝑏𝑘 ; 𝑏𝑘  порог; 𝜑(∙)  функция активации; 𝑦𝑘  выходной сиrнал нейрона. Здесь и далее мы будем использовать термин "индуцированное локальное поле". Модель нейрона, показанная на рисунке 10.1, является детерминистской. Это значит, что преобразование входного сиrнала в выходной точно определено для всех значений входного сиrнала. Однако в некоторых приложениях лучше использовать стохастические нейросетевые модели, в которых функция активации имеет вероятностную интерпретацию. В подобных моделях нейрон может находиться в одном из двух состояний: + 1 или  1. Решение о переключении состояния нейрона принимается с учетом вероятности этоrо события. Обозначим состояние нейрона символом x, а вероятность активации нейрона  функцией 𝑃(𝑣), где 𝑣  индуцированное локальное поле нейрона. Toгдa 1 с вероятностью 𝑃(𝑣), 𝑥={ −1 с вероятностью 1 − 𝑃(𝑣). Вероятность 𝑃(𝑣) описывается сигмоидальной функцией вида 𝑃(𝑣) = 1 1 + exp(−𝑣/𝑇) с параметром T, используемым для управления уровнем шума, и, таким образом, степенью неопределенности переключения. Заметим, что если параметр T стремится к нулю, то стохастический нейрон, описанный выраже114 нием (1.15), принимает детерминированную форму (без включения шума) нейрона МакКаллокаПитца. Типы функций активации Функция активации 𝜑(𝑣), представленная в формуле (10.2), определяет выходной сигнал нейрона в зависимости от индуцированного локального поля 𝑣. Можно выделить три основных типа функций активации: функция единичного скачка или пороговая функция. Функция единичного скачка или пороговая функция. Этот тип функции показан на рисунке 10.2 и описывается следующим образом: 𝜑(𝑣) = { 1, если 𝑣 ≥ 0, 0, если 𝑣 < 0. Рисунок 10.2 Функция единичного скачка. В технической литературе эта форма функции единичноrо скачка обычно называется функцией Хэвисайда. Соответственно выходной сиrнал нейрона k такой функции можно представить как 1, если 𝑣𝑘 ≥ 0, 𝑦𝑘 = { 0, если 𝑣𝑘 < 0. где 𝑣𝑘  это индуцированное локальное поле нейрона, т.е. 𝑣𝑘 = ∑𝑚 𝑗=1 𝑤𝑘𝑗 𝑥𝑗 + 𝑏𝑘 . Эту модель в литературе называют моделью МакКаллокаПитца. В этой модели выходной сиrнал нейрона принимает значение 1, если индуцированное локальное поле этого нейрона не отрицательно, и 0  в противном случае. Это выражение описывает свойство «все или ничего» модели МакКаллокаПитца. 115 Кусочно-линейная функция. Кусочно-линейная функция описывается следующим выражением: 1, если 𝑣𝑘 ≥ 𝑎, 1 𝜑(𝑣) = { (𝑣 + 𝑎), если −𝑎 < 𝑣𝑘 < 𝑎, 2𝑎 0, если 𝑣𝑘 ≤ −𝑎. Для функции, показанной на рисунке 10.3, 𝑎 = 0.5. При a, стремящемся к +∞, кусочно-линейная функция вырождается в пороговую. Рисунок 10.3 Кусочно-линейная функция. Сигмоидальная функция. Сигмоидальная функция, график которой напоминает букву S, является самой распространенной функцией, используемой для создания искусственных нейронных сетей. Это быстро возрастающая функция, которая поддерживает баланс между линейным и нелинейным поведением. Примером сигмоидальной функции может служить логистическая функция, задаваемая выражением 𝜑(𝑣) = 1 1 + exp(−𝑎𝑣) параметром a наклона сигмоидальной функции. Изменяя этот параметр, можно построить функции с различной крутизной (см. рисунок 10.4). Первый график соответствует величине параметра, равной a/4. В пределе, когда параметр наклона достигает бесконечности, сигмоидальная функция вырождается в пороговую. Если пороговая функция может принимать только значения 0 и 1, то сигмоидальная функция принимает бесконечное множество значений в диапазоне от 0 до 1. При этом следует заметить, что сигмоидальная функция является дифференцируемой, в то время как пороговая  нет. 116 Рисунок 10.4 Сигмоидальная функция для различных значений параметра a. Область значений функций активации, определенных формулами, представляет собой отрезок от 0 до 1. Однако иногда требуется функция активации, имеющая область значений от 1 до +1. В этом случае функция активации должна быть нечетной функцией индуцированного локального поля 𝑣. В частности, пороговую функцию в данном случае можно определить следующим образом: 1, если 𝑣𝑘 ≥ 0, 𝜑(𝑣) = sign(𝑣) = { 0, если 𝑣𝑘 = 0, −1, если 𝑣𝑘 ≤ 0. Сигмоидальная функция будет иметь форму гиперболического тангенса: 𝜑(𝑣) = th(𝑣). Представление нейронных сетей с помощью направленных графов Блочная диаграмма, представленная на рисунке 10.1, обеспечивает функциональное описание различных элементов, из которых состоит модель искусственного нейрона. Внешний вид модели можно в значительной мере упростить, применив идею графов прохождения сигнала. Граф передачи (или прохождения) сигнала  это сеть направленных связей (или ветвей), соединяющих отдельные точки (узлы). С каждым узлом j связан сигнал xj. Обычная направленная связь начинается в некотором узле j и заканчивается в другом узле k. С ней связана некоторая передаточная функция, определяющая зависимость сигнала yk узла k от сигнала xj узла j. Прохождение сигнала по различным частям графа подчиняется трем основным правилам. Правило 1. Направление прохождения сигнала вдоль каждой связи определяется направлением стрелки. При этом можно выделить два типа связей: синаптические и активационные. Поведение синаптических связей определяется линейным соотношением вход выход. А именно, как показано на 117 рис. 10.5 а), сигнал узла xj умножается на синаптический вес wkj, в результате чего получается сигнал узла yk. Рисунок 10.5 Типы связей: а) синаптическая; б) активационная. Правило 2. Сигнал узла равен алrебраической сумме сигналов, поступающих на его вход. Это правило называется синаптической сходимостью. На рисунке 10.6 оно проиллюстрировано для случая синаптической сходимости двух сигналов. Рисунок 10.6 Синаптическая сходимость. Правило 3. Сигнал данного узла передается по каждой исходящей связи без учета передаточных функций исходящих связей. Это правило называется синаптической расходимостью. Оно проиллюстрировано на рисунке 10.7, для случая синаптической расходимости двух сигналов. Рисунок 10.7 Синаптическая расходимость. 118 На рис. 10.8 показан пример графа передачи сигнала. Это модель нейрона, соответствующая блочной диаграмме, приведенной на рис. 10.1. По своему внешнему виду этот граф значительно проще диаграммы на рис. 10.1, хотя и содержит все функциональные детали. Направленный граф, определенный указанным выше способом, является полным. Это значит, что он описывает не только прохождение сигнала между нейронами, но и передачу сигнала в самом нейроне. Принимая в качестве модели нейрона граф прохождения сигнала, показанный на рисунке 10.8, можно сформулировать еще одно определение нейронной сети. Нейронная сеть  это направленный граф, состоящий из узлов, соединенных синаптическими и активационными связями, который характеризуется следующими четырьмя свойствами. 1) Каждый нейрон представляется множеством линейных синаптических связей, внешним порогом и, возможно, нелинейной связью активации. Порог, представляемый входной синаптической связью, считается равным + 1. 2) Синаптические связи нейрона используются для взвешивания соответствующих входных сигналов. 3) Взвешенная сумма входных сигналов определяет индуцированное локальное поле каждого конкретного нейрона. 4) Активационные связи модифицируют индуцированное локальное поле нейрона, создавая выходной сигнал. Рисунок 10.8 Граф передачи сигнала для одного нейрона. Если необходимо описать только прохождение сигнала между нейронами, то можно использовать сокращенную форму графа, опускающую дета119 ли передачи сигнала внутри нейронов. Такой направленный граф называется частично полным и характеризуется следующими свойствами: - входные сигналы графа формируются узлами источника или входными элементами; - каждый нейрон представляется одним узлом, который называется вычислительным. - линии передачи сигнала, соединяющие узлы-источники и вычислительные узлы графа, не имеют веса, они просто определяют направление прохождения сигнала на графе. Частично полный направленный граф с указанными свойствами называется архитектурным. Он описывает структуру нейронной сети. Простейший граф, состоящий из одного нейрона с m входами и фиксированным порогом, равным +1, показан на рисунке 10.9. На этом графе вычислительный узел обозначен заштрихованным кружком, а узлы источника маленькими квадратиками. Это соглашение принято в теории нейронных сетей. Рисунок 10.9 Архитектурный граф нейрона. Подводя итог сказанному, можно выделить три графических представления нейронных сетей: блочная диаграмма, описывающая функции нейронной сети; граф прохождения сигнала, обеспечивающий полное описание передачи сигнала по нейронной сети; архитектурный граф, описывающий структуру нейронной сети. Архитектура сетей Архитектура (структура) нейронных сетей тесно связана с используемыми алгоритмами обучения. В общем случае можно выделить три фундаментальных класса нейросетевых архитектур. Однослойные сети прямого распространения В нейронной сети нейроны могут располагаться по слоям. В простейшем случае в такой сети существует входной слой узлов источника, информация от которого передается на выходной слой нейронов (вычислительные узлы), но не наоборот. Такая сеть называется сетью прямого распространения. На рисунке 10.10 показана структура такой сети для случая четырех узлов в каждом из слоев (входном и выходном). 120 Рисунок 10.10 Сеть прямого распространения с одним слоем нейронов Такая нейронная сеть называется однослойной, при этом под единственным слоем подразумевается слой вычислительных элементов (нейронов). При подсчете числа слоев мы не принимаем во внимание узлы источника, так как они не выполняют никаких вычислений. Многослойные сети прямого распространения Другой класс нейронных сетей прямого распространения характеризуется наличием одного или нескольких скрытых слоев, узлы которых называются скрытыми нейронами, или скрытыми элементами. Функция последних заключается в посредничестве между внешним входным сигналом и выходом нейронной сети. Добавляя один или несколько скрытых слоев, мы можем выделить статистики высокого порядка. Такая сеть позволяет выделять глобальные свойства данных с помощью локальных соединений за счет наличия дополнительных синаптических связей и повышения уровня взаимодействия нейронов. Способность скрытых нейронов выделять статистические зависимости высокого порядка особенно существенна, когда размер входного слоя достаточно велик. Узлы источника входного слоя сети формируют соответствующие элементы шаблона активации (входной вектор), которые составляют входной сигнал, поступающий на нейроны (вычислительные элементы) второго слоя (т.е. первого скрытого слоя). Выходные сигналы второго слоя используются в качестве входных для третьего слоя и т. д. Обычно нейроны каждого из слоев сети используют в качестве входных сигналов выходные сигналы нейронов только предыдущего слоя. Набор выходных сигналов нейронов выходного (последнего) слоя сети определяет общий отклик сети на данный входной образ, сформированный узлами источника входного (первого) слоя. В общем случае сеть прямого распространения с m входами, h1 нейронами первого скрытого слоя, h2 нейронами второго скрытого слоя и q нейронами выходного слоя называется сетью m  h1  h2  q. Сеть, показанная на 121 рис. 10.11, называется сетью 1042, так как она имеет 10 входных, 4 скрытых и 2 выходных нейрона. Рисунок 10.11 Полносвязная сеть прямого распространения Данная нейронная сеть считается полносвязной в том смысле, что все узлы каждого слоя соединены со всеми узлами смежных слоев. Если некоторые синаптические связи отсутствуют, то сеть называется неполносвязной. Рекуррентные сети Рекуррентная нейронная сеть отличается от сети прямого распространения наличием, по крайней мере, одной обратной связи. Например, рекуррентная сеть может состоять из единственного слоя нейронов, каждый из которых направляет свой выходной сигнал на входы всех остальных нейронов слоя. Архитектура такой нейронной сети показана на рис. 10.12. Рисунок 10.12 Однослойная рекуррентная сеть. 122 На рис. 10.31 показан другой класс рекуррентных сетей  со скрытыми нейронами. Здесь обратные связи исходят как из скрытых, так и из выходных нейронов. Рисунок 10.13 Рекуррентная сеть со скрытыми нейронами. Наличие обратных связей в сетях, показанных на рис. 10.12 и 10.13, оказывает непосредственное влияние на способность таких сетей к обучению и на их производительность. Более того, обратная связь подразумевает использование элементов единичной задержки (unit-delay element) (они обозначены как z-1), что приводит к нелинейному динамическому поведению, если, конечно, в сети содержатся нелинейные нейроны. Представление знаний Под знаниями понимается хранимая информация или модели, используемые человеком или машиной для интерпретации, предсказания и реакции на внешние события. К вопросам представления знаний относятся следующие: какую информацию необходимо хранить и как эту информацию представить физически для ее последующего использования. Таким образом, способ представления знаний определяется поставленной целью и от него зависит качество работы нейронных сетей. Основной задачей нейронной сети является наилучшее обучение модели окружающего мира для решения поставленной задачи. Знания о мире включают два типа информации: априорную информацию и примеры. Априорной информацией называется известное состояние окружающего мира, представленное имеющимися в наличии достоверными фактами. Результаты наблюдения за окружающим миром (измерения), полученные с помощью сенсоров, адаптированных для конкретных условий формируют примеры, которые используются для обучения нейронной сети. 123 Примеры могут быть маркированными и немаркированными. В маркированных примерах входному сигналу соответствует желаемый отклик. Немаркированные примеры состоят из нескольких различных реализаций одного входного сигнала. В любом случае набор примеров, маркированных или нет, представляет собой знания об интересующей предметной области, на основании которых и проводится обучение нейронной сети. Причем, набор данных, используемый для обучения сети, должен содержать как положительные, так и отрицательные примеры. В нейронной сети заданной архитектуры знания об окружающей среде представляются множеством свободных параметров (т.е. синаптических весов и порогов) сети. Такая форма представления знаний соответствует самой природе нейронных сетей. Вопрос представления знаний в нейронной сети является очень сложным. Тем не менее можно выделить четыре общих правила. Правило 1. Сходные входные сигналы от схожих классов должны формировать единое представление в нейронной сети. Поэтому они должны быть классифицированы, как принадлежащие к одной категории. Существует множество подходов к определению степени сходства входных сигналов. Обычно степень подобия детерминированных сигналов определяется евклидовым расстоянием. Для примера предположим, что существует некоторый вектор 𝑥𝑖 = (𝑥𝑖1 , 𝑥𝑖2 , … , 𝑥𝑖𝑚 ) размерности m. Все его элементы  действительные числа. Вектор 𝑥𝑖 определяет некоторую точку в m-мерном Евклидовом пространстве (которое обозначается как Rm). Евклидово расстояние между парой векторов 𝑥𝑖 и 𝑥𝑗 вычисляется как 𝑚 1/2 2 𝑑(𝑥𝑖 , 𝑥𝑗 ) = ‖𝑥𝑖 − 𝑥𝑗 ‖ = [∑(𝑥𝑖𝑘 − 𝑥𝑗𝑘 ) ] , 𝑘=1 где 𝑥𝑖𝑘 и 𝑥𝑗𝑘  k-e элементы векторов 𝑥𝑖 и 𝑥𝑗 соответственно. Отсюда следует, что степень сходства между входными сигналами, представленными векторами 𝑥𝑖 и 𝑥𝑗 , является величиной, обратной Евклидову расстоянию между ними 𝑑(𝑥𝑖 , 𝑥𝑗 ). Правило 2. Элементы, отнесенные к различным классам, должны иметь в сети как можно более отличающиеся представления. Это правило прямо противоположно первому. Правило 3. Если некоторое свойство особенно важно для принятия решения, то для его представления в сети необходимо использовать большое количество нейронов. Увеличение количества нейронов повышает достоверность принятого решения и устойчивость к помехам. Правило 4. В структуру нейронной сети должны быть встроены априорная информация и инварианты, что упрощает архитектуру сети и процесс ее обучения. 124 Это правило играет особую роль, поскольку правильная конфигурация сети обеспечивает ее специализацию, что очень важно по следующим причинам. Во-первых, нейронная сеть со специализированной структурой обычно включает значительно меньшее количество свободных параметров, которые нужно настраивать, чем полносвязная сеть. Из этого следует, что для обучения специализированной сети требуется меньше данных. При этом на обучение затрачивается меньше времени, и такая сеть обладает лучшей обобщающей способностью. Во-вторых, специализированные сети обладают большей пропускной способностью. Кроме того, стоимость создания специализированных нейронных сетей сокращается, поскольку их размер существенно меньше размера полносвязных сетей. Обучение нейронных сетей Самым важным свойством нейронных сетей является их способность обучаться на основе данных окружающей среды и в результате обучения повышать свою производительность. Обучение  это процесс, в котором свободные параметры нейронной сети настраиваются посредством моделирования среды, в которую эта сеть встроена. Тип обучения определяется способом подстройки этих параметров. Это определение процесса обучения предполагает следующую последовательность событий: - в нейронную сеть поступают стимулы из внешней среды; - в результате этого изменяются свободные параметры нейронной сети; - после изменения внутренней структуры нейронная сеть отвечает на возбуждения уже иным образом. Вышеуказанный список четких правил решения проблемы обучения называется алгоритмом обучения. Несложно догадаться, что не существует универсального алгоритма обучения, подходящего для всех архитектур нейронных сетей. Существует лишь набор средств, представленный множеством алгоритмов обучения, каждый из которых имеет свои достоинства. Алгоритмы обучения отличаются друг от друга способом настройки синаптических весов нейронов. Еще одной отличительной характеристикой является способ связи обучаемой нейронной сети с внешним миром. В этом контексте говорят о парадигме обучения, связанной с моделью окружающей среды, в которой функционирует данная нейронная сеть. Рассмотрим наиболее популярные модели обучения на основе коррекции ошибок и с использованием памяти. Обучение, основанное на коррекции ошибок (метод коррекции ошибок) Рассмотрим простейший случай нейрона k  единственного вычислительного узла выходного слоя нейронной сети прямого распространения (рис. 2.1, а). Нейрон k работает под управлением вектора сигнала х(n), производимого одним или несколькими скрытыми слоями нейронов, которые, в 125 свою очередь, получают информацию из входного вектора (возбуждения), передаваемого начальным узлам (входному слою) нейронной сети. Под n подразумевается дискретное время, или, более конкретно, номер шага итеративного процесса настройки синаптических весов нейрона k. Рисунок 10.14 Обучение методом коррекции ошибок. Выходной сигнал нейрона k обозначается yk(n). Этот сигнал является единственным выходом нейронной сети. Он будет сравниваться с желаемым выходом, обозначенным dk(n). В результате получим сигнал ошибки ek (n). По определению ek (n) = dk(n)  yk(n). Сигнал ошибки инициализирует механизм управления, цель которого заключается в применении последовательности корректировок к синаптическим весам нейрона k. Эти изменения нацелены на пошаговое приближение выходного сигнала yk(n) к желаемому dk(n). Эта цель достигается за счет минимизации функции стоимости или индекса производительности Е(n), определяемой в терминах сигнала ошибки следующим образом: 1 𝐸(𝑛) = 𝑒 2 (𝑛), 2 гдe Е(n)  текущее значение энергии ошибки. Пошаговая корректировка синаптических весов нейрона k продолжается до тех пор, пока система не достигнет устойчивого состояния (т.е. такого, при котором синаптические веса практически стабилизируются). В этой точке процесс обучения останавливается. Процесс, описанный выше, называется обучением, основанным на коррекции ошибок. Минимизация функции стоимости Е(n) выполняется по так называемому дельта-правилу, или правилу Видроу-Хоффа, названному так в честь его создателей. Обозначим через 𝑤𝑘𝑗 (𝑛) текущее значение синаптиче126 скогo веса 𝑤𝑘𝑗 нейрона k, соответствующего элементу 𝑥𝑗 (𝑛) вектора 𝑥(𝑛), на шагe дискретизации n. В соответствии с дельта-правилом изменение ∆𝑤𝑘𝑗 (𝑛), применяемое к синаптическому весу 𝑤𝑘𝑗 на этом шаге дискретизации, задается выражением ∆𝑤𝑘𝑗 (𝑛) = 𝛾𝑒𝑘 (𝑛)𝑥𝑗 (𝑛), (10.1) гдe   некоторая положительная константа, определяющая скорость обучения и используемая при переходе от одного шага процесса к другому. Из формулы (10.1) видно, что эту константу естественно именовать параметром скорости обучения. Вербально дельта-правило можно определить следующим образом. Корректировка, применяемая к синаптическому весу нейрона пропорциональна произведению сигнала ошибки на входной сигнал, его вызвавший. Определенное таким образом дельта-правило предполагает возможность прямого измерения сиrнала ошибки. Для обеспечения такого измерения требуется поступление желаемого отклика от некоторого внешнего источника, непосредственно доступного для нейрона k. Другими словами, нейрон k должен быть видимым для внешнего мира. На рисунке 10.14 видно, что обучение на основе коррекции ошибки по своей природе является локальным. Это прямо указывает на то, что корректировка синаптических весов по дельта-правилу может быть локализована в отдельном нейроне k. Вычислив величину изменения синаптическогo веса ∆𝑤𝑘𝑗 (𝑛), можно определить его новое значение для следующего шага дискретизации: 𝑤𝑘𝑗 (𝑛 + 1) = 𝑤𝑘𝑗 (𝑛) + ∆𝑤𝑘𝑗 (𝑛). Таким образом, 𝑤𝑘𝑗 (𝑛) и 𝑤𝑘𝑗 (𝑛 + 1) можно рассматривать как старое и новое значения синаптическогo веса 𝑤𝑘𝑗 . В математических терминах можно записать 𝑤𝑘𝑗 (𝑛) = 𝑧 −1 𝑤𝑘𝑗 (𝑛 + 1), где 𝑧 −1  оператор единичной задержки. Другими словами, оператор 𝑧 −1 представляет собой элемент памяти. На рисунке 10.14 видно, что обучение на основе коррекции ошибок  это пример замкнутой системы с обратной связью. Из теории управления известно, что устойчивость такой системы определяется параметрами обратной связи. В данном случае существует всего одна обратная связь. Для обеспечения устойчивости или сходимости итеративного процесса обучения требуется тщательный подбор коэффициента скорости обучения . Выбор параметра скорости обучения влияет также на точность и другие характеристики процесса обучения. Другими словами, параметр скорости обучения  играет 127 ключевую роль в обеспечении производительности процесса обучения на практике. Обучение на основе памяти При обучении на основе памяти весь прошлый опыт накапливается в большом хранилище правильно классифицированных примеров вида входвыход: {(𝐱 𝑖 , 𝑑𝑖 )}𝑁 𝑖=1 , где 𝑥𝑖  входной вектор, а 𝑑𝑖  соответствующий ему желаемый выходной сигнал. Не ограничивая общности, можно считать, что выходной сигнал является скаляром. Все алгоритмы обучения на основе памяти включают в себя две существенные составляющие: - критерий, используемый для определения окрестности тестового вектора xtest; - правило обучения, применяемое к примеру из окрестности тестового вектора. Все алгоритмы отличаются друг от друга способом реализации этих двух составляющих. В простейшем (хотя и эффективном) алгоритме обучения на основе памяти, получившем название правила ближайшего соседа, в окрестность включается пример, ближайший к тестовому. Например, вектор 𝐱 ∗ ∈ {𝐱1 , 𝐱 2 , … , 𝐱 𝑁 } считается ближайшим соседом вектора xtest, если выполняется условие min𝑖 𝑑(𝐱 𝑖 , 𝐱 test ) = 𝑑(𝐱 ∗ , 𝐱 test ), где 𝑑(𝐱 ∗ , 𝐱 test )  евклидово расстояние между векторами 𝐱 ∗ и 𝐱 test . Класс, к которому относится ближайший сосед, считается также классом тестируемого вектора 𝐱 test . Это правило не зависит от закона распределения, используемого при генерировании примеров обучения. Вариацией классификатора на основе ближайшего соседа является классификатор k ближайших соседей. Он описывается следующим образом. Находим k классифицированных соседей, ближайших к вектору 𝐱 test , где k некоторое целое число. Вектор 𝐱 test относим к тому классу (гипотезе), который чаще других встречается среди k ближайших соседей тестируемого вектора. 128 Лекция 11. Моделирование в условиях нечетко заданной информации     Определение нечеткого множества Основные типы функций принадлежности Операции над нечеткими множествами Понятие нечеткого высказывания. Операции над нечеткими высказываниями  Основные этапы нечеткого вывода Определение нечеткого множества Нечеткое множество представляет собой совокупность элементов произвольной природы, относительно которых нельзя с полной определенностью утверждать  принадлежит ли тот или иной элемент рассматриваемой совокупности данному множеству или нет. Другими словами, нечеткое множество отличается от обычного множества тем, что для всех или части его элементов не существует однозначного ответа на вопрос: "принадлежит или не принадлежит тот или иной элемент рассматриваемому нечеткому множеству?" можно этот вопрос задать и по-другому: "обладают или нет его элементы некоторым характеристическим свойством, которое может быть использовано для задания этого нечеткого множества?" для построения нечетких моделей систем само понятие нечеткого множества следует определить более строго, чтобы исключить неоднозначность толкования тех или иных его свойств. Математическое определение нечеткого множества. Формально нечеткое множество  определяется как множество упорядоченных пар или кортежей вида: , где x является элементом некоторого универсального множества или универсума х, а A(x)  функция принадлежности, которая ставит в соответствие каждому из элементов x  X некоторое действительное число из интервала [0,1], т. е. Данная функция определяется в форме отображения: A(x) : X  [0,1] (11.1) При этом значение A(x) = 1 для x  X означает, что элемент х определенно принадлежит нечеткому множеству A, а значение A(x) = 0 означает, что элемент х определенно не принадлежит нечеткому множеству A. Формально конечное нечеткое множество записывают в виде: A  { x1,  A ( x1) ,  x2 ,  A ( x2 ) , ,  xn ,  A ( xn ) } , а в общем случае  в виде: A  x,  A ( x)  . Из всех нечетких множеств выделяют два частных случая, которые по сути совпадают со своими классическими аналогами. 129 Пустое нечеткое множество. В теории нечетких множеств сохраняют свой смысл некоторые специальные классические множества. Так, например, пустое нечеткое множество или множество, которое не содержит ни одного элемента, по-прежнему обозначается через  и формально определяется как такое нечеткое множество, функция принадлежности которого тождественно равна нулю для всех без исключения элементов:   0 . Универсум. Что касается другого специального множества, то так называемый универсум обозначаемый через х. Формально удобно считать, что функция принадлежности универсума как нечеткого множества тождественно равна единице для всех без исключения элементов:  X  1 . Носителем нечеткого множества a называется совокупность всех элементов универсума x, для которых A (x) > 0. Нечеткие множества могут быть заданы двумя основными способами: в форме списка и аналитически. Задание в форме списка  это явное перечисление всех элементов и соответствующих им значений функции принадлежности, образующих рассматриваемое нечеткое множество. При этом зачастую элементы с нулевыми значениями функции принадлежности просто не указываются в данном списке. Этот способ подходит для задания нечетких множеств с конечным дискретным универсумом x и небольшим числом элементов. В этом случае нечеткое множество удобно записывать в виде: A  { x1,  A ( x1) ,  x2 ,  A ( x2 ) , ,  xn ,  A( xn ) } , где n – рассматриваемое число элементов нечеткого множества. Аналитическое задание в форме математического выражения для соответствующей функции принадлежности может быть использовано для задания произвольных нечетких множеств как с конечным, так и с бесконечным носителем. В этом случае нечеткое множество удобно записывать в виде: A  x,  A ( x)  , где  A ( x) — некоторая функция, заданная аналитически в форме математического выражения f(x) или графически в форме некоторой кривой. Наиболее часто используемые виды функций принадлежности будут рассмотрены далее. Основные типы функций принадлежности Формальное определение нечеткого множества (11.1) не накладывает никаких ограничений на выбор конкретной функции принадлежности для его представления. Однако на практике удобно использовать те из них, которые допускают аналитическое представление в виде некоторой простой математической функции. Это упрощает не только соответствующие численные расчеты, но и сокращает вычислительные ресурсы, необходимые для хранения отдельных значений этих функций принадлежности. Кусочно-линейные функции принадлежности Эти функций принадлежности, как следует из их названия, состоят из отрезков прямых линий, образуя непрерывную или кусочно-непрерывную функцию. Наиболее характерным примером таких функций являются "тре130 угольная" (рисунок 11.1, а) и "трапециевидная" (рисунок 11.1, б) функции принадлежности. Рисунок 01.1 - Графики функций принадлежности треугольной (а) и трапециевидной (б) формы Первая из этих функций принадлежности в общем случае может быть задана аналитически следующим выражением: x  a,  0, x a  , a  x  b, b  a  A ( x)    c  x , b  x  c, c b  0, c  x,  где A, B, C  некоторые числовые параметры, принимающие произвольные действительные значения и упорядоченные отношением: a  b  c . Трапециевидная функция принадлежности в общем случае может быть задана аналитически следующим выражением: x  a,  0, xa  , a  x  b, b  a   A ( x)   1 b  x  c, d  x  , c  x  d, d c d  x,  0, 131 где A, B, C, D  некоторые числовые параметры, принимающие произвольные действительные значения и упорядоченные отношением: a  b  c  d . Эти функции используются для задания таких свойств множеств, которые характеризуют неопределенность типа: «приблизительно равно», «среднее значение», «расположен в интервале», «подобен объекту», «похож на предмет» и др. Для простоты математического описания обычно выбираются эти функции принадлежности. Z-образные и S-образные функции принадлежности Эти функции принадлежности также получили свое название по виду кривых, которые представляют их графики. Первая из функций этой группы называется Z-образной кривой или сплайн-функцией и в общем случае может быть задана аналитически следующим выражением: 1, x  a,   1 1  xa   ZA ( x, a, b)    cos    , a  x  b, 2 2 b  a     0, x  b, где A, B  некоторые числовые параметры, принимающие произвольные действительные значения и упорядоченные отношением: a  b . График этой функции изображен на рисунке 11.2.е Рисунок 01.2 - График Z-образной функции принадлежности Эти функции используются для представления таких свойств нечетких множеств, которые характеризуются неопределенностью типа: «малое количество», «небольшое значение», «незначительная величина», «низкая себестоимость продукции», «низкий уровень цен или доходов», «низкая процентная ставка» и многих других. Общим для всех таких ситуаций является слабая степень проявления того или иного качественного или количественного признака. Вторая из функций рассматриваемой группы называется s-образной кривой или сплайн-функцией (рисунок 11.3) и в общем случае может быть задана аналитически следующим выражением: 132 0, x  a,   1 1  xa  S  A ( x, a, b)    cos    , a  x  b, 2 2 b  a     1, x  b, где a, b  некоторые числовые параметры, принимающие произвольные действительные значения и упорядоченные отношением: a  b . Рисунок 01.3 - график s-образной функции принадлежности Рассмотренные s-образные функции используются для представления таких нечетких множеств, которые характеризуются неопределенностью типа: «большое количество», «большое значение», «значительная величина», «высокий уровень доходов и цен», «высокая норма прибыли», и многих других. П-образные функции принадлежности К данному типу функций принадлежности можно отнести целый класс кривых, которые по своей форме напоминают колокол, сглаженную трапецию или букву "п". В общем случае задается аналитически следующим выражением: ПA ( x; a, b, c, d )  SA ( x; a, b)   ZA ( x; c, d ) , где A, B, C, D  некоторые числовые параметры, принимающие произвольные действительные значения и упорядоченные отношением: a  b  c  d , а знак «» обозначает обычное арифметическое произведение значений соответствующих функций. График этой функции изображен на рисунке 11.4. Рисунок 01.4 - График П-образной функции принадлежности 133 Операции над нечеткими множествами Пусть A и B  произвольные (конечные или бесконечные) нечеткие множества, заданные на одном и том же универсуме Х. Равенство нечетких множеств. Два нечетких множества A ={х, A(X)} и B={х, B(X)} считаются равными, если их функции принадлежности принимают равные значения на всем универсуме Х: A(x) = B(x) для любого x  X. (11.2) Равенство множеств в данном случае записывается как A = B. Нечеткое подмножество. Нечеткое множество A ={х, A(X)} является нечетким подмножеством нечеткого множества B={х, B(X)} (записывается A  B, так же как и для обычных множеств) тогда и только тогда, когда значения функции принадлежности первого не превосходят соответствующих значений функции принадлежности второго, т. е. выполняется следующее условие: A(X)  B(X) для любого x  X. При этом в случае A  B часто говорят, что нечеткое множество B доминирует нечеткое множество A, а нечеткое множество A содержится в нечетком множестве B. Рассмотренное выше определение характерно для так называемого несобственного подмножества, когда не исключается случай возможного равенства двух нечетких множеств A и B. Если же в определении нечеткоuо подмножества исключается равенство соответствующих нечетких множеств в форме (11.2), то в этом случае A называется собственным нечетким подмножеством B и обозначается: A  B. При этом часто говорят, что нечеткое множество B строго доминирует нечеткое множество A, а нечеткое множество A строго содержится в нечетком множестве B. Из определения нечеткого подмножества следует, что пустое множество является собственным подмножеством любого нечеткого множества, не являющегося в свою очередь пустым. Если для двух нечетких множеств A и B, заданных на одном универсуме, не выполняется ни отношение A  B, ни отношение B  A, то говорят, что нечеткие множества A и B несравнимые. Пересечение. Пересечением двух нечетких множеств A и B будем называть некоторое третье нечеткое множество C, заданное на этом же универсуме Х, функция принадлежности которого определяется по следующей формуле: C (x)  min{ A (x),  B (x)}. 134 (11.3) Операция пересечения нечетких множеств по аналогии с обычными множествами обозначается знаком «». В этом случае результат операции пересечения двух нечетких множеств записывается в виде: C = A  B. Операция min-пересечения нечетких множеств корректна в том смысле, что она сохраняет свое определение для случая обычных множеств. А именно, если в качестве нечетких множеств взять обычные множества А и В как их частный случай, то определение операции пересечения (11.3) превратится в определение операции пересечения, записанное в терминах характеристических функций А и В. Объединение. Объединением двух нечетких множеств A и B называется некоторое третье нечеткое множество D, заданное на этом же универсуме Х, функция принадлежности которого определяется по следующей формуле:  D (x)  max{ A (x),  B (x)}. Операция объединения нечетких множеств по аналогии с обычными множествами обозначается знаком «». В этом случае результат операции объединения двух нечетких множеств записывается в виде: D = A  B. Разность. Разностью двух нечетких множеств A и B называется некоторое третье нечеткое множество E, заданное на этом же универсуме Х, функция принадлежности которого определяется по следующей формуле:  E (x)  max{ A (x)- B (x),0}. где под знаком максимума используется обычная операция арифметической разности двух чисел. Операция разности двух нечетких множеств по аналогии с обычными множествами обозначается знаком "\". В этом случае результат операции разности двух нечетких множеств можно записать в виде: E = A\B. Симметрическая разность. Следует заметить, что операция разности двух нечетких множеств в отличие от операций объединения и пересечения не является коммутативной, т. е. в общем случае A\B  B\A. По аналогии с обычными множествами иногда оказывается полезной операция симметрической разности двух нечетких множеств A и B (будем обозначать ее через AB). По определению:  AB (x) |  A (x) -  B (x)| , где в правой части выражения применяется операция модуля (или вычисления абсолютного значения) числа. При этом оказывается справедливым следующее утверждение: 𝐴∆𝐵 = 𝐴\𝐵 ⋃ 𝐵\𝐴, т. е. симметрическая разность двух 135 нечетких множеств представляет собой объединение двух разностей нечетких множеств A и B. Введенные в рассмотрение операции над нечеткими множествами, основанные на использовании операций mах() и min(), получили наибольшее распространение при решении практических задач нечеткого моделирования. Тем не менее, операции min-пересечения и mах-объединения нечетких множеств было бы неверно считать единственными, поскольку в общем случае, возможны и другие альтернативные способы их определения. При этом большинство из подобных альтернативных операций также оказываются корректными в смысле соответствия обычным теоретико-множественным операциям. Целесообразность применения альтернативных операций может быть обусловлена специфическими особенностями конкретных практических задач и желанием повысить адекватность интерпретации используемых нечетких моделей на основе учета разнообразных смысловых оттенков соответствующих им логических связок "И" И "ИЛИ". Так существует вероятностный подход к определению функций принадлежности и операций над нечеткими множествами, согласно которому значение функции принадлежности A(x) для любого x  X трактуется как вероятность отнесения элемента x нечеткому множеству A. В свою очередь значения функций принадлежности пересечения и объединения нечетких множеств A и B определяются как вероятности суммы и произведения случайных событий, состоящих в отнесении элемента x нечетким множествам A или B. Операции пересечения и объединения, определяемые с точки зрения вероятностного подхода, называют алгебраическим пересечением и объединением. Алгебраическим пересечением (или алгебраическим произведением) двух нечетких множеств A и B называется некоторое третье нечеткое множество C, заданное на этом же универсуме X, функция принадлежности которого определяется по следующей формуле:  A B (x)   A (x)   B (x) , т. е. как результат обычного арифметического произведения соответствующих значений функций принадлежности. Алгебраическим объединением (или алгебраической суммой) двух нечетких множеств A и B называется нечеткое множество D, заданное на этом же универсуме X, функция принадлежности которого определяется по следующей формуле:  A B (x)   A (x)   B (x)- A (x)   B (x) , где справа от знака равенства использованы обычные арифметические операции. 136 Дополнение. Специально следует остановиться на унарной операции дополнения нечеткого множества. Дополнение нечеткого множества A обозначается через 𝐴̅ и определяется как нечеткое множество, функция принадлежности которого определяется по следующей формуле:  A (x)  1- A (x). Особенность рассматриваемых операций над нечеткими множествами состоит в том, что для них не выполняются закон исключенного третьего и закон тождества (свойства дополняемости операций пересечения и объединения). А именно, в общем случае оказываются справедливыми неравенства: 𝐴 ∩ 𝐴̅ ≠ ∅, 𝐴 ∪ 𝐴̅ ≠ 𝑋. Возведение в степень. Пусть A ={х, A(X)} – произвольное нечеткое множество, заданное на универсуме X; k  положительное действительное число. Для нечеткого множества A чисто формально можно определить операцию возведения нечеткого множества в степень k как нечеткое множество B ={х, B(X)}, заданное на этом же универсуме X, функция принадлежности которого определяется по формуле:  B (x)  ( A (x))k . Эту операцию иногда обозначают через Ak. В частности, при k = 2 данная операция называется концентрированием, а при k = 0.5  растяжением. Понятие нечеткого высказывания. Операции над нечеткими высказываниями В предложенном л. Заде варианте нечеткой логики множество истинностных значений высказываний обобщается до интервала действительных значений [0, 1], что позволяет высказыванию принимать любое значение истинности из этого интервала. Это численное значение является количественной оценкой степени истинности высказывания, относительно которого нельзя с полной уверенностью заключить о его истинности или ложности. Исходным понятием нечеткой логики является понятие элементарного нечеткого высказывания. Элементарное нечеткое высказывание. В общем случае элементарным нечетким высказыванием называется повествовательное предложение, выражающее законченную мысль, относительно которой мы можем судить об ее 137 истинности или ложности только с некоторой степенью уверенности. Сами элементарные нечеткие высказывания иногда называют просто нечеткими высказываниями. Главным отличием элементарного нечеткого высказывания от элементарного высказывания математической логики является следующий факт. Множество значений истинности элементарных высказываний классической математической логики состоит из двух элементов: ("истина", "ложь") ({и, л} или {0, 1}), при этом значению "истина" соответствует цифра 1 или буква и, а значению "ложь"  цифра 0 или буква л. В нечеткой логике степень истинности элементарного нечеткого высказывания принимает значение из замкнутого интервала [0, 1], причем 0 и 1 являются предельными значениями степени истинности и совпадают со значениями "ложь" и "истина” соответственно. Для оценки степени истинности произвольного нечеткого высказывания удобно ввести в рассмотрение специальное отображение T, которое действует из множества рассматриваемых нечетких высказываний И в интервал [0, 1], т. е. Т: И  [0,1] . Это отображение будем называть отображением истинности нечетких высказываний. В этом случае значение истинности некоторого нечеткого высказывания а  И будем обозначать через Т(а). Нечеткие высказывания могут комбинироваться с помощью нечетких логических операций или связок, которые и рассматриваются ниже. Логическое отрицание Отрицанием нечеткого высказывания a (записывается как  A и читается "не A", "неверно, что A") называется унарная логическая операция, результат которой является нечетким высказыванием, истинность которого по определению принимает значение Т (  А)  1  Т ( А) . Логическая конъюнкция Конъюнкцией нечетких высказываний а и в (записывается как: А  В и читается  "А и В") называется бинарная логическая операция, результат которой является нечетким высказыванием, истинность которого определяется по формуле Т ( А  В)  min(Т ( А), T ( B)) . (11.2) Логическую конъюнкцию нечетких высказываний также называют нечетким логическим "и", нечеткой конъюнкцией или min-конъюнкцией и иногда записывают в форме A АND В. При этом исторически принято считать формулу (11.2) основной для определения степени истинности ее результата. Логическая дизъюнкция Дизъюнкцией нечетких высказываний а и в (записывается как: А  В и читается  "А или В") называется бинарная логическая операция, результат 138 которой является нечетким высказыванием, истинность которого определяется по формуле: Т ( А  В)  mах(Т ( А),T ( B)) . (11.3) Логическую дизъюнкцию нечетких высказываний также называют нечетким логическим нечетким неисключающим "или", нечеткой дизъюнкцией или mах-дизъюнкцией и иногда записывают в форме A ОR В. При этом исторически принято считать формулу (11.3) основной для определения степени истинности ее результата. Нечеткая импликация Нечеткой импликацией или просто импликацией нечетких высказываний А и В (записывается как: А  В и читается  "из А следует В", "если А, то В") называется бинарная логическая операция, результат которой является нечетким высказыванием, истинность которого может принимать значение, определяемое по одной из следующих формул: Классическая нечеткая импликация, предложенная л. Заде Т ( А  В)  max{min{Т ( А), T ( B)}, 1  Т ( А)}. Эту форму нечеткой импликации называют также нечеткой импликацией Заде. Классическая нечеткая импликация для случая T ( A)  T ( B) Т ( А  В)  max{Т (А),T ( B)}  max{1  Т ( А),T ( B)}. Эту форму нечеткой импликации иногда называют нечеткой импликацией Гёделя. Нечеткая импликация, предложенная Э. Мамдани Т ( А  В)  min{Т ( А),T ( B)} ; и другие. Нечеткая импликация играет важную роль в процессе нечетких логических рассуждений. Так же, как и в формальной математической логике первый операнд нечеткой импликации называется посылкой, а второй  заключением. Нечеткая эквивалентность Эквивалентность в нечетких высказываний А и В или просто нечеткой эквивалентностью (записывается как: А  В и читается  «А эквивалентно В») называется бинарная логическая операция, результат которой является нечетким высказыванием, истинность которого определяется по следующей формуле: Т ( А  В)  min{max{T (  A),T ( B)}, max{T ( A),T ( B)}}. 139 Так же, как в классической математической логике, в нечеткой логике с помощью рассмотренных логических связок могут быть образованы достаточно сложные нечеткие высказывания. При этом для явного указания порядка их следования используются круглые скобки, а иногда  и приоритет соответствующих нечетких логических операций. Основные этапы нечеткого вывода Системы нечеткого вывода предназначены для преобразования значений входных переменных процесса управления в выходные переменные на основе использования нечетких правил продукций. Для этого системы нечеткого вывода должны содержать базу правил нечетких продукций и реализовывать нечеткий вывод заключений на основе посылок или условий, представленных в форме нечетких лингвистических высказываний. Таким образом, основными этапами нечеткого вывода являются: - Формирование базы правил систем нечеткого вывода; - Фаззификация входных переменных; - Агрегирование подусловий в нечетких правилах продукций; - Активизация или композиция подзаключений в нечетких правилах продукции; - Аккумулирование заключений нечетких правил продукций; - Дефаззификация. Этап 1. Формирование базы правил систем нечеткого вывода. База правил систем нечеткого вывода предназначена для формального представления эмпирических знаний или знаний экспертов в той или иной проблемной области. В системах нечеткого вывода используются правила нечетких продукций, в которых условия и заключения сформулированы в терминах нечетких лингвистических высказываний рассмотренных выше видов. Совокупность таких правил будем далее называть базами правил нечетких продукций. База правил нечетких продукций. Представляет собой конечное множество правил нечетких продукций, согласованных относительно используемых в них лингвистических переменных. Наиболее часто база правил представляется в форме структурированного текста: ПРАВИЛО 1: ЕСЛИ "УСЛОВИЕ 1" ТО "ЗАКЛЮЧЕНИЕ 1" ( F1 ) ПРАВИЛО 2: ЕСЛИ "УСЛОВИЕ 2" ТО "ЗАКЛЮЧЕНИЕ 2" ( F2 ) ................................................ ПРАВИЛО N: ЕСЛИ "УСЛОВИЕ N" ТО "ЗАКЛЮЧЕНИЕ N" ( Fn ) Здесь через Fi (i 1,2, , n) обозначены коэффициенты определенности или весовые коэффициенты соответствующих правил. Эти коэффициенты могут 140 принимать значения из отрезка [0, 1]. В случае если эти весовые коэффициенты отсутствуют, удобно принять, что их значения равными 1. Входные и выходные лингвистические переменные. В системах нечеткого вывода лингвистические переменные, которые используются в нечетких высказываниях подусловий правил нечетких продукций, часто называют входными лингвистическими переменными, а переменные, которые используются в нечетких высказываниях подзаключений правил нечетких продукций, часто называют выходными лингвистическими переменными. Таким образом, при задании или формировании базы правил нечетких продукций необходимо определить: множество правил нечетких продукций: P  {R1 , R2 ,, Rn } в форме (1.1), множество входных лингвистических переменных: V  {1 ,  2 ,,  m } и множество выходных лингвистических переменных: W  {1 ,2 ,,s } . Тем самым база правил нечетких продукций считается заданной, если заданы множества р, v, w. Входная βi V или выходная ωi W лингвистическая переменная считается заданной или определенной, если для нее определено базовое терм-множество с соответствующими функциями принадлежности каждого терма. Наиболее распространенным случаем является использование в качестве функций принадлежности термов треугольных или трапециевидных функций принадлежности. Этап 2. Фаззификация входных переменных. В контексте нечеткой логики под фаззификацией понимается не только отдельный этап выполнения нечеткого вывода, но и собственно процесс или процедура нахождения значений функций принадлежности нечетких множеств (термов) на основе обычных (не нечетких) исходных данных. Фаззификацию еще называют введением нечеткости. Целью этапа фаззификации является установление соответствия между конкретным (обычно численным) значением отдельной входной переменной системы нечеткого вывода и значением функции принадлежности соответствующего ей терма входной лингвистической переменной. После завершения этого этапа для всех входных переменных должны быть определены конкретные значения функций принадлежности по каждому из лингвистических термов, которые используются в подусловиях базы правил системы нечеткого вывода. Формально процедура фаззификации выполняется следующим образом. До начала этого этапа предполагаются известными конкретные значения всех входных переменных системы нечеткого вывода, т. е. множество значений V '  {a1 , a2 ,, am } . В общем случае каждое ai  X i „где X i – универсум лингвистической переменной  i . Эти значения могут быть получены либо с помощью датчиков, либо некоторым другим, внешним по отношению к системе нечеткого вывода способом. Далее рассматривается каждое из подусловий вида «  i есть а» правил системы нечеткого вывода, где а' – некоторый терм с известной функцией 141 принадлежности (x). При этом значение ai используется в качестве аргумента (x), тем самым находится количественное значение i'  (ai ) . Это значение и является результатом фаззификации подусловия « i есть а'». Этап фаззификации считается законченным, когда будут найдены все значения i'  (ai ) для каждого из подусловий всех правил, входящих в рассматриваемую базу правил системы нечеткого вывода. Это множество значений обозначим черю B  {bi' }. При этом если некоторый терм а" лингвистическои переменной i не присутствует ни в одном из нечетких высказываний, то соответствующее ему значение функции принадлежности не находится в процессе фаззификации. Этап 3. Агрегирование подусловий в нечетких правилах продукций. Агрегирование представляет собой процедуру определения степени истинности условий по каждому из правил системы нечеткого вывода. Формально процедура агрегирования выполняется следующим образом. До начала этого этапа предполагаются известными значения истинности всех подусловий системы нечеткого вывода, т. е. Множество значений B  {bi' }. Далее рассматривается каждое из условий правил системы нечеткого вывода. Если условие правила представляет собой одиночное нечеткое высказывание, то степень его истинности равна соответствующему значению bi' . Если же условие состоит из нескольких подусловий, причем лингвистические переменные в подусловиях попарно не равны друг другу, то определяется степень истинности сложного высказывания на основе известных значений истинности подусловий. При этом значения bi' используются в качестве аргументов соответствующих логических операций. Тем самым находятся количественные значения истинности всех условий из правил системы нечеткого вывода. Этап агрегирования считается законченным, когда будут найдены все значения bk'' для каждого из правил Rk входящих в рассматриваемую базу правил р системы нечеткого вывода. Это множество значений обозначим B  {b1, b2, , bn} . Этап 4. Активизация или композиция подзаключении в нечетких правилах продукции. Активизация в системах нечеткого вывода представляет собой процедуру или процесс нахождения степени истинности каждого из подзаключений правил нечетких продукций. Формально процедура активизации выполняется следующим образом. До начала этого этапа предполагаются известными значения истинности всех условий системы нечеткого вывода, т. Е. Множество значений B  {b1, b2, , bn} и значения весовых коэффициентов Fi для каждого правила. Далее рассматривается каждое из заключений правил системы нечеткого вывода. Если заключение правила представляет собой одиночное нечеткое 142 высказывание, то степень его истинности равна алгебраическому произведению соответствующего значения b1 на весовой коэффициент Fi . Если же заключение состоит из нескольких подзаключений, причем лингвистические переменные в подзаключениях попарно не равны друг другу, то степень истинности каждого из подзаключений равна алгебраическому произведению соответствующего значения b1 на весовой коэффициент Fi . Таким образом, находятся все значения ck степеней истинности подзаключений для каждого из правил Rk , входящих в рассматриваемую базу правил р системы нечеткого вывода. Это множество значений обозначим через C  {c1 , c2 ,, cq }, где q – общее количество подзаключений в базе правил. После нахождения множества C  {c1, c2 , , cq } определяются функции принадлежности каждого из подзаключений для рассматриваемых выходных лингвистических переменных. Для этой цели можно использовать один из методов, являющихся модификацией того или иного метода нечеткой композиции: - min-активизация: ( y)  min{c , ( y)} ; i - prod-активизация: - average-активизация: ( y)  c  ( y) ; i ( y)  0,5  {c  ( y)} , i где (y) – функция принадлежности терма, который является значением некоторой выходной переменной  j заданной на универсуме y. Этап активизации считается законченным, когда для каждой из выходных лингвистических переменных, входящих в отдельные подзаключения правил нечетких продукций будут определены функции принадлежности нечетких множеств их значений, т. е. Совокупность нечетких множеств: С1, С2 , , Сq , где q - общее количество подзаключений в базе правил системы нечеткого вывода. Этап 5. Аккумулирование заключений нечетких правил продукций. Аккумуляция или аккумулирование в системах нечеткого вывода представляет собой процедуру или процесс нахождения функции принадлежности для каждой из выходных лингвистических переменных множества W  {1, 2 , , s } . Цель аккумуляции заключается в том, чтобы объединить или аккумулировать все степени истинности заключений (подзаключений) для получения функции принадлежности каждой из выходных переменных. Причина 143 необходимости выполнения этого этапа состоит в том, что подзаключения, относящиеся к одной и той же выходной лингвистической переменной, принадлежат различным правилам системы нечеткого вывода. Формально процедура аккумуляции выполняется следующим образом. До начала этого этапа предполагаются известными значения истинности всех подзаключений для каждого из правил Rk , входящих в рассматриваемую базу правил р системы нечеткого вывода, в форме совокупности нечетких множеств: С1 , С2 ,, Сq , где q – общее количество подзаключений в базе правил. Далее последовательно рассматривается каждая из выходных лингвистических переменных  j W и относящиеся к ней нечеткие С j1 , С j 2 ,, С jq . Результат аккумуляции для выходной лингвистической переменной  j W определяется как объединение нечетких множеств С j1 , С j 2 ,, С jq ). Этап аккумуляции считается законченным, когда для каждой из выходных лингвистических переменных будут определены итоговые функции принадлежности нечетких множеств их значений, т. Е. Совокупность нечетких множеств: С1 ' , С2 ' ,, СS ' , где S – общее количество выходных лингвистических переменных в базе правил системы нечеткого вывода. Этап 6. Дефаззификация. Дефаззификация в системах нечеткого вывода представляет собой процедуру или процесс нахождения обычного (не нечеткого) значения для каждой из выходных лингвистических переменных множества W  {1, 2 , , s } . Цель дефаззификации заключается в том, чтобы, используя результаты аккумуляции всех выходных лингвистических переменных, получить обычное количественное значение каждой из выходных переменных, которое может быть использовано специальными устройствами, внешними по отношению к системе нечеткого вывода. Действительно, применяемые в современных системах управления устройства и механизмы способны воспринимать традиционные команды в форме количественных значений соответствующих управляющих переменных. Именно по этой причине необходимо преобразовать нечеткие множества в некоторые конкретные значения переменных. Поэтому дефаззификацию называют также приведением к четкости. Формально процедура дефаззификации выполняется следующим образом. До начала этого этапа предполагаются известными функции принадлежности всех выходных лингвистических переменных в форме нечетких множеств: С1 ' , С2 ' ,, СS ' , где S – общее количество выходных лингвистических переменных в базе правил системы нечеткого вывода. Далее последовательно рассматривается каждая из выходных лингвистических переменных  j W и относящееся к ней нечеткое множество С j . Результат дефаззификации для выходной лингвистической переменной  j определяется в виде количе144 ственного значения yi  R , получаемого по одной нз рассматриваемых ниже формул. Этап дефаззификации считается законченным, когда для каждой из выходных лингвистических переменных будут определены итоговые количественные значения в форме некоторого действительного числа, т. Е. В виде y1, y2 , , yS , где s – общее количество выходных лингвистических переменных в базе правил системы нечеткого вывода. Для выполнения численных расчетов на этапе дефаззификации могут быть использованы следующие формулы, получившие название методов дефаззификации. Метод центра тяжести. Центр тяжести рассчитывается по формуле: Max  x   ( x)dx , y  Min Max Min  ( x)dx где у – результат дефаззификации; х – переменная, соответствующая выходной переменной ; (x) – функция принадлежности нечеткого множества, соответствующего выходной переменной  после этапа аккумуляции; мin, мaх – левая и правая точки интервала носителя нечеткого множества рассматриваемой выходной переменной . При дефаззификации методом центра тяжести обычное (не нечеткое) значение выходной переменной равно абсциссе центра тяжести площади, ограниченной графиком кривой функции принадлежности соответствующей выходной переменной. Метод центра тяжести для одноточечных множеств. Центр тяжести рассчитывается по формуле: n  xi  ( xi ) y  i 1 ’ n  ( xi ) i 1 где n – число одноточечных (одноэлементных) нечетких множеств, каждое из которых характеризует единственное значение рассматриваемой выходной лингвистической переменной. Метод центра площади. Центр площади равен у = u , где значение u определяется из уравнения: Min ( x)dx  u u Max ( x)dx 145 Другими словами, центр площади равен абсциссе, которая делит площадь, ограниченную графиком кривой функции принадлежности соответствующей выходной переменной, на две равные части. Иногда центр площади называют биссектрисой площади. Этот метод не может быть использован в случае одноточечных множеств. Метод левого модального значения. Левое модальное значение рассчитывается по формуле: y  min{ xm} , где xm – модальное значение (мода) нечеткого множества, соответствующего выходной переменной  после аккумуляции. Другими словами, значение выходной переменной определяется как мода нечеткого множества для соответствующей выходной переменной или наименьшая из мод (самая левая), если нечеткое множество имеет несколько модальных значений. Метод правого модального значения. Правое модальное значение рассчитывается по формуле: y  max{xm} , где xm – модальное значение (мода) нечеткого множества для выходной переменной  после аккумуляции. В этом случае значение выходной переменной также определяется как мода нечеткого множества для соответствующей выходной переменной или наибольшая из мод (самая правая), если нечеткое множество имеет несколько модальных значений. 146 Лекция 12. Сети Петри  Общие сведения о сетях Петри  Задачи анализа сетей Петри  Дерево достижимости и анализ сетей Общие сведения о сетях Петри Сети Петри используются для моделирования асинхронных систем, функционирующих как совокупность параллельных взаимодействующих процессов. Анализ сетей Петри позволяет получить информацию о структуре и динамическом поведении моделируемой системы. Причинно-следственная связь событий в асинхронных системах задается множеством отношений вида "условия-события". Построение моделей систем в виде сетей Петри заключается в следующем: 1. Моделируемые процессы описываются множеством событий (действий) и условий определяющих возможность наступления этих событий, а также причинно-следственными отношениями, устанавливаемыми на множестве пар "события-условия". 2. Определяются события-действия, последовательность выполнения которых управляется состояниями системы. Состояния системы задаются множеством условий, формируемых в виде предикатов. Количественно условия характеризуются величиной которая выражается числами натурального ряда. 3. Условия, в зависимости от значений их количественных характеристик, могут выполняться или нет. Выполнение условий обеспечивает возможность реализации событий. Условия, с фактом выполнения которых связывается возможность реализации событий, называются предусловиями. Реализация события обеспечивает возможность выполнения других условий, находящихся с предусловиями в причинно-следственной связи. Эти условия называются постусловиями. В сетях Петри условия - это позиции, а события - переходы. В соответствии с этим граф сети Петри является двудольным ориентированным мультиграфом. Изображение позиции и перехода на графе показано на рисунке 12.1. а) б) Рисунке 12.1. а) изображение позиции; б) изображение перехода. 147 Ориентированные дуги могут соединять только позиции и переходы в прямом и обратном направлении (свойство двудольности). Сеть Петри является мультиграфом, так как допускается кратность дуг между позициями и переходами (вершинами графа). Пример графа сети Петри приведен на рис.2. B графах сети Петри количественные характеристики условий (числа натурального ряда) принято изображать числом меток в соответствующих позициях (см. рисунке 12.2). Рисунок 12.2. Пример графа сети Петри. Последовательности событий отображаются срабатываниями переходов. Выполнение какого-либо условия связано с появлением одной или нескольких меток в соответствующей этому условию позиции. Соглашения о правилах срабатывания переходов является способом выражения причинноследственных связей между условиями и событиями в системе. При моделировании гибких производственных систем позиции отражают отдельные операции производственного процесса (например: транспортировка заготовки к конвейеру, передвижение заготовки к станку конвейером, обработку детали) или состояния компонентов ГПС (например: робота, конвейера, станка). Наличие метки в одной из позиций соответствует состоянию выполнения некоторой из технологических операций либо состояние, в котором пребывают некоторые из компонентов ГПС. Переходы соответствуют событиям, отображающим начало или завершение моделируемых операций. Например, переход интерпретируется как событие, связанное с завершением операции транспортирования заготовки роботом и ее установки на конвейере, а также с началом операции перемещения заготовки конвейером к станку. То есть Присвоение меток позициям сети Петри называют маркировкой сети. Динамика сетей Петри связана с механизмом изменения маркировок позиций и соглашениями о правилах срабатывания переходов. Переход срабатывает, если в каждой входной позиции (предусловии) число меток не меньше числа дуг, исходящих из позиции в данный переход. Такие переходы называют возбужденными, их срабатывание может наступить через любой конечный промежуток времени после возбуждения. В результате срабатывания из всех входных позиций перехода исключается число меток равное числу дуг, вы148 ходящих из соответствующей позиции в переход, а в выходные позиции данного перехода добавляется число меток равное числу дуг» исходящих из перехода в соответствующую выходную позицию. На рисунке 10.3 а) показан возбужденный переход, а перехода на рис. 12.3 б) невозбужден. а) б) Рисунок 12.3 а) возбужденный переход, б) невозбужденный переход. Причем маркировка на рис.3 б получена в результате срабатывания возбужденного перехода на рис.3 а. Заметим, что срабатывание перехода предполагается неделимым актом, то есть изменение маркировок всех связанных с данным переходом входных и выходных позиций осуществляется мгновенно. Для более глубокого понимания существа использования аппарата сетей Петри при описании совместной работы совокупности параллельных взаимодействующих процессов рассмотрим основные типы взаимодействия и синхронизации процессов. Взаимодействие процессов требует распределения ресурсов между ними. Чтобы система работала правильно распределением ресурсов необходимо управлять. Это управление в основном сводится к задачам синхронизации взаимодействия процессов. При этом изучается ряд задач синхронизации ставших классическими: - задача о взаимном исключении; - задача о производителе/потребителе; - задача об обедающих мудрецах; - задача о чтении/записи; - p - и V - операции над семафорами. Другие механизмы синхронизации процессов включают решение перечисленных задач. Знание этих задач и приобретение навыков их применения позволяет успешно справляться с весьма не простым делом описания функционирования систем сетями Петри. Задача о взаимном исключении Данная задача возникает в условиях, когда несколько процессов разделяют общую переменную. Каждый процесс может вначале считать значение переменной, затем вычислить новое значение и записать его на то же место. Если два процесса одновременно будут выполнять указанную последовательность действий, то может возникнуть неправильная работа системы. Например, оба процесса считают по очереди старое значение переменной, а 149 при записи одно из новых значений записанное первым будет уничтожено. Таким образом, результат работы одного из двух процессов будет утерян. Для правильной работы системы необходимо обеспечить механизм взаимного исключения, при котором одновременно не более чем один процесс имеет доступ к разделяемой переменной. Часть программного кода процесса, в котором выполняется доступ к разделяемой переменной и при этом требуется защита от доступа к разделяемой переменной другого процесса, называется критической секцией. Механизм взаимного исключения работает таким образом, что при выполнении критической секции какого-либо процесса, критические секции других процессов блокируются. Взаимодействие двух процессов через механизм взаимного исключения критических секций представлен сетью Петри на рисунке10.4. Процесс 1 Процесс 2 Рисунок 12.4 Механизм взаимного исключения критических секций Переходы t1 и t 2 находятся в конфликте за метку в позиции m Запуск, например, перехода t 2 , вынуждает 1-ый процесс ждать, пока 2-ой процесс выйдет из своей критической секции и возвратит метку в позицию m . Задача о производителе/потребителе В этой задаче разделяемым объектом является буфер. Процесс «Производитель» порождает компоненту информации и размещает ее в буфер. Процесс «Потребитель» ждет, пока компонента информации разместится в буфере, после этого он может ее удалить из буфера и использовать. Как правило, используется буфер ограниченной емкости, то есть имеется возможность разместить в нем не более n компонентов данных. В этом случае скорость заполнения буфера процессами - производителями и скорость извлечения данных процессами - потребителями должны быть сопоставимы. На рисунке 12.5 представлена сеть Петри, отражающая рассматриваемое действие процессов. 150 Производитель Потребитель Рис.12.5 Действие процессов «Производитель» и «Потребитель» Буферу сопоставимы две позиции: В − указывает на количество компонентов данных размещенных в буфере, но еще не использованных, В − количество свободных мест в буфере для размещения компонентов данных. Первоначально позиция В имеет n меток, а позиция В не имеет. Если буфер будет полностью заполнен, то в позиции В будет n меток, а в В − 0 меток. Таким образом, доступ процесса-производителя в заполненный буфер невозможен, так как в позиции В будет 0 меток. Задача об обедающих мудрецах Мудрецы сидят за круглым столом и каждый из них может пребывать в одном из двух состояний: думает или обедает. На столе блюда китайской кухни, а между мудрецами лежит по одной палочке. Для приема пищи мудрец должен взять палочку слева и палочку справа. В этом случае соседи обедающего мудреца могут только думать и ждать, когда освободятся палочки, чтобы приступить к обеду. На рис.12.6 сетью Петри представлено взаимодействие трех процессов (трех мудрецов), состояния которых отражены позициями Oi и Di ; ( Oi −обедает, Di − думает). Позиции pi представляют палочки для еды (разделяемые ресурсы). В исходной маркировке мудрецы думают, а все палочки свободны. При такой исходной маркировке любой из трех мудрецов может приступить к обеду, захватив палочки слева и справа. Рис. 12.6 Взаимодействие трех процессов 151 Задача о чтении/записи Рассматривается взаимодействие процессов двух типов: процессы чтения и процессы записи. Все процессы совместно используют общий файл или переменную или элемент данных. Процессы чтения не изменяют объект, а процессы записи изменяют. Поэтому процессы записи должны взаимно исключать все другие процессы чтения и записи, в то время как несколько процессов чтения могут иметь доступ к разделяемым данным одновременно. Взаимодействие процессов необходимо организовывать так, чтобы не могла возникнуть тупиковая ситуация и был обеспечен механизм взаимного исключения со стороны процессов записи. На рисунке 12.7 представлена сеть Петри, имитирующая взаимодействие процессов чтения и записи при условии, что число процессов чтения и записи ограничено величиной n . Это означает, что и при неограниченном числе процессов чтения, одновременно могут выполняться не более n процессов. Рисунок 12.7 Взаимодействие процессов чтения и записи Начальное маркирование сети предполагает наличие S процессов чтения и t процессов записи. Из данной сети видно, что процесс находится в конфликт за метку в позиции m . При захвате меток процессом записи позиция m остается без меток, тем самым блокируется запуск процессов чтения, до тех пор, пока процесс записи не возвратит n меток в позицию m . Следует обратить внимание на то, что в данной сети позиция m после завершения процессов чтения всегда будет иметь n меток и тем самым разрешает запуск процессов записи. В тех случаях, когда число одновременно читающих процессов не ограничено, моделировать взаимодействие процессов чтения и записи с помощью сети Петри оказывается невозможным. Проблема заключается в отсутствии механизма блокировки неограниченного числа одновременно читающих процессов при выполнении процессов записи. Для хранения числа читающих процессов можно ввести специальную позицию счетчик. При запуске каждого процесса чтения в счетчик добавляется единица, а по окончании единица вычитается. Однако это не решает проблему, так как для запус152 ка процесса записи необходимо, чтобы в позиции-счетчике отсутствовали метки. Механизма проверки неограниченной позиции на нуль в сетях Петри нет. Это показывает, что возможности сетей Петри для отображения взаимодействия процессов далеко не безграничны. Задачи анализа сетей Петри анализ заключается в изучении основных свойств сетей Петри: безопасности, ограниченности, сохранении, активности, достижимости и покрываемости. Безопасность. Позиция pip сети c = (p, t, i, o, m0) является безопасной, если m(pi)  i для любой mr(c, m0). Сеть Петри безопасна, если безопасна каждая ее позиция. Безопасность – важное свойство для аппаратной реализации. Безопасная позиция имеет число меток 0 или1 и может быть реализована одним триггером. Сети, в которых позиции рассматриваются (интерпретируются) как предусловия событий, маркировка каждой позиции должна быть безопасной. Ограниченность. Безопасность – это частный случай более общего свойства ограниченности. Безопасность позволяет реализовать позицию триггером, а в более общем случае можно использовать счетчик. Любой счетчик ограничен по максимальному числу k. Соответствующая позиция также является k-безопасной или k-ограниченной, если количество меток в ней не может превысить целое число k. Позиция pip сети c = (p, t, i, o, m0) является k-безопасной, если m(pi)  k для всех m  r(c, m0). Позиция называется ограниченной, если она k-безопасна для некоторого k. Сеть Петри ограничена, если все ее позиции ограничены. Сохранение. В сетях Петри, моделирующих запросы, распределения и освобождения ресурсов, некоторые позиции могут представлять состояние ресурсов. Например, если три метки в позиции представляют три устройства (однотипных) в вычислительной системе, то интерес представляет свойство сохранения меток. То есть метки, представляющие ресурсы, никогда не создаются и не уничтожаются. Сеть Петри называется строго сохраняющей, если для всех m  r(c, m0)  m(pi) =  m0(pi), pip. Сеть Петри должна сохранять ресурсы, которые она моделирует. Однако не всегда имеется однозначное соответствие между меткой и количеством или числом ресурсов. В этом случае метка используется для создания кратных меток (по одной на ресурс), путем запуска перехода с большим числом выходов, чем входов. Поэтому вводятся взвешенные метки, а условие сохранения определяется через взвешенную сумму меток. Активность. Другой задачей, возникающей при распределении ресурсов, является задача выявления тупиков. Рассмотрим систему, включающую 153 два различных ресурса q и r и два процесса а) и в), нуждающиеся в обоих ресурсах. Каждый процесс запрашивает ресурс, а затем освобождает его. Процесс а) сначала запрашивает ресурс q, затем ресурс r, и освобождает их. Процесс в) работает аналогично, но запрашивает сначала ресурс r, а затем q. Достижимость и покрываемость. Задача достижимости заключается в определении для маркировки m0 маркировки m  r(c, m0). К этой задаче могут сводиться многие перечисленные выше задачи. Например, тупик в сети на рисунке может возникнуть, если достижимым является состояние (0, 1, 0, 0, 0, 0, 1, 0). Задача покрываемости. Состоит в том, чтобы для сети с с начальной маркировкой m0 и маркировки m определить, существует ли такая достижимая маркировка m r(c, m0), что m  m. Дерево достижимости и анализ сетей Дерево достижимости представляется множеством состояний сети (рисунок 12.8). Сеть Петри ограничена тогда и только тогда, когда символ  отсутствует в ее дереве достижимости. Если сеть ограничена и символ  отсутствует в дереве достижимости, то сеть представляет систему конечных состояний. Это позволяет решить вопросы анализа простым перебором и проверкой конечного множества всех достижимых маркировок. (1, 0, 0) (1, , 0) (1, , 0) (0, 1, 1) (0, , 1) (0, 0, 1) (0, , 1) Рисунок 12.8 Пример дерева достижимости. Сеть Петри является сохраняющей, если она не теряет и не порождает метки, а просто передвигает их. Свойство сохранения проверяется по дереву достижимости вычислением для каждой маркировки суммы меток. Если метки взвешены, то вычисляется взвешенная сумма. Если сумма одинакова для каждой достижимой маркировки, сеть - сохраняющая. Задача покрываемости маркировки m маркировкой m сводится к поиску на дереве такой вершины х, состояние которой покрывает состояние m. 154 Если такой вершины m(х) не существует, маркировка m не покрывается никакой достижимой маркировкой. Таким образом, дерево достижимости можно использовать для решения задач безопасности, ограниченности, сохранения и покрываемости. К сожалению, в общем случае его нельзя использовать для решения задач достижимости и активности, а также для определения возможной последовательности запусков. Решение этих задач ограничено существованием символа . Символ  означает потерю информации, конкретные количества меток отбрасываются, учитывается только существование их большого числа. Вместе с тем, в отдельных конкретных случаях дерево достижимости позволяет судить о свойствах достижимости и активности. Например, сеть, дерево достижимости которой содержит терминальную вершину, не активна. Аналогично искомая маркировка m’ в задаче достижимости может встретиться в дереве достижимости, что означает ее достижимость. Кроме того, если маркировка не покрывается некоторой вершиной дерева достижимости, то она недостижима. 155 Контрольные вопросы и задания 1. Дать рекурсивное определение цепочки над некоторым алфавитом, используя понятия пустой цепочки и конкатенации. 2. На вход конечного автомата подается последовательность из нулей и единиц. Изобразить граф, описывающий поведение распознающего автомата, и записать регулярное выражение для распознаваемой последовательности для случаев: а) число единиц делится на 3; б) все единицы появляются сериями не менее чем из трех единиц; в) единица не появляется в момент времени, делящийся на 2 или 3. 3. Заменить регулярное выражение (a  b)* таким, в котором не используется знак "". 4. Совпадают ли множества последовательностей, представляемые регулярными выражениями а) b(ab  b)*a и bb*a(bb*a)* ; б) (a*ab  ba)*a* и (a  ab  ba)* ? 5. Какие из следующих равенств верны: а) E*F = (E  E*)*F ; б) E*F* = (E  F)*(EF)* ; в) E*F* = E*EF*  E*FF* ; г) E(FGE)*FG = EF(GEF)*G ? Здесь E, F, G – метасимволы, обозначающие определенные последовательности символов алфавита. 6. Какие из следующих множеств последовательностей могут быть распознаны конечным автоматом: а) множество всех последовательностей вида: 0, 1, 00, 01, 10, 11, 000, 001, 010, … ; б) числа 1, 2, 4, 8, … , 2n, … , записанные в двоичной системе счисления; в) то же самое множество чисел, записанных в унарном коде: 1, 11, 1111, 11111111, 1111111111111111, … ; г) множество последовательностей, в которых число нулей равно числу единиц; д) последовательности: 0, 101, 11011, … , 1k01k (k – число повторений единицы)? 7. Какой автомат называют клеточным? Приведите пример клеточного автомата. 8. Перечислите типы простейших активных элементов и дайте их определения. 9. Исследуйте эволюцию клеточного автомата «Жизнь» через 1, 2 и 3 такта для следующих начальных состояний, задающих расположение активных («живых») клеток: а) б) 156 10.Сформулируйте, в чем заключается задача регрессионного анализа. 11.Какую величину называют случайной? Опишите основные типы случайных величин. 12.Что такое закон распределения случайной величины? 13.Назовите виды регрессионных зависимостей. 14.Какая характеристика служит для оценки качества линейной модели? Какие она может принимать значения? 15.Опишите суть метода наименьших квадратов. 16.Какая характеристика служит для оценки качества нелинейной модели? Какие она может принимать значения? 17.Что такое корреляция? Какие виды корреляции вы знаете? 18.Как строится линия регрессии? 19.Опишите метод построения гистограммы. 20.В чем заключается содержательный анализ остатков модели? 21.Какие задачи решает факторный анализ? 22.Какова главная цель кластерного анализа? 23.Дайте определение кластера. 24.Охарактеризуйте свойства кластера. 25.В чем заключается процедура кластерного анализа? 26.Перечислите методы нахождения межкластерного расстояния. 27.Дайте определение марковского процесса. 28.Сформулируйте уравнения Колмогорова для непрерывного марковского процесса с дискретным набором состояний. 29.Охарактеризуйте процесс размножения и гибели. 30.Дайте определение потока событий. 31.Какой поток событий называется стационарным пуассоновским потоком? 32.Опишите обобщенную структурную схему системы массового обслуживания. 33.Перечислите параметры входящего потока СМО. 34. Перечислите параметры выходящего потока СМО. 35.Перечислите параметры структуры СМО. 36.Перечислите параметры управления процессами в СМО. 37.Дайте характеристику основных показателей эффективности СМО. 38.Опишите математическую модель одноканальной СМО. 39.Опишите математическую модель многоканальной СМО. 157 Литература 1. Агафонов, Е. Д. Математическое моделирование линейных динамических систем [Текст] : учеб. пособие / Е. Д. Агафонов, О. В. Шестернева; Сиб. федер. ун-т, Ин-т космич. и информ. технологий. – Красноярск : ИПК СФУ, 2011. – 94 с. 2. Андерсон, Д. А. Дискретная математика и комбинаторика [Текст]: учебник / Д.А.Андерсон. – Москва: Издательский дом «Вильямс», 2003.  960 с. 3. Бахвалов Л. А. Моделирование систем [Текст]: учеб. пособие / Л. А. Бахвалов. – Москва : Изд-во МГГУ, 2006. – 295 с. 4. Вентцель Е. С. Теория вероятностей [Текст]: учебник для студентов вузов / Е. С. Вентцель. - 10-е изд., стер. – Москва : Высшая школа, 2006. - 575 с. 5. Ивченко Г. И. Теория массового обслуживания [Текст]: учеб. пособие для вузов по специальности "Прикладная математика" / Г. И. Ивченко, В. А. Каштанов, И. Н. Коваленко. – Изд. 2-е, испр. и доп. – Москва : URSS : ЛИБРОКОМ, 2012. – 296 с. 6. Кузнецов О. П. Дискретная математика для инженера [Текст]: чебник для вузов / О. П. Кузнецов. – Изд. 5-е, стер. – Санкт-Петербург; Краснодар : Лань, 2007. – 395 с. 7. Моделирование систем [Текст]: учебное пособие для вузов по направлению "Автоматизация технологических процессов и производств" / И. А. Елизаров [и др.]. – Старый Оскол : ТНТ, 2015. – 135 с. 8. Моделирование систем и процессов. Практикум [Текст]: учебное пособие для академического бакалавриата по инженерно-техническим направлениям / под ред. В. Н. Волкова. – Москва : Юрайт, 2017. – 295 с. 9. Морозов В. К. Моделирование процессов и систем [Текст]: учебное пособие для вузов по направлению подготовки бакалавров / В. К. Морозов, Г. Н. Рогачев. – 2-е изд., перераб. - Москва : Издательский центр "Академия", 2015. – 264 с. 10. Павловский Ю. Н. Имитационное моделирование [Текст] : учеб. пособие для вузов по спец. направления подготовки "Прикладная математика и информатика" / Ю. Н. Павловский, Н. В. Белотелов, Ю. И. Бродский. Москва : Академия, 2008. - 235 с. 11. Певзнер Л. Д. Теория систем управления [Текст]: учебное пособие для вузов по направлению подготовки "Управление в технических системах" / Л. Д. Певзнер. – Изд., 2-е испр. и доп. – Санкт-Петербург ; Москва ; Краснодар : Лань, 2013. – 420 с. 12. Советов, Б. Я. Моделирование систем [Текст]: учебник для вузов по направлениям "Информатика и вычислительная техника" и "Информационные системы": рекомендовано Министерством образования и науки РФ / Б. Я. Советов, С. А. Яковлев. – Изд. 5-е, стер. – Москва : Высшая школа, 2007. – 343 с. 158 13. Советов Б. Я. Моделирование систем. Практикум [Текст]: учебное пособие для студентов вузов (бакалавров), обучающихся по направлениям "Информатика и вычислительная техника" и "Информационные системы" / Б. Я. Советов, С. А. Яковлев ; Санкт-Петербург. гос. электротехн. ун-т "ЛЭТИ" им. В. И. Ульянова (Ленина). – 4-е изд., перераб. и доп. – Москва: Юрайт, 2012. – 295 с. 14. Численные методы и математическое моделирование [Текст]: учебно-методическое пособие / Сиб. федер. ун-т, Ин-т инж. физики и радиоэлектроники; сост. С. В. Николаев, Ю. С. Орлов. – Красноярск: СФУ, 2019. – 49 с. 159 Приложение 1. Интерполяционные и статистические методы обработки данных Цели интерполирования и экстраполирования Вычисление значения функции y=f(x)– одна из тех задач, с которой постоянно на практике приходится сталкиваться. Желательно иметь быстрые и надежные алгоритмы вычисления значений используемой функции. Рассмотрим некоторые типичные ситуации. 1. Функция f задана таблицей своих значений: y=f(xi), (i=0,1,…,n) 2. Непосредственное вычисление значения y=f(xi)– связано с проведением сложных расчетов и приводит к значительным затратaм машинного времени, которые могут оказаться неприемлемыми, если функция вычисляется многократно. 3. При заданном значении х значение функции может быть найдено из эксперимента. Ясно, что такой способ "вычисления" в большинстве случаев нельзя использовать в вычислительных алгоритмах, так как он связан с необходимостью прерывания вычислительного процесса для проведения эксперимента. В этой ситуации экспериментальные данные получают до начала вычислений на ЭВМ. Нередко они представляют собой таблицу, в которой табличные значения y*i отличаются от "истинных" значений yi, так как заведомо cодержат ошибки эксперимента. Возникающие проблемы нередко удается решить следующим образом. Функцию f(x) приближенно заменяют другой функцией g(x), вычисляемые значения которой и принимают за приближенные значения функции f(x). Постановка задачи интерполяции. Пусть в точках х0, х1,…,хn расположенных на отрезке [a,b] и попарно различных задана таблица значений некоторой функции f. Задача интерполяции состоит в построении функции g, удовлетворяющей условию g(xi)= yi (i=0,1,…,n) Другими словами, ставится задача о построении непрерывной функции g, график которой проходит через заданные точки (xi, yi ). Указанный способ приближения функций принято называть интерполяцией (или интерполированием), а точки xi – узлами интерполяции. Нетрудно видеть, что выбор функций g неоднозначен. Экстраполяция. Пусть хmin и xmax – минимальный и максимальный из узлов интерполяции. В случае, когда интерполяция используется для вычисления приближенного значения функции f в точке x, не принадлежащей отрезку [хmin и xmax] (отрезку наблюдения) принято говорить о том, что осуществляется экстраполяция. Этот метод приближения часто используют с целью прогнозирования характера протекания тех или иных процессов при значениях параметров, выходящих за пределы отрезка наблюдения. Надежность такого прогноза при значениях x, удаленных на значительное расстояние от отрезка [хmin и xmax], как правило, невелика. 160 Интерполяционная формула Ньютона с разделенными разностями Пусть имеется табулированная функция . Введем понятие разделенной разности. Разделенные разности нулевого порядка совпадают со значениями самой функции. Разделенные разности первого порядка имеют вид , разделенные разности - го порядка строятся по формуле . (1) Пусть Pn(x) многочлен степени . Разность Pn(x)- Pn(x0) обращается в нуль при x-x0, следовательно, она делится на x-x0. Тогда разделенная разность первого порядка - многочлен степени n-1 относительно (и относительно x0, так как выражение симметрично относительно x и x0). Разность обращается в нуль при x=x1. Поэтому разделенная разность второго порядка - многочлен степени . Аналогично, Pn(x,x0, x1, x2) - многочлен степени n3 и т.д. Разделенная разность порядка n: Pn(x,x0, x1,…, xn-1) - многочлен нулевой степени. Разделенные разности более высокого порядка обращаются в нуль. Значение Pn(x,x0, x1,…, xn-1) от x не зависит, поэтому Из определения разделенных разностей следует: и т.д. Отсюда получаем формулу для : 161 Разделенные разности в соответствии с рекуррентной формулой (1) выражаются через значения многочлена в узлах . Если узлы интерполяции, - значения интерполируемой функции в этих узлах, то они однозначно определяют интерполяционный многочлен степени , значения которого в узлах совпадают с . Тогда разделенные разности многочлена совпадают с разделенными разностями функции . Поэтому интерполяционный многочлен можно записать в форме: Эта форма называется интерполяционным многочленом Ньютона с разделенными разностями. Многочлен Лагранжа Пусть задана функция y=f(x). Часто нахождение значений этой функции может оказаться трудоемкой задачей. Например, x- параметр в некоторой сложной задаче, после решения которой определяется значение f(x), или f(x) измеряется в дорогостоящем эксперименте. В этих случаях можно получить небольшую таблицу значений функции, но прямое нахождение ее значений при большом количестве значений аргумента нереально. В такой ситуации f(x) заменяется приближенной формулой g(x), которая в определенном смысле близка к функции f(x). Близость обеспечивается введением в функцию g(x) свободных параметров и их соответствующим выбором. Итак, известны значения функции f(x) в точках x0,x1,…,xn , . Потребуем, чтобы для некоторой функции g(x,a0,a1,…,an) выполнялись равенства: g(x,a0,a1,…,an) = yi , i=0,1,…,n. (2) Если (2) рассматривать как систему для определения a0,a1,…,an, то этот способ называется интерполяцией (лагранжевой). Если g зависит от aj нелинейно, то говорят о нелинейной интерполяции. В противном случае интерполяция называется линейной. В случае линейной интерполяции можно записать (3) где j(x)- система линейно-независимых функций. Подставим (3) в (2). Относительно aj получаем систему линейных уравнений: 162 (i=0,..., n). Для однозначной разрешимости системы должно выполняться условие m=n. Для того, чтобы задача интерполирования имела единственное решение, система функций j(x) должна удовлетворять условию: (4) для любых несовпадающих xi. Система функций, удовлетворяющая условию (4), называется Чебышевской. Если j(x) задаются в виде  j x   x  x0 x  x1     x  x j 1 x  x j 1     x  xn  x j  x0 x j  x1     x j  x j1 x j  x j1     x j  xn  , то формула (3) называется интерполяционным многочленом Лагранжа. Многочлены Чебышева Пусть . Рассмотрим функцию вида: Очевидно, T0(x) = 1, T1(x) = x. При n = 2 используем тригонометрическое тождество Пусть Tn(x) многочлен степени n. Получим рекуррентное соотношение, связывающее Tn-1(x), Tn(x) и Tn-1(x). Как известно, cos(n  1)  cos n cos  sin n sin  cos(n  1)  cos n cos  sin n sin  . Складывая почленно эти равенства, получим cos(n  1)  2 cos n cos 163 Полагая  = arccosx, получим . Коэффициент при равен . Интерполяция сплайнами Повышение точности интерполяционного многочлена возможно благодаря увеличению степени многочлена, но связано с существенным повышением сложности вычислений. Естественная потребность в наличии аппроксимирующих функций, которые сочетали бы в себе локальную простоту многочлена невысокой степени и глобальную на всем отрезке гладкость, привела к появлению в 1946г. так называемых сплайн функций или сплайнов – специальным образом построенных гладких кусочно-многочленных функций. Дадим строгое определение сплайна. Пусть отрезок [a, b] разбит точками a=x0
«Моделирование систем» 👇
Готовые курсовые работы и рефераты
Купить от 250 ₽
Решение задач от ИИ за 2 минуты
Решить задачу
Помощь с рефератом от нейросети
Написать ИИ
Получи помощь с рефератом от ИИ-шки
ИИ ответит за 2 минуты

Тебе могут подойти лекции

Смотреть все 588 лекций
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot