Выбери формат для чтения
Загружаем конспект в формате docx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ
УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
«КАМЧАТСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»
(ФГБОУ ВО «КамчатГТУ»)
Факультет информационных технологий
Кафедра информационных систем
И.Г. Проценко
Математическое и имитационное моделирование
Конспект лекций
Петропавловск-Камчатский
2019
Проценко И.Г., д.т.н., заведующий кафедрой информационных систем
Конспект лекций составлен в соответствии с требованиями программы по дисциплине «Математическое и имитационное моделирование», с требованиями ФГОС ВО для направлений 09.03.03 «Прикладная информатика», 09.03.04 «Программная инженерия», а также в соответствии с утвержденным ректором КамчатГТУ учебным планом.
ОБСУЖДЕНО
На заседании кафедры информационных систем «17» апреля 2019 г. протокол № _.
Зав.кафедрой ИС И. Г. Проценко
ОГЛАВЛЕНИЕ
ТЕМА 1. МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
Лекция 1.1. Введение. Математические модели в рыбной отрасли
Лекция 1.2. Теоретические основы математического моделирования
Лекция 1.3. Статистическая оценка параметров модели
Лекция 1.4. Алгоритмизация процессов расчета параметров модели
Лекция 1.5. Выбор и проверка адекватности модели
Лекция 1.6. Линейная парная регрессия
ТЕМА 2. ОСНОВЫ ИМИТАЦОННОГО МОДЕЛИРОВАНИЯ
Лекция 2.1. Имитационное моделирование. Термины и определения.
Лекция 2.2. Технология имитационного моделирования
Лекция 2.3. Метод Монте-Карло и имитационное моделирование
Лекция 2.4. Планирование имитационных экспериментов
Лекция 2.5. Обобщение и статистическая оценка результатов имитационного моделирования
Лекция 2.6. Имитационное моделирование и системы массового обслуживания
Лекция 2.7. Компьютерное моделирование при реализации имитационных моделей
ТЕМА 3. МАТЕМАТИЧЕСКИЕ МОДЕЛИ В СИСТЕМЕ МОНИТОРИНГА РЫБОЛОВСТВА
Лекция 3.1. Назначение и основные задачи ОСМ
Лекция 3.2. Схема мониторинга в ОСМ
Лекция 3.3. Оптимизация обработки входной информации ОСМ
Лекция 3.4. Обоснование выбора модели обработки данных
Лекция 3.5. Динамико-стохастические модели ОСМ
СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ
ТЕМА 1. МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
Лекция 1.1. Введение. Математические модели в рыбной отрасли
При изучении предмета «математическое моделирование» целесообразно использовать результаты теории управления системой в пространстве состояний, т.е. в таком пространстве, все точки которого представляют собой возможные состояния исследуемой динамической системы. Анализ системы в пространстве состояний позволяет решать задачи её оптимального управления при различных критериях качества управления, идентификации параметров модели системы, оптимального планирования и др.
В рыбном хозяйстве, рассматривая его как динамическую рыбопромысловую систему, можно выделить 3 подсистемы: среда, объекты промысла – рыба и морепродукты, промысловый флот и береговая рыбопромышленная инфраструктура. В каждый момент времени среда может характеризоваться параметрами: атмосфера - давление, температура воздуха, влажность, скорость ветра и др.; океан - температура, соленость, скорость течений и др. Объекты промысла могут быть описаны функцией плотности концентрации и возрастным составом популяции. Промысловые суда могут характеризоваться следующими основными параметрами: координаты местонахождения, вылов, выпуск рыбопродукции, запасы и грузы на борту, рыбопродукция на борту. В качестве параметров могут выступать производные показатели: стоимость выпущенной рыбопродукции, прибыль и т.д.
На самом деле число параметров, характеризующих каждую из 3-х подсистем, гораздо больше. На практике интерес представляет проекция траектории в пространстве состояний на одну или несколько осей (допустим это суточный вылов конкретного судна в заданном районе). Можно ограничить размерность пространства состояния, выделить значимые параметры (например, перечисленные выше), то есть параметры, определяющие заданную точность проекций траектории динамической системы. Но в этом случае это будет уже не сама рыбопромысловая система, а её некое представление, т.е. м о д е л ь.
Таким образом, мы переходим к информационной рыбопромысловой системе, которая рассматривается как некоторая структура, в которую в определенные дискретные моменты времени вводится информация, меняющая ее состояние и последующее поведение.
Текущее состояние определяется как та часть настоящего и прошлого системы, которая необходима для определения настоящих и будущих выходных параметров системы. Следовательно, необходимо воспроизвести как можно точнее изменение параметров состояния среды, объектов промысла и промысловых судов для оценки состояния рыбопромысловой системы, предсказания и выработки решений по управлению рыбным промыслом.
Принятие решений в условиях экономических методов управления в большой степени связано с неопределенностью целей, ограничений и последствий возможных действий.
Для работы с неточно известными величинами применяется:
• аппарат теории вероятностей, интуитивно принимается допущение, что неточность независимо от ее природы может быть отождествлена со случайностью;
• аппарат расплывчатости - того типа неточности, который связан с расплывчатыми множествами, т.е. с классами, в которых нельзя указать резкую границу, определяющую элементы, принадлежащие к данному классу, и элементы, не принадлежащие к нему.
Случайность связана с неопределенностью, касающейся принадлежности некоторого значения параметра рыбопромысловой системы к расплывчатому множеству. Понятие расплывчатости относится к классам, в которых могут быть градации степени принадлежности значения параметра к данному классу.
В теоретических и прикладных работах по моделированию физических и экономических процессов редко используют совместно аппарат случайности и расплывчатости.
Скорее всего, это связано с неоднозначностью трактовки результатов исследования. Приведем один из примеров возникновения неопределенности. Предположим, что среднесуточный вылов крупнотоннажным судном составляет 30-50 тонн. Необходимо принять решение по управлению группой судов на основе величины вылова, который будет в течение следующей недели. Эта величина не определена, однако можно оценить значение вылова с большой долей уверенности, как лежащие в интервале 30-50 тонн.
Интуитивно ясно, что вероятность того, что вылов будет равен нижней (30 тонн) или верхней (50 тонн) границе меньше, чем вероятность того, что вылов будет равен 40 тоннам. Таким образом, разбив шкалу значений вылова на интервалы, каждому интервалу можно сопоставить степень уверенности в том, что будущий вылов примет именно это значение. Прогнозируемый вылов зависит от множества случайных факторов и невозможно дать ему точную оценку. Однако, получив наилучшую в смысле достоверности оценку и точность этой оценки, можно приступать к процедурам выработки решения.
Неопределенность значения прогнозируемого вылова можно охарактеризовать с помощью понятий расплывчатости, вводя, например, расплывчатый класс "норма вылова", а предполагаемый вылов определить степенью близости к норме (близко, около, меньше, гораздо меньше).
Возможность выбора способа описания неопределенности вероятностными характеристиками, либо расплывчатыми категориями порождает, в свою очередь, "неопределенность", так как принимая тот или другой метод описания используются, как правило, аргументы "простоты", "эффективности", "приятности для разума", оценить которые можно только по результатам моделирования. Нужно учесть, что существует ряд показателей как, например, цвет, запах, которые вообще правомерно описывать в расплывчатых, а не вероятностных терминах.
Таким образом, математический аппарат моделирования должен позволять оперировать одновременно как вероятностными, так и расплывчатыми характеристиками, описывая их как вероятностно-расплывчатые, а также, допускать вероятную и расплывчатую трактовку результатов моделирования.
В задачах моделирования эволюции физических, экономических и других параметров рыбного промысла одна из основных проблем - построение математических моделей, адекватно описывающих реально протекающие процессы.
Имея дело со сложным процессом, нельзя надеяться получить удовлетворительную детерминированную модель. С другой стороны, принципиальным недостатком детерминированных моделей систем является отсутствие эффективного метода сравнения различных возможных моделей, создаваемых на основе одних и тех же эмпирических данных.
Существует ряд причин, в силу которых с течением времени различие моделируемого и реального процессов становится настолько значительным, что состояние математической системы уже не отражает основных характеристик явлений.
К числу таких причин в первую очередь следует отнести конечномерность пространства состояний, ошибки начальных данных, входных воздействий и параметров модели. К тому же ошибки начальных данных и входных воздействий носят случайный характер. Слово "модель" имеет разные трактовки, связанные с многообразием использования этого термина. Поскольку в действительности математические модели практически никогда не являются точной копией исследуемой системы, в данном случае модель формулируется с точки зрения достижения с помощью модели конкретной цели. Математическая модель может удовлетворять определенной цели, например, предсказанию или управлению, и должна быть конкретна только в той мере, в которой удовлетворяет этим требованиям. Поэтому для сложных систем не обязательно строить сложные модели.
Следует учесть, что отсутствие формальных правил и понятий для формирования модели дает большую свободу. Может оказаться, что слишком подробное описание реальной системы исследователей приведет к модели, содержащей намного больше деталей, чем нужно на самом деле. В вычислительном аспекте это приводит к непомерно большим затратам времени компьютера. Поэтому следует точно решить, какая степень детализации фактически необходима, и в дальнейшем свести число используемых деталей до необходимого минимума.
Мало построить модель, удовлетворяющую количественным данным. Модель должна быть естественной, понятной. В настоящее время стохастические модели все чаще вытесняют детерминированные, поскольку обладают эффективными методами сравнения различных возможных моделей. Однако исследователь не может перебрать все классы моделей и выбрать лучшую. Класс исследуемых моделей должен быть сужен на основе теоретических, интуитивных заключений и уже потом подвергнут тестированию.
Учитывая вероятностный тип зависимостей между многими параметрами, характеризующими промысловую обстановку, и соответственно промысловую деятельность судов, нельзя надеяться на получение практически значимых результатов от использования детерминированных моделей. Это тем более справедливо, так как общее число взаимосвязанных параметров среды, сырьевой базы и промыслового флота чрезвычайно велико, а корреляционные зависимости между ними нелинейным образом меняются во времени и многие из них мало изучены.
В таких условиях для практических приложений наибольший интерес представляют процессы стохастической аппроксимации, которые могут дать итерационные (обучающие) процедуры поиска подходящих моделей при неизвестных значениях распределения вероятностей случайных величин.
Когда модель построена, ее можно использовать для ряда целей:
• прогноз на один или несколько шагов;
• контроль входной информации;
• оценка статистических характеристик процесса (например, спектральных);
• генерация данных с характеристиками, аналогичными характеристикам эмпирических данных;
• проведение имитационных экспериментов.
Лекция 1.2. Теоретические основы математического моделирования
Построение математических моделей любых объектов связано с формализацией их описания и с выделением существенных черт рассматриваемой ситуации. Математическая модель, обобщая количественные взаимосвязи между факторами процесса, позволяет проанализировать их роль во взаимодействии и определить оптимальные условия ведения процесса.
Модель можно назвать заменителем оригинала, позволяющим изучать либо фиксировать отдельные свойства оригинала.
Процесс построения модели называется моделированием.
Можно выделить следующие этапы моделирования:
• постановка задачи определение свойств оригиналов, подлежащих исследованию;
• констатация факта, что оригинал затруднительно, либо невозможно исследовать в натуре;
• выбор модели, достаточно хорошо отражающей наиболее существенные свойства оригинала;
• исследование модели в соответствии с поставленной задачей;
• перенос результатов исследований на оригинал;
• проверка полученного результата.
Приведем одну из распространенных классификаций моделей.
Логические модели функционируют по законам логики в сознании человека:
• образные (иконические);
• знаковые (символические);
• образно-знаковые.
Материальные модели развиваются вне сознания человека по объективным законам природы:
• функциональные;
• геометрические;
• Функционально-геометрические.
По отношению модели к оригиналу:
• условные модели;
• аналогичные;
• математические – среди них выделим подобные модели, в которых переменные модели пропорциональны переменным оригиналам:
а) аналоговые (непрерывные)
б) цифровые (дискретные)
в) аналого-цифровые (комбинирование или гибридные)
Наука – это компоненты научного исследования: планирование эксперимента, обработка данных эксперимента, моделирование, управление.
Обозначим четыре контура научного исследования:
• экспериментальное исследование;
• создание и развитие модели;
• автоматическое либо автоматизированное управление объектом;
• развитие задач управления.
Объект - объект материального мира, подлежащий исследованию.
Можно привести стандартный алгоритм научного исследования:
Постановка задачи (проблемы).
Предварительный анализ информации, условий и методов решения задач.
Выдвижение гипотез, новых научных и технических решений.
Планирование эксперимента (в математике существует специальный раздел «Теория планирования эксперимента»)
Проведение эксперимента.
Обработка данных эксперимента (в математике существуют специальные разделы: «Математическая статистика», «Регрессионный и корреляционный анализ», «Теория вероятности»).
Проверка исходной гипотезы, коррекция, развитие модели.
Моделирование («Вычислительная математика», «Прикладная математика», «Математическое моделирование», «Математические задачи», «Элементы теории графов»)
Окончательная формулировка новых фактов, законов на основе гипотезы.
Управление («Теория оптимизации», «Теория автоматического управления»).
Схема «Эксперимент Модель Управление» отображает диалектический процесс от познания объекта до оптимального управления им.
Рис.1.2.1. Схема «Эксперимент Модель Управление»
Дадим несколько важных определений.
Можно выделить четыре контура научного исследования:
I. экспериментальное исследование
II. создание и развитие модели
III. автоматическое либо автоматизированное управление объектом
IV. развитие задач управления
Схема «Эксперимент Модель Управление» выделяет различные аспекты научного исследования и связывает их с соответствующими разделами математики.
Построение математических моделей любых объектов связано с формализацией их описания и с выделением существенных черт рассматриваемой ситуации. Математическая модель, обобщая количественные взаимосвязи между факторами процесса, позволяет проанализировать их роль во взаимодействии и определить оптимальные условия ведения процесса. Математические модели подразделяются на три типа:
1) поисковые;
2) портретные;
3) исследовательские.
Поисковые модели используются в условиях, когда механизм описываемого явления изучен недостаточно. В этом случае, наблюдая за реакцией исследуемой системы на внешние воздействия, составляют гипотетическую модель явления, которая затем эмпирически проверяется в различных условиях с целью уточнения отдельных ее параметров. Поисковая модель может достаточно точно описать взаимосвязь основных параметров реального явления. Недостатком моделей этого типа является их ограниченность, ибо они действительны лишь в условиях, близких к тем, при которых определялись эмпирические коэффициенты. Поисковые модели рациональны при определении оптимальных параметров конкретного объекта с целью его автоматизации, например, для оптимизации технологических процессов в микробиологической промышленности. Известны попытки использования поисковых моделей для описания основных стадий биологической очистки сточных вод, но вследствие отмеченных выше недостатков они не находят широкого практического применения.
Портретные модели используются в тех случаях, когда механизм объекта изучен относительно полно, но труден для непосредственных наблюдений. Такая ситуация встречается в биологии при изучении генетических процессов, которые длятся годами, или при исследовании развития популяций растений и животных. Применительно к проблеме биологической очистки сточных вод этот тип модели может иметь ограниченное применение: например, при изучении процесса адаптации микроорганизмов активного ила к изменяющимся условиям внешней среды.
Исследовательская модель служит для выяснения потенциальных возможностей изучаемого объекта, т.е. путей интенсификации процессов. Такая модель должна базироваться на теоретических предпосылках, но может включать в себя и частные эмпирические зависимости для описания второстепенных стадий процесса.
Исследования, выполняемые на базе полученной математической модели не обязательно должны совпадать с экспериментальными, выполняемыми на другом подобном объекте (оригинале), поскольку процессы, описываемые математическими уравнениями, определенными по данной модели и данному оригиналу, будут обязательно иметь некоторый разброс, обусловленный статистической природой физических параметров модели и оригинала. Количественный учет статистических зависимостей позволяет выявить влияние стохастических факторов, присущих модели и оригиналу, сформулировать требования к точности измерения и воспроизведения на модели различных параметров, а при объективно заданных погрешностях (что может быть обусловлено, например, спецификой погодных условий) оценить точность получаемого при моделировании результата и возможные отклонения параметров реальной системы, синтезируемой по результатам физического моделирования.
В заключение следует отметить ряд требований, которым должны удовлетворять модели реальных процессов и которым необходимо следовать при построении математической модели:
• чем проще модель, тем меньше возможность ошибочных выводов;
• модель должна быть простой, но не проще, чем это возможно;
• при построении математической модели можно исключать что угодно, нужно только знать, как это повлияет на решение;
• модель не должна быть грубой; малые поправки не должны кардинально менять ее поведение;
• модель и расчет не должны быть точнее исходных данных.
Лекция 1.3. Статистическая оценка параметров модели
Будем предполагать, что информационная рыбопромысловая система является стохастической системой с конечным числом состояний. Каждое состояние в моменты временипринадлежит пространству состояний. Процесс в момент времени будем рассматривать как сумму двух частей. Части, являющейся функцией всех наблюдений до момента времени , и чисто случайной составляющей :
(1.3.1)
где - совокупность наблюдений вектора до момента времени включительно; - вектор неизвестных коэффициентов модели; - управляющее воздействие, либо экзогенный фактор, - последовательность независимых одинаково распределенных величин; - детерминированная функция.
Ввод в уравнение (1.3.1) шума отражает допущенные погрешности при определении ограниченного числа компонент вектора состояния и поиске неизвестного вида функции .
По физическим соображениям или соображениям эвристического характера множество ограничивается конечным набором Среди возможных необходимо сначала выбрать функцию , а затем оценить соответствующий параметр .
Для целей построения статистической модели информационной рыбопромысловой системы главное внимание уделяется получению эффективных оценивателей на основе использования методов несмещенного оценивания и максимального правдоподобия, исходя из выборочных наблюдений, и изучению их ассимптотических свойств. Ассимптотические свойства оценивателей служат обоснованием для статистических выводов, получаемых при выборках большего объема. В случае же малых выборок приложение результатов ассимптотической теории представляются недостаточно обоснованными, что отмечается в работах [9,10].
Пусть имеем систему уравнений - (1.3.1) для m-мерного векторного процесса , - означает знак транспонирования.
(1.3.1*)
где-мерный вектор;
- n0-мерный вектор ;
- случайные гауссовы возмущения типа "белого шума";
- дисперсия вектора шумов.
- имеет размерность и составляется в виде функции из компонент векторов ;
- наблюдаемый входной вектор.
Класс многомерных динамических моделей представляется тройкой: (), где - уравнение (1.3.1), содержащее -мерный вектор ; - множество всех значений, которые может принимать вектор ; - множество всех положительно определенных матриц шума .
Предположим, что к моменту времени накоплена совокупность наблюдений процессов и :
(1.3.2)
Требуется найти оценки параметров: вектора и матрицы , исходя из вектора наблюдений и заданного критерия. Поскольку мы ввели в правую часть уравнения (1.3.1) шум чтобы компенсировать недостатки модели, то естественно за счет подбора вида функции и вектора коэффициентов модели сделать влияние шума минимальным, а качестве критерия выбрать минимум дисперсии шума :
(1.3.3)
Минимизация (1.3.3) дает выражение для вектора в виде:
(1.3.4)
Из (1.3.4) видно, что вектор коэффициентов модели для -того уравнения рассчитывается без учета остальных уравнений. Такую оценку для вектора коэффициентов модели называют оценкой квазимаксимального правдоподобия на основе ограниченной информации (не учитываются другие уравнения модели).
Для математического ожидания и дисперсии справедливы следующие асимптотические выражения:
В ряде случаев, когда и статистически независимы оценка квазимаксимального правдоподобия совпадает с оценкой условного максимального правдоподобия, а значит является состоятельной и асимптотически несмещенной. Оценка на основе ограниченной информации является состоятельной, но не всегда эффективной (см.работы [9,10,40]).
Важное преимущество метода оценивания на основе ограниченной информации состоит в том, что он позволяет находить состоятельную оценку в условиях отсутствия знания . Данный метод позволяет осуществлять декомпозицию задачи оценивания на ряд автономных задач оценивания для отдельных уравнений системы, что существенно упрощает задачу в вычислительном аспекте.
Лекция 1.4. Алгоритмизация процессов расчета параметров модели
Рассмотрим задачу оценки вектора коэффициентов модели. Расчет по формуле (1.3.4), требует необходимости запоминания всей совокупности наблюдений до момента времени . При мониторинге, т.е. непрерывном отслеживании динамики показателей, характеризующих процесс, необходим пересчет оценкив новые оценкис использованием наблюдений . Проведение расчетов по формуле (1.3.4) требует выполнения растущего с числом количества суммирований, а при реализации на ЭВМ возрастают затраты на поиск и отбор записей наблюдений .
Можно воспользоваться алгоритмом, принадлежащим семейству алгоритмов фильтрации Калмана [40] и реализующем процедуру вычислений оценки коэффициентов модели в реальном масштабе времени.
Суть алгоритма, реализующего Калмановскую фильтрацию, заключается в согласовании наблюдений и физических моделей.
Введем в рассмотрение матрицу :
(1.4.1)
Согласно (1.3.5) матрица - дисперсия ошибки оценки коэффициентов и характеризует точность оценивание коэффициентов в -том уравнении.
Оценку вектора коэффициентов модели (1.3.4) можно выполнить с использованием (1.4.1) и записать в виде:
(1.4.2)
Алгоритм вычисления оценки получим исходя из соотношений (1.4.1),(1.4.2). Перепишем выражение (1.4.2) в следующем виде:
(1.4.3)
Используя правила обращения матриц выражение для можно записать в виде:
(1.4.4)
По аналогии с проведенными преобразованиями перепишем выражение (1.4.2) в виде:
(1.4.5)
Из этого выражения можно получить соотношение:
(1.4.6)
или
(1.4.7)
Тогда выражение для перепишется следующим образом:
(1.4.8)
Подставим вместо во второй член его выражение из (1.4.4):
(1.4.9)
Упрощая это выражение получим
(1.4.10)
Выражения (1.4.9), (1.4.10) определяют алгоритм расчета . Можно вычислить оценку дисперсии шума в реальном масштабе времени:
(1.4.11)
Значение при этом стремится к квазимаксимальноправдоподобной оценке, которая приближенно равна , т.е. близка к байесовской оценке, основанной на всей информации в момент времени , причем имеет смысл матрицы точности оценивания параметров модели, а - дисперсия ошибок оценивания самого процесса по модели
(1.4.12)
Усвоение данных в модели.
На практике очень часто нет возможности получать наблюдение по каждой компоненте вектора состояния , . Будем полагать, что в некоторый момент времени мы имеем только часть информации о векторе состояния, а именно , где , причем . В этом случае можно провести уточнение коэффициентов модели только в -уравнениях (1.4.12). Понятно, что компоненты вектора состояния статистически между собой связаны. Используя эту связь можно уточнить значения тех составляющих вектора состояния, по которым информация не поступила за счет тех компонент по которым есть измерение.
Пусть в момент имеется линейная оценка процесса , полученная в результате использования имеющихся на момент времени данных измерений и минимизирующая функционал . Такая оценка в работах [9,40] дается условным математическим ожиданием по отношению к процессу :
(1.4.13)
Выведем в явном виде формулы оптимального линейного оценивания состояния с учетом полученных на момент времени измерений .
Из уравнения (1.4.13), используя имеющиеся на момент времени данные измерений, можно получить линейную оценку процесса . Оптимальное оценивание состояния , с учетом полученных на момент времени измерений дается линейной оценкой в виде:
(1.4.14)
Минимизация выражения (1.4.14) приводит к матричному уравнению Винера-Хопфа относительно -мерной матрицы решение которого имеет вид:
(1.4.15)
где - ковариационная матрица ошибки оценки .
Итак, оптимальная оценка состояния дается соотношениями (1.4.14), (1.4.15).
Ковариационная матрица ошибки оптимальной оценки с учетом соотношений (1.4.14), (1.4.15) равна:
(1.4.16)
Для численной реализации на каждом временном шаге процедуры оптимального оценивания, представленной выражениями (1.4.13)-(1.4.16), произведена модификация этого алгоритма, при которой осуществляется последовательное усвоение каждой компоненты вектора состояния по рекуррентным формулам:
(1.4.17)
(1.4.18)
(1.4.19)
Индекс пробегает на одном шаге по времени значения от до . Начальные условия: .
Справедлива Теорема. После применения рекуррентной процедуры (1.4.16-19) вектор состояния и ковариационная матрица тождественно совпадают с и , вычисленными по формулам (1.4.14), (1.4.15), (1.4.16). Теорема доказывается методом математической индукции.
Лекция 1.5. Выбор и проверка адекватности моделей
Для выбора подходящего класса моделей среди множества возможных требуется критерий и цель. Критерием может служить способность модели к хорошему предсказанию, способность модели генерировать статистические характеристики хорошо согласующиеся с эмпирическими оценками и др. Целью построения модели может являться решение конкретной функциональной задачи при удовлетворении модели таким, например, требования как экономичность (в смысле затрат времени на реализацию на компьютере) или "понятность" для пользователя задачи.
Критерий выбора подходящего класса моделей должен быть таким, чтобы выбранный класс обладал свойством удовлетворения соответствующим критериям проверки адекватности на заданном уровне значимости.
Число классов может быть велико и без прямого метода определения нужного класса моделей необходимо было бы для заданного множества данных найти наиболее подходящую модель в каждом из классов, а затем применять множество критериев проверки адекватности, пока не будет найден соответствующий класс наиболее подходящих моделей, удовлетворяющих всем критериям проверки адекватности. Поскольку этот путь трудоемок в вычислительном отношении, на практике задачи выбора класса и проверки адекватности модели рассматривают отдельно.
Считаем, что класс моделей описывается тройкой , где - стохастическое разностное уравнение; - множество векторов коэффициентов; - множество соответствующих ковариаций
Поставим задачу следующим образом: исходя из множества непересекающихся классов принадлежащих и множества наблюдений , требуется найти "наиболее правдоподобный" класс, который мог бы породить это множество наблюдений.
При выборе класса наиболее предпочтительных моделей нужно иметь ввиду, что по конечному объему данных никогда нельзя установить, что модель полностью воспроизводит рассматриваемый процесс. Однако можно подобрать такую модель, при которой различие между характеристиками модели и характеристиками данных лежит в пределах ошибки выборки.
Воспользуемся методом максимума правдоподобия для выбора класса моделей. Основная идея состоит в вычислении функции правдоподобия для каждого класса по заданным наблюдениям и выборе среди них класса с максимальным значением функции правдоподобия.
Оценивание функции правдоподобия сложная задача и на практике считают, что является удовлетворительной аппроксимацией , - заданное множество наблюдений; - неизвестный вектор параметров и ковариаций модели; - плотность вероятности имеющихся наблюдений; - оценка условного максимального правдоподобия для параметра .
Решающее правило выбора класса аппроксимации [10], для заданного множества наблюдений имеет вид: выбрать тот класс, на котором достигается максимальное значение функции правдоподобия классов
,
где - размерность вектора .
Рассмотрим метод предсказания для выбора класса моделей. Основная идея метода состоит в использовании адаптивного алгоритма прогноза построенного по данным до момента времени .
Обозначим алгоритм одношагового прогноза по значениям через . Ошибка предсказания вычисляется как . Используя все ошибки предсказания, можно вычислить среднеквадратическую ошибку предсказания:
(1.5.1)
Решающее правило: класс является наиболее правдоподобным, если , соответствующее этому классу, является наименьшим.
Метод правдоподобия является наиболее разносторонним и теоретически глубоким, а на практике дает приемлемые результаты. Метод предсказания можно использовать при проверке на разных группах данных. Этот метод особенно пригоден для систем с изменяемыми по времени параметрами. Однако метод предсказания на практике дает модели, не всегда удовлетворяющие тестам адекватности, поэтому его предпочтительно использовать в совокупности с методами правдоподобия.
Рассмотрим проблему проверки адекватности. Качество модели проверяется по тому, насколько близко модель приближает данные расчета к , как к белому гауссовскому шуму. Можно считать, что если (а это есть не что иное, как ошибки прогноза на один шаг вперед) является белым гауссовским шумом, то он статистически неотделим от последовательности случайных чисел, поэтому, улучшить модель на основе имеющихся эмпирических данных нельзя.
Проведем проверку остатков. Используя модель и наблюдения можно образовать остатки являющиеся оценками значений шума . Нужно проверить, можно ли рассматривать эту последовательность, как последовательность независимых случайных величин с нулевыми средними, имеющим нормальное распределение , где - неизвестно.
Конкретные тесты можно применять только для выяснения, принадлежит ли вектор параметров одному из классов, когда число классов конечно. Проверка элементов на независимость не имеет смысла до тех пор, пока не будут установлены альтернативные типы зависимости.
Рассмотрим тест на наличие смещения от нулевого среднего. Предположим, что заданная последовательность независима и нормальна по закону . Проверим равенство , когда неизвестно, используя следующий критерий. Пусть имеются два класса:
(1.5.2)
где - последовательность одинаково распределенных по закону случайных величин с нулевым средним.
Тестовой статистикой является:
(1.5.3)
где
(1.5.4)
В классе величина имеет - распределение с степенями свободы независимо от . Решающее правило имеет вид:
принимается класс
||*
отвергается класс
Пороговое значение , выбирается по таблице t-распределений соответствующих заданному уровню значимости (x=0.05).
Рассмотрим тест на наличие синусоидальных трендов. Предположим, что последовательность представляет собой либо белый шум, либо смесь белого шума с синусоидальным только одной из частот .
Определим классы:
Тестовая статистика имеет вид:
(1.5.6)
Если C0 - правильный класс, график функции от k представляет собой прямую линию, исходящую из начала координат в точку (0.5,1) и, следовательно, нормированная кумулятивная периодограмма должна колебаться около прямой, соединяющей точки (0,0),(0.5,1).
Если работать с 5-процентным уровнем значимости, то класс можно принять если вся кумулятивная периодограмма лежит внутри 95 процентной полосы.
В качестве заключения по тестам проверки адекватности отметим, что поскольку концепция этой проверки имеет экспериментальный характер, её критерии могут лишь свидетельствовать об адекватности представления моделью данных наблюдений.
Лекция 1.6. Линейная парная регрессия.
Различают четыре типа зависимостей между переменными:
1) Зависимость между неслучайными переменными, не требующую для своего изучения применения статистических методов;
2) Зависимость случайной переменной y от неслучайных переменных, исследуемую методами регрессионного анализа;
3) Зависимость между случайными переменными y и xi, изучаемую методами корреляционного анализа;
4) Зависимость между неслучайными переменными, когда все они содержат ошибки измерения, требующую для своего изучения применения конфлюэнтного анализа.
Применение регрессионного анализа для обработки результатов наблюдений позволяет получить оценку влияния переменных, рассматриваемых в качестве аргументов (независимых переменных) на переменную, которая считается зависимой от первых.
В качестве наиболее удовлетворительной гипотезы взаимосвязи между функцией и аргументами рассматриваются линейная и нелинейная регрессионные модели, каждая из которых может быть парной (только две переменных - функция и аргумент) или множественной (одна функция и несколько аргументов).
Относительно закона изменения независимых переменных xi не делается никаких ограничений.
Для нахождения теоретической линии регрессии по данным производственных замеров или специально поставленных экспериментов применяется метод наименьших квадратов, с помощью которого путем определенных вычислений находится уравнение
,
соответствующее взаимосвязи рассматриваемых параметров. А именно, отыскивается теоретическая линия регрессии по , занимающая в корреляционном поле такое положение, при котором выполняется требование, чтобы сумма квадратов расстояний от этой линии до каждой точки в корреляционном поле являлась минимальной.
При изображении корреляционного поля на графике по оси откладывают значения функции, а по оси — значения аргумента. Теоретическая линия регрессии по должна быть внесена в корреляционное поле таким образом, чтобы соблюдался принцип наименьших квадратов:
(1.6.1)
где— порядковый номер точки в исходном числовом материале:
—измеренное значение функции для определенного значения аргумента (х);
—расчетное значение функции при заданной величине аргумента (х) в соответствии с теоретической их взаимосвязью. В случае линейной зависимости
=
(1.6.2)
Задача сводится к отысканию коэффициентов регрессии и уравнения (1.6.2), т. е. заранее установлено, что рассматриваемые параметры и связаны линейной зависимостью по уравнению (1.6.2).
Величина представляющая собой расстояние от каждой точки корреляционного поля до теоретической линии регрессии, определяется из уравнения
=-()
(1.6.3)
где xj— параметр х, соответствующий измеренному значению .
Для определения численных значений коэффициентов регрессии и , исходя из принципа наименьших квадратов отклонений, нужно приравнять нулю частные производные функции по и:
(1.6.4)
(1.6.5)
Выполнив необходимые преобразования, получим систему двух уравнений с двумя неизвестными для определенияи:
(1.6.6)
Решая систему уравнений относительно a и b, находим численные значения коэффициентов регрессии. Величины , ,, находятся непосредственно по данным производственных измерений.
Величина свободного члена уравнения регрессии (1.6.2), или коэффициента а равна функции у при = 0.
Коэффициент b в уравнении регрессии характеризует изменение функции у при изменении аргумента х на единицу. и графически отражает угол наклона линии уравнения регрессии.
При решении практических задач регрессионного анализа возникает вопрос об оценке тесноты исследуемой взаимосвязи, т. е. насколько полученные на основе обработки производственных или лабораторных данных уравнения регрессии достоверны. В случае парной линейной корреляции в качестве оценки тесноты связи используют обычно коэффициент корреляции, который рассчитывается по формуле:
(1.6.7)
Числитель выражения для коэффициента корреляции r представляет собой разность между средним значением произведения XY и произведением средних значений X * Y измеренных значений параметров x и y исходной информации. Знаменатель равен произведению средних квадратических отклонений значений параметров у и х от своих средних. Средние квадратические отклонения (стандартные отклонения) рассчитываются по формулам:
(1.6.8)
(1.6.9)
Квадраты средних квадратических отклонений y и хи) называются дисперсиями
(1.6.10)
(1.6.11)
и являются важными статистическими оценками рассеяния значений какой-либо величины около ее среднего значения.
Величина коэффициента корреляции r может изменяться от 0 при полном отсутствии связи до ±1 при наличии линейной функциональной связи хс у. Если r>0, между х и уимеет место положительная корреляционная связь, т. е. с ростом параметра хувеличивается параметр у, если r<0, между х и у имеет место отрицательная связь. С коэффициентом регрессии bв уравнении (2) коэффициент корреляции связан соотношением
(1.6.12)
Угловой коэффициент регрессии b представляет собой тангенс угла наклона линии регрессии к оси абсцисс. Следовательно, чем больше наклон линии регрессии к оси абсцисс, тем больше значение коэффициента корреляции, т. е. тем значительнее будет изменение функции у при изменении на единицу аргумента х.
Малая величина коэффициента корреляции указывает на отсутствие линейной связи, однако криволинейная связь между рассматриваемыми параметрами при этом может быть достаточно тесной. Коэффициент корреляции отражает не только величину приращения у при изменении х, но и тесноту связи функции и аргумента. Чем больше разброс точек относительно линии регрессии, тем меньше коэффициент корреляции. Это свойство коэффициента корреляции отражено в его формуле в виде соотношения стандартных отклонений.
Для оценки надежности полученного результата используют иногда критерий надежности , который учитывает как величину коэффициента корреляции, так и число пар измерений. Критерий надежности рассчитывается по формуле
(1.6.13)
где — коэффициент корреляции;
—число пар измерений.
Как видно из формулы критерия надежности, чем выше коэффициент корреляции и большее число пар измерений, тем больше показатель надежности. При , > 2,6 связь считается статистически достоверной.
Располагая данными можно выполнить анализ взаимосвязи аргумента и функции: построить график с корреляционным полем рассматриваемых показателей, определить теоретическую линию регрессии, оценить тесноту связи для выбранных параметров. Однако, проанализировав конфигурацию корреляционного поля, построенного по исходным данным, можно усмотреть что описание взаимосвязи рассматриваемых параметров с помощью прямой линии не является наилучшей аппроксимацией. Иногда в данное поле корреляции значительно лучше впишется некоторая кривая.
Таким образом из технологического опыта может следовать, что связь между аргументом и функцией имеет криволинейный характер. Возможно, что аппроксимация производственных данных в виде кривой точнее отражала бы существующую взаимосвязь.
ТЕМА 2. ОСНОВЫ ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ
Лекция 2.1. Введение в имитационное моделирование.
Имитационное моделирование (от англ. simulation) ― это распространенная разновидность аналогового моделирования, реализуемого с помощью набора математических инструментальных средств, специальных имитирующих компьютерных программ и технологий программирования, позволяющих посредством процессов-аналогов провести целенаправленное исследование структуры и функций реального сложного процесса в памяти компьютера в режиме «имитации», выполнить оптимизацию некоторых его параметров.
Имитационной моделью называется специальный программный комплекс, который позволяет имитировать деятельность какого-либо сложного объекта. Он запускает в компьютере параллельные взаимодействующие вычислительные процессы, которые являются по своим временным параметрам (с точностью до масштабов времени и пространства) аналогами исследуемых процессов.
Для этого вида моделирования используется синоним компьютерное моделирование. Так как имитационную модель нужно создавать, то для этого необходимо специальное программное обеспечение ― система моделирования. Специфика такой системы определяется технологией работы, набором языковых средств, сервисных программ и приемов моделирования.
Имитационная модель должна отражать большое число параметров, логику и закономерности поведения моделируемого объекта во времени (временная динамика) и в пространстве (пространственная динамика). Моделирование объектов экономики связано с понятием финансовой динамики объекта. С точки зрения специалиста (информатика-экономиста, математика-программиста или экономиста-математика), имитационное моделирование контролируемого процесса или управляемого объекта ― это высокоуровневая информационная технология, которая обеспечивает два вида действий, выполняемых с помощью компьютера:
• работы по созданию или модификации имитационной модели;
• эксплуатацию имитационной модели и интерпретацию результатов.
Имитационное (компьютерное) моделирование экономических процессов обычно применяется в двух случаях:
• для управления сложным бизнес-процессом, когда имитационная модель управляемого экономического объекта используется в качестве инструментального средства в контуре адаптивной системы управления, создаваемой на основе информационных (компьютерных) технологий;
• при проведении экспериментов с дискретно-непрерывными моделями сложных экономических объектов для получения и отслеживания их динамики в экстренных ситуациях, связанных с рисками, натурное моделирование которых нежелательно или невозможно.
Можно выделить следующие типовые задачи, решаемые средствами имитационного моделирования (ИМ) при управлении экономическими объектами:
• моделирование процессов логистики для определения временных и стоимостных параметров;
• управление процессом реализации инвестиционного проекта на различных этапах его жизненного цикла с учетом возможных рисков и тактики выделения денежных сумм;
• анализ клиринговых процессов в работе сети кредитных организаций (в том числе применение к процессам взаимозачетов в условиях российской банковской системы);
• прогнозирование финансовых результатов деятельности предприятия на конкретный период времени (с анализом динамики сальдо на счетах);
• бизнес-реинжиниринг несостоятельного предприятия (изменение структуры и ресурсов предприятия-банкрота, после чего с помощью имитационной модели можно сделать прогноз основных финансовых результатов и дать рекомендации о целесообразности того или иного варианта реконструкции, инвестиций или кредитования производственной деятельности);
• анализ адаптивных свойств и живучести компьютерной региональной банковской информационной системы;
• оценка параметров надежности и задержек в централизованной экономической информационной системе с коллективным доступом (на примере системы продажи авиабилетов с учетом несовершенства физической организации баз данных и отказов оборудования);
• анализ эксплуатационных параметров распределенной многоуровневой ведомственной информационной управляющей системы с учетом неоднородной структуры, пропускной способности каналов связи и несовершенства физической организации распределенной базы данных в региональных центрах;
• моделирование действий курьерской (фельдьегерьской) вертолетной группы в регионе, пострадавшем в результате природной катастрофы или крупной промышленной аварии;
• анализ сетевой модели PERT (Program Evaluation and Review Technique) для проектов замены и наладки производственного оборудования с учетом возникновения неисправностей;
• анализ работы автотранспортного предприятия, занимающегося коммерческими перевозками грузов, с учетом специфики товарных и денежных потоков в регионе;
• расчет параметров надежности и задержек обработки информации в банковской информационной системе.
Система имитационного моделирования, обеспечивающая создание моделей для решения перечисленных задач, должна обладать следующими свойствами:
• возможностью применения имитационных программ совместно со специальными экономико-математическими моделями и методами, основанными на теории управления;
• инструментальными методами проведения структурного анализа сложного экономического процесса;
• способностью моделирования материальных, денежных и информационных процессов и потоков в рамках единой модели, в общем модельном времени;
• возможностью введения режима постоянного уточнения при получении выходных данных (основных финансовых показателей, временных и пространственных характеристик, параметров рисков и др.) и проведении экстремального эксперимента.
Имитационное моделирование как научная дисциплина появилась на рубеже 50–60-х гг. ХХ века. Научные исследования и практическое применение метода начались в США. Сегодня компьютерная имитация имеет широкое распространение в решении важных научных и народнохозяйственных задач.
Для построения имитационной модели может быть использован практически любой из языков программирования высокого уровня. Но такое решение проблемы едва ли будет рациональным при моделировании даже сравнительно простой системы. Гораздо более эффективным является использование специализированных систем имитационного моделирования. В настоящее время существует целый ряд таких систем, например, инструмент визуального моделирования SIMULINK, входящий в состав пакета MATLAB.
Место имитационного моделирования в математическом моделировании
Среди процедур математического моделирования можно выделить аналитическое, численное, имитационное и статистическое. Три последних перечисленных вида моделирования часто относят к категории компьютерного ввиду сложности их реализации без ЭВМ.
Аналитическое моделирование характеризуется описанием функционирования элементов некоторыми определенными математическими соотношениями.
Численное моделирование подразумевает использование какого-либо численного метода (позволяющего свести решение к выполнению конечного числа арифметических действий).
Статистическое моделирование позволяет получать статистические данные о процессах в моделируемой системе.
Имитационное моделирование (ИМ) – метод конструирования модели реальной системы и постановки экспериментов на этой модели с целью исследовать её поведение либо оценить различные стратегии, обеспечивающие функционирование данной системы.
При этом необходимо подать структуру системы (описание элементов и связей между ними) и описать ее поведение с помощью состояний и моментов переходов между этими состояниями. Состояние системы в каждый момент времени можно определить, как множество значений ее параметров в этот момент времени. Изменение значений параметров можно считать переходом в другое состояние. Внешняя среда задается посредством входных данных. При необходимости моделирования вероятностных систем и процессов в ИМ включается и статистическое моделирование (метод Монте-Карло).
Преимущества и недостатки имитационного моделирования
Имитационное моделирование, в частности машинная имитация, достаточно распространено при исследовании сложных систем благодаря ряду преимуществ. Вот некоторые из них.
1. На ранних стадиях предварительного проектирования систем можно быстро получить нужную информацию, пусть и с некоторыми допущениями, о возможном функционировании проектируемой системы. Это дает возможность с достаточной точностью определить эффективность функционирования системы и избежать лишних материальных затрат.
2. Можно исследовать особенности функционирования системы при любых условиях, в частности тех, которые не могут быть реализованы в натурных экспериментах. При этом параметры системы и окружающей среды можно варьировать в как угодно широких границах, воссоздавая произвольные, как реальные, так и гипотетические, ситуации. Благодаря такому подходу резко уменьшается потребность в сложном лабораторном оснащении и эксплуатационных испытаниях системы.
3. Можно прогнозировать поведение системы в близком и отдаленном будущем, основываясь на результатах натурных испытаний и фактического использования. В этом случае полученные ранее данные пополняются благодаря применению статистического подхода.
4. Можно во много раз сократить время испытания технических и технико-экономических систем с помощью их имитационных моделей. Дни и месяцы реальных условий могут быть «сжаты» к секундам и минутам при «прогоне» модели.
5. Можно искусственным путем быстро и в большом объеме получить отражающую ход реальных процессов информацию, избежав дорогих, а часто и невозможных натурных испытаний этих процессов.
6. Исследование и оптимизацию некоторых сложных экономических систем нельзя выполнить ни с помощью лабораторных или натурных экспериментов, ни аналитическими методами. Имитационное моделирование на ЭВМ часто бывает единственным реализуемым способом решения таких задач.
Машинную имитацию как численный машинный метод решения сложных задач целесообразно применять при следующих условиях:
• непригодность или отсутствие аналитических методов решения задач;
• полная уверенность в успешном создании имитационной модели, которая адекватно описывает исследуемую систему (процесс). Разрабатывать имитационную модель стохастических процессов при невозможности получить описание нужных характеристик случайных величин и событий ― не имеет смысла;
• возможность использовать сам процесс построения имитационной модели для предварительного исследования моделируемой системы с целью выработки рекомендаций относительно улучшения условий её функционирования.
Главными недостатками метода машинной имитации являются довольно большие затраты времени и средств на построение адекватной модели, а также трудность и даже невозможность учета в модели некоторых важных особенностей реальной системы.
Основные принципы моделирования
Накопленный при разработке и использовании моделей опыт можно выразить несколькими основными принципами (ИМ):
Принцип информационной достаточности. При полном отсутствии информации об исследуемой системе построение ее модели невозможно, а при наличии полной информации ― нецелесообразно. Существует некоторый критический уровень априорных сведений о системе (уровень информационной достаточности), при достижении которого может быть построена адекватная модель.
Принцип целесообразности. Модель создается для достижения некоторых целей, определяемых на начальном этапе формулировки проблемы моделирования.
Принцип осуществимости. Модель должна обеспечивать достижение поставленной цели исследования с вероятностью, существенно отличающейся от нуля, и за конечное время. Обычно задают некоторое пороговое значение PO вероятности достижения цели моделирования P(t), а также граничное время достижения этой цели tO. Модель считается осуществимой, если P(t) PO и t tO .
Принцип множественности моделей. Модель должна в первую очередь отражать те свойства реальной системы (явления), которые влияют на выбранный показатель эффективности. При использовании любой конкретной модели познаются лишь определенные стороны реальности. Для более полного ее исследования необходим ряд моделей, позволяющих отражать исследуемый процесс с разных сторон и с разной степенью детализации.
Принцип агрегирования. Сложную систему в большинстве случаев можно представить состоящей из агрегатов (подсистем), для адекватного формального описания которых оказываются пригодными некоторые стандартные математические схемы. Этот принцип позволяет достаточно гибко перестраивать модель в зависимости от задач исследования.
Принцип параметризации. В ряде случаев моделируемая система имеет в своем составе некоторые относительно изолированные подсистемы, характеризующиеся определенным параметром, в том числе векторным. Такие подсистемы можно заменять в модели соответствующими числовыми величинами, а не описывать процесс их функционирования. При необходимости зависимость значений этих величин от ситуации может задаваться в виде таблиц, графиков либо аналитических выражений. Принцип параметризации позволяет сократить объем и продолжительность моделирования, но при этом параметризация снижает адекватность модели.
Структура имитационных моделей
В самом общем виде структура имитационной модели выглядит следующим образом:
E=f(xi, yj), (2.1.1)
где E – результат действия системы;
xi – переменные и параметры, которыми можно управлять;
yj – переменные и параметры, управление которыми недоступно;
f – функциональная зависимость между xi и yj определяющая величину E.
Модели представляют собой некоторую комбинацию следующих составляющих: компоненты, переменные, параметры, функциональные зависимости, ограничения, целевые функции.
Компоненты ― составные части, которые при соответствующем объединении образуют систему (элементы системы или ее подсистемы).
Параметры ― величины, которые можно выбирать произвольно в отличие от переменных. Например, в уравнении y=7x, число 7 ― параметр, а x и y ― переменные.
Переменные подразделяются на экзогенные и эндогенные. Экзогенные (независимые) переменные, называются также входными ― порождаются вне системы или являются результатом воздействия внешних причин. Эндогенные (зависимые) возникают в системе или в результате воздействия внутренних причин, часто являются выходными.
Функциональные зависимости описывают поведение переменных и параметров в пределах компонента или выражают соотношения между компонентами системы. Эти соотношения, или операционные характеристики, являются либо детерминированными, либо стохастическими. Детерминированные соотношения устанавливают зависимость между определенными переменными или параметрами в случаях, когда процесс на выходе системы однозначно определяется заданной информацией на входе. Стохастические зависимости при заданной входной информации дают на выходе неопределенный результат. Можно указать лишь множество возможных результатов и, в некоторых случаях, вероятности их получения.
Ограничения представляют собой устанавливаемые пределы изменения значений переменных или ограничивающие условия распределения и расходования тех или иных средств (энергии, запасов, времени и т.п.). Они могут вводиться либо разработчиком (искусственные ограничения), либо самой системой вследствие присущих ей свойств (естественные ограничения).
Целевая функция (функция критерия) ― точное отображение целей или задач системы и необходимых правил оценки их выполнения.
Построенная модель должна быть хорошей, качественной и соответственно удовлетворять следующим условиям, то есть быть:
• простой и понятной пользователю;
• удобной в управлении и обращении;
• целенаправленной;
• надежной в смысле гарантии от абсурдных ответов;
• содержательной с точки зрения возможности отображать основные свойства реальной системы или процесса;
• адаптивной, позволяющей легко переходить к другим модификациям или обновлять данные;
• допускающей постепенные изменения в направлении усложнения своей структуры.
Лекция 2.2. Технология имитационного моделирования
Имитационное моделирование позволяет исследовать процессы во времени. Естественно, что действительная скорость протекания большинства исследуемых процессов значительно отличается от скорости моделирования на ЭВМ. Поэтому при использовании имитационного моделирования необходимо соотносить между собой три представления времени: реальное, модельное (системное) и машинное.
Под реальным подразумевают время, в котором исследуемая система работает в действительности. Здесь могут быть миллисекунды, минуты, часы, смены, месяцы, годы и т.д.
В масштабе модельного времени организуется работа самой имитационной модели. Это условные единицы времени, выраженные как целыми, так и действительными числами.
Машинное время отражает реальные затраты времени ЭВМ на проведение моделирования. В связи с ростом вычислительной мощности ЭВМ, значимо только при использовании достаточно сложных моделей.
Понятие модельного времени служит для решения следующих задач:
• отображения перехода моделируемой системы из одного состояния в другое;
• синхронизации работы компонент модели;
• изменения масштаба времени функционирования исследуемой системы;
• управления ходом модельного времени;
• моделирования квазипараллельной обработки событий в модели.
Под квазипараллельной понимают последовательную обработку событий, которые в исследуемой системе происходят одновременно.
Модельное время может быть реализовано двумя методами – с постоянным шагом и по особым состояниям.
Если используется принцип постоянного шага, отсчет модельного времени ведется через фиксированные интервалы t, на которые разбит весь моделируемый период времени. События в модели считаются наступившими в момент окончания такого интервала. Состояние системы определяется для момента времени t, затем t+t , t+2t и т.д. Погрешности временных характеристик исследуемой системы зависят от величины t.
Метод постоянного шага целесообразно применять, если:
• события появляются регулярно, их распределение во времени достаточно равномерно;
• число событий велико и моменты появления их близки;
• невозможно заранее определить моменты появления событий.
Этот метод достаточно легко реализовать даже с использованием универсальных языков программирования. Но нужно учесть, что придется определять состояние системы в каждый из моментов времени, даже если в нем не происходит никаких событий. А такие «пустые» отрезки времени могут быть весьма большими.
Алгоритм моделирования по принципу постоянного шага приведен на рис.2.2.1. Здесь tМ – текущее значение модельного времени, z(tМ) – состояние системы в этот момент времени, TМ – интервал моделирования.
При моделировании по особым состояниям модельное время изменяется от события к событию. События обрабатываются в порядке их наступления, а одновременно наступившими считаются только те, которые являются одновременными в действительности. Алгоритм метода приведен на рис.2.2.2.
Рис.2.2.1. Алгоритм моделирования с постоянным шагом
Моделирование по особым состояниям целесообразно, если:
• события появляются нерегулярно либо интервалы между ними велики;
• предъявляются повышенные требования к точности взаимного положения событий во времени;
• необходимо реализовать квазипараллельную обработку одновременных событий.
Недостатком метода можно считать относительную сложность в реализации, т.к. для него требуется разработка специальной процедуры планирования событий (календаря событий). Главное достоинство ― «пропуск» участков на временной оси, где не происходит никаких событий.
В отличие от других видов и способов математического моделирования с применением ЭВМ имитационное моделирование имеет свою специфику: запуск в компьютере взаимодействующих вычислительных процессов, которые являются по своим временным параметрам ― с точностью до масштабов времени и пространства ― аналогами исследуемых процессов.
Этапы имитационного моделирования
Имитационное моделирование как особая информационная технология состоит из следующих основных этапов.
1. Структурный анализ процессов. Проводится формализация структуры сложного реального процесса путем разложения его на подпроцессы, выполняющие определенные функции и имеющие взаимные функциональные связи согласно легенде, разработанной рабочей экспертной группой. Выявленные подпроцессы, в свою очередь, могут разделяться на другие функциональные подпроцессы.
Структура общего моделируемого процесса может быть представлена в виде графа, имеющего иерархическую многослойную структуру, в результате появляется формализованное изображение имитационной модели в графическом виде. Структурный анализ особенно эффективен при моделировании экономических процессов, где (в отличие от технических) многие составляющие подпроцессы не имеют физической основы и протекают виртуально, поскольку оперируют с информацией, деньгами и логикой (законами) их обработки.
2. Формализованное описание модели. Графическое изображение имитационной модели, функции, выполняемые каждым подпроцессом, условия взаимодействия всех подпроцессов и особенности поведения моделируемого процесса (временная, пространственная и финансовая динамика) должны быть описаны на специальном языке для последующей трансляции.
3. Построение модели. Обычно это трансляция и редактирование связей (сборка модели), верификация (калибровка) параметров.
Рис.2.2.2. Алгоритм моделирования по особым состояниям
Трансляция осуществляется в различных режимах: в режиме интерпретации, или в режиме компиляции.
Каждый режим имеет свои особенности. Режим интерпретации проще в реализации. Специальная универсальная программа-интерпретатор на основании формализованного описания модели запускает все имитирующие подпрограммы.
Данный режим не приводит к получению отдельной моделирующей программы, которую можно было бы передать или продать заказчику (продавать пришлось бы и модель, и систему моделирования, что не всегда возможно).
Режим компиляции сложнее реализуется при создании моделирующей системы. Однако это не усложняет процесс разработки модели. В результате можно получить отдельную моделирующую программу, которая работает независимо от системы моделирования в виде отдельного программного продукта.
Верификация (калибровка) параметров модели выполняется в соответствии с легендой, на основании которой построена модель, с помощью специально выбранных тестовых примеров.
4. Проведение экстремального эксперимента для оптимизации определенных параметров реального процесса.
Возможен другой подход к определению основных этапов моделирования:
1. Разработка имитационной модели;
2. Разработка методики моделирования (планирование имитационного эксперимента);
3. Программная реализация модели (выбор средств ― универсальных языков программирования либо специализированных языков моделирования);
4. Выполнение имитационного моделирования, анализ и обобщение результатов, принятие решений.
Рассмотрим подробнее каждый из этих этапов.
Разработка имитационной модели (1.) является наиболее ответственным этапом, от тщательности проработки которого зависит весь дальнейший успех имитационного моделирования. Последовательность работ на этом этапе следующая:
1.1 Определение задачи и ее анализ.
1.2 Определение требований к информации.
1.3 Сбор необходимой информации.
1.4 Выдвижение гипотез и принятие допущений.
1.5 Определение основного содержания модели.
1.6 Определение параметров, переменных и критериев эффективности модели.
1.7 Описание концептуальной модели и проверка ее достоверности.
1.8 Построение логической структурной схемы (блок-схемы).
Определение задачи и ее анализ (1.1) являются первыми шагами при разработке имитационной модели. Для того чтобы найти приемлемое или оптимальное решение задачи, необходимо знать, в чем она состоит.
В первую очередь необходимо убедиться в самом существовании задачи. Начальной формулировке свойственна неопределенность, поэтому необходимо хорошо изучить проблему, уточняя постановку задачи.
Формулировка задачи должна давать четкое представление о её масштабе и диапазоне практического применения результатов. Полная формулировка задачи должна содержать определяющую формулировку и методологию её решения.
В определяющую формулировку входят:
• утверждения относительно существования и обоснования задачи;
• перечень проблемных вопросов, связанных с решением задачи;
• анализ масштабности задачи и возможных границ ее применения;
• разбивка исходной задачи на отдельные подзадачи.
Методология (порядок) решения задачи включает:
• установку приоритетности и очередности решения задачи;
• определение возможных методов решения подзадач;
• обоснование требований необходимых затрат труда (разработка и отладка программ, вспомогательные работы) и машинного времени;
• составление календарного (сетевого) графика выполнения работ.
Определение требований к информации (1.2), необходимой для количественного и качественного описания входных данных, требует ответа на следующие вопросы:
• какая информация может считаться необходимой;
• каковы источники этой информации;
• в каком виде необходимо подать;
• какими методами целесообразно обрабатывать информацию?
В случае невозможности получить определенную информацию, необходимо найти пути ее замены, либо разработать другой вариант решения задачи.
Под сбором информации (1.3) понимают её получение и оценивание. Получить информацию можно просмотром публикаций, анализом производственных источников, обработкой документов и отчетов, подготовкой априорных и обработкой экспериментальных данных, экспертным путем. Полученная информация должна быть оценена с точки зрения её соответствия решаемой задаче и удобства использования, а также отфильтрована от ненужных и случайных данных.
В случае недостатка информации выдвигают гипотезы и принимают допущения (1.4). Гипотезы заменяют неизвестные закономерности развития системы и доопределяют постановку задачи. Доказывая гипотезы, получают более точное представление о решении задачи. Допущения, т.е. утверждения, которые временно (до установления истины) считаются верными, принимают в случае отсутствия или невозможности получения определенных данных. Допущения позволяют преобразовать усложненные и трудноучитываемые величины в удобные для использования.
Основное содержание модели (1.5) разрабатывается с учетом выдвинутых гипотез и сделанных предположений. При этом необходимо учесть специфические особенности реальной обстановки, самой задачи и средств ее решения. Рассматривая реальную обстановку, как элемент при создании модели, необходимо определить:
• функции системы и способы их реализации;
• детерминированные и недетерминированные функции;
• аппроксимацию этих функций в модели;
• влияние факторов среды на работу системы;
• способы взаимодействия человека и системы, человека и среды, системы и среды;
• аппроксимацию этих взаимодействий в модели.
Начальный этап описания имитационной модели ― определение параметров (1.6) и факторов системы, непосредственно связанных с моделируемой ситуацией, а также выявление переменных величин, которые в процессе функционирования имитационной модели могут приобретать разные значения. Переменные величины решаемой задачи состоят из случайных величин (например, количество бракованных деталей в партии выпуска), регулируемых, которые называются переменными управления или управляющими параметрами (момент времени выдачи и объем заказа на поставку ресурса в системах управления запасами), и нерегулируемых (например, количество деталей, которые необходимо изготовить в цехе на протяжении планового периода).
Выбор критериев эффективности представляет собой наиболее ответственный этап в задачах оптимизации систем. Если эти критерии установлены, то с помощью имитационной модели определяются оптимальные значения переменных управления.
Концептуальная модель ― это абстрактная модель, отражающая структуру моделируемой системы, свойства её элементов, а также причинно-следственные связи системы в рамках целей исследования. Она является формальным описанием моделируемой системы, отображающим концепцию (восприятие, систему взглядов на определенный процесс).
Концептуальная модель основывается на всех описанных ранее этапах работы по построению информационной модели и может быть реализована математическими и программными средствами. Чаще всего концептуальную модель записывают в виде множества исходных предпосылок.
Уровень детализации модели зависит от таких факторов: цели проекта, критериев оценки эффективности, доступности данных, достоверности результатов, мнений экспертов по данной проблеме, технических, финансовых и временных ограничений.
Достоверность концептуальной модели (1.7) может быть проверена в следующем порядке:
• выяснение замысла модели и целесообразности ее создания;
• выявление связи замысла модели и целесообразности ее построения с детерминированными, вероятностными и средними значениями характеристик модели;
• исследование принятых аппроксимаций реальных процессов;
• рассмотрение критериев эффективности;
• исследование принятых предположений и гипотез;
• установление связи с реальными процессами;
• изучение системы и возмущающих факторов внешней среды;
• установление достоверности информации и её источников, используемых при построении модели;
• рассмотрение процедуры в целом в связи с формулировкой задачи;
• рассмотрение постановки задачи.
Этап проверки правильности создания концептуальной модели часто называют валидацией, а этап проверки правильности её реализации (например, в виде компьютерной программы) – верификацией.
Создание логической структурной схемы (1.8) является заключительным этапом построения имитационной модели. Логическая структурная схема имитационной модели представляет собой упорядоченное и наглядное изображение процесса, в котором определены не только действия, а и порядок их выполнения. Логическая схема имитационной модели обычно создается по модульному (блочному) принципу, то есть в виде совокупности стандартных блоков-модулей. Модульное построение схем имитационных моделей обеспечивает их гибкость.
Лекция 2.3. Метод Монте-Карло и имитационное моделирование
Влияние случайных факторов на социально-экономические процессы является серьезной причиной возникновения неопределенности состояния хозяйственных и экономических систем. Для принятия эффективного управленческого решения необходимо как можно полнее учесть влияние неконтролируемых случайных факторов и сделать аргументированный вывод относительно возможных направлений развития системы и оптимальной стратегии управления ею. Такие задачи могут быть решены с помощью метода статистических испытаний (метода Монте-Карло).
Метод Монте-Карло представляет собой совокупность формальных процедур, посредством которых воссоздаются любые случайные факторы (случайные события, случайные величины с произвольным распределением и т.п.). Влияние случайных факторов на систему моделируется с помощью случайных чисел. Получение выборок по методу Монте-Карло является основным принципом имитационного моделирования систем со стохастическими (вероятностными) элементами.
Зарождение метода Монте-Карло связанно с исследованиями фон Неймана и Улана в конце 40-х годов, когда они ввели термин «метод Монте-Карло» и применили этот метод к решению некоторых задач экранирования ядерных излучений. Этот давно известный математический метод пережил свое второе рождение, когда нашел применение в закрытых работах по ядерной технике в Лос-Аламосе, выполнявшихся под кодовым названием «Монте-Карло».
В методе статистических испытаний данные экспериментов вырабатываются искусственно с помощью генератора случайных чисел (СЧ) и интегральной функции распределения вероятности для исследуемого процесса. Генератором может быть колесо рулетки, таблица, программа или любой другой источник равномерно распределенных случайных чисел.
Создавать и использовать имитационные модели с вероятностными элементами целесообразно лишь тогда, когда случайные факторы полностью описаны с помощью соответствующих характеристик (вероятность, плотность распределения вероятностей и т.п.). Эти характеристики изучаются на базе эмпирических данных, собранных либо при систематизации имеющихся отчетных материалов, либо в результате обработки специально поставленных экспериментов.
С помощью эмпирического распределения можно только повторять прошлые события. Поэтому, если это возможно, лучше использовать какое-либо аппроксимирующее теоретическое распределение. Кроме того, в случае использования теоретического распределения легче изменять параметры генератора случайных чисел, когда нужно проверить чувствительность модели или «проиграть» на ней возможные ситуации.
Для использования метода Монте-Карло необходимы равномерно распределенные случайные числа (РСЧ) в диапазоне [0, 1]. Рассмотрим свойства этих чисел.
Если случайная величина имеет равномерное распределение на отрезке , то ее плотность распределения вероятности имеет вид:
(2.3.1)
Математическое ожидание и дисперсия случайной величины:
(2.3.2)
(2.3.3)
Для случайной величины в диапазоне :
(2.3.4)
(2.3.5)
(2.3.6)
Функция кумулятивного распределения:
(2.3.7)
Равномерную случайную величину на отрезке [0, 1] обозначим через . Для нее характерно уникальное (присущее лишь данному распределению) свойство: вероятность того, что значения этой случайной величины попадут на некоторый интервал с границами , равняется длине этого интервала:
(2.3.8)
Это свойство часто используется в методе Монте-Карло как необходимое и достаточное условие того, что некоторая случайная величина имеет распределение (2.3.4).
Построение стохастических имитационных моделей РСЧ на отрезке [0, 1] дает возможность генерировать случайные события или случайные величины с произвольным распределением.
Принципиальная возможность генерировать последовательные реализации случайной величины вытекает из такого преобразования:
= z12-1 + z22-2 +…+ zi2-i +…, (2.3.9)
где zi ― реализация случайной величины Z, которая приобретает лишь два значения ― 0 и 1 с одинаковой вероятностью 0,5.
Случайная величина , равномерно распределенная на отрезке [0, 1], может иметь бесконечное число реализаций. Тем не менее, при использовании метода Монте-Карло на ЭВМ можно образовать лишь различных случайных чисел (k ― количество двоичных разрядов машинной памяти). Поэтому равномерная случайная последовательность чисел (РСП), используемая при машинных расчетах, фактически является реализацией дискретной случайной величины, распределение которой называется квазиравномерным (от лат. Quasi – почти, будто).
РСП чисел, распределенных на отрезке [0, 1], может быть получена тремя различными методами: физическое, табличное и программное генерирование [6,7].
Физическое устройство или программа ЭВМ, порождающая РСП [0, 1], называется генератором (датчиком) случайных чисел.
Физическое (аппаратное) генерирование случайных чисел базируется на использовании определенных физических явлений. Ранее в качестве генераторов случайных чисел использовались разные механические устройства – колесо рулетки, специальные игральные кости и т.п.
В настоящее время физическое генерирование РСП [0, 1] базируется на положении, в соответствии с которым при генерировании т-разрядного случайного двоичного числа необходимо получить т реализаций случайной величины Z, приобретающей значения 0 или 1 с одинаковой вероятностью 0,5.
Реализации случайной величины Z можно получить, используя радиоактивное излучение или собственные шумы электронных приборов.
Сущность метода, основанного на радиоактивном излучении, состоит в следующем:
1) выбирается источник радиоактивного излучения с интенсивностью ;
2) в зависимости от значения выбирается отрезок времени ;
3) с помощью счетчика определяется количество частиц, которые излучает источник за время ;
4) если количество частиц четное, то zi = 0, иначе zi = 1.
Для получения т-разрядного случайного двоичного числа достаточно т раз обратиться к счетчику радиоактивных частиц. Аналогично работает и метод, основанный на собственных шумах электроприборов.
Преимущества метода физического генерирования:
1) скорость генерирования чисел очень высока;
2) места в оперативной памяти не занимает;
3) запас чисел не ограничен.
Недостатки метода физического генерирования:
1) нельзя повторить попытки (нет возможности физический датчик зафиксировать на определенном случайном числе);
2) нужна периодическая корректировка датчиков, поскольку их физические свойства со временем изменяются;
3) необходимо иметь специальное устройство к ЭВМ.
Физическое генерирование случайных чисел используется в основном там, где очень часто решаются задачи методом Монте-Карло. В последние годы аппаратные генераторы активно применяются в системах защиты информации.
Табличный метод получения РСП [0, 1] заключается в использовании таблиц случайных чисел, сгенерированных аппаратными средствами. Существуют таблицы, содержащие тысячи и даже миллионы случайных цифр.
Преимущества табличного метода:
1) числа можно получать очень быстро, если таблица записана в оперативную память;
2) можно повторять попытки, что очень важно в случае проведения ответственных экспериментов;
3) обеспечивается однократная проверка качества случайных чисел.
Недостатки табличного метода:
1) таблица занимает много места в оперативной памяти;
2) запас чисел ограничен;
3) необходима внешняя память.
Табличный метод получения РСП [0, 1] применяется в основном для ручных расчетов. В исследованиях на ЭВМ он используется для отладки программ или дублирования особенно ответственных опытов.
Программный метод. Действительно случайные числа можно получить лишь с помощью физических генераторов. Числа, получаемые с помощью ЭВМ, обычно называют псевдослучайными (от греч. псевдо – обман, ненастоящий), хотя при достаточно большом количестве их статистические свойства совпадают с действительно случайными.
Псевдослучайными такие числа называют потому, что каждое следующее случайное число получают с помощью рекуррентного соотношения, а значит, между двумя соседними числами существует зависимость:
(2.3.10)
Т.к. алгоритм получения РСП является детерминированным, то ее качество напрямую зависит от функции . Общая теория построения псевдослучайных чисел до сих пор не создана. Вид функции устанавливают эмпирически. Она содержит разные арифметические и логические операции. Качество получаемой РСП проверяется с помощью специальных тестов.
Один из первых алгоритмов образования случайных чисел с помощью рекуррентного соотношения – метод серединных квадратов, предложенный в 1946 году фон Нейманом и Метрополисом. В квадрат возводится текущее случайное число и из серединных разрядов результата выделяется следующее случайное число. Этот метод очень легко реализовать, но вырабатываемые генератором числа являются сильно коррелированными. Кроме того, если начальное число четное, то последовательность может вырождаться, т.е. начиная с некоторого значения, следующее будет равно предыдущему. Такое произойдет, если начальным числом серии будет 4500.
Таким же простым является метод произведений. Два следующих друг за другом случайных числа перемножаются, и из серединных разрядов произведения выделяется следующее случайное число.
Теперь почти все стандартные библиотечные программы вычисления последовательности равномерно распределенных случайных чисел основываются на понятии конгруэнтности.
Два целых числа А и В конгруэнтны по модулю т (где т ― целое число), когда существует такое целое число k, что А – В = km, то есть когда разность А – В делится на т без остатка (числа А и В дают одинаковые остатки при делении на абсолютную величину числа m). Это записывается как и читается «А конгруэнтно В по модулю m». Например, , , и т.д.
Наиболее известными являются следующие конгруэнтные методы: мультипликативный, смешанный и аддитивный.
Мультипликативный конгруэнтный метод. Случайное число РСП [0, 1] может быть получено преобразованием целых чисел , определяемых с помощью рекуррентного выражения:
, (2.3.11)
где а и m – положительные целые числа.
Для нахождения следующего случайного числа xi+1 достаточно:
1) взять последнее случайное число xi;
2) умножить его на коэффициент а;
3) произведение поделить на модуль m;
4) остаток от деления считать искомым случайным числом xi+1 (это будет одно из целых чисел 0, 1, 2, 3,..., т – 1.)
Выбор а, т и начального числа x0 необходимо производить очень осторожно. Если а = 1, то xi = x0 для любого i. Когда x0 = 0, то xi = 0 для всех i. Очевидно, что любой генератор псевдослучайных чисел может дать лишь конечное множество целых случайных чисел; после этого последовательность будет повторяться.
Период (длина) последовательности зависит от разрядности ЭВМ и выбранного модуля, а статистические свойства – от выбора начального числа и множителя. Выбирать а, x0, т нужно так, чтобы обеспечить максимальный период и минимальную корреляцию (автокорреляцию).
Смешанный конгруэнтный метод отличается от предыдущего наличием определенной константы c:
. (2.3.12)
Аддитивный конгруэнтный метод базируется на следующем:
. (2.3.13)
Преимущества программного метода:
1) занимает мало места в оперативной памяти;
2) можно повторить попытки;
3) обеспечивается однократная проверка качества случайных чисел;
4) не нужны внешние устройства.
Недостатки программного метода:
1) относительно небольшая скорость образования случайных чисел;
2) запас чисел ограничен длиной периода.
Сравнив преимущества и недостатки трех методов генерирования последовательности случайных чисел, можно сделать вывод, что программный способ более других пригоден для применения в имитационном моделировании.
Применение метода Монте-Карло успешно только в случае, когда создаваемые генератором числа являются случайными, равномерно распределенными на отрезке [0, 1] и независимыми. Практически бывает достаточно, чтобы последовательность приблизительно отвечала требованиям идеального генератора, что проверяется с помощью специальных статистических тестов. При этом выполняются две предпосылки.
1. Генератор псевдослучайных чисел считается пригодным, если он выдерживает набор заведомо установленных тестов.
2. Качество случайных чисел проверяется лишь один раз на предварительном этапе построения имитационной модели.
Среди тестов оценки качества случайных чисел есть общеизвестные статистические методы проверки гипотез (проверка соответствия распределений по критериям Пирсона или Колмогорова, выявление корреляционной зависимости между сериями случайных чисел — автокорреляции), а также и специально разработанные для метода Монте-Карло критерии. Количество этих тестов достаточно велико и их описание можно найти в литературе. Как правило, генератор РСП [0, 1] считают возможным использовать лишь в случае, когда он одновременно отвечает всем выбранным тестам (проверка датчика прекращается, как только он не отвечает очередному тесту). Решения о соответствии датчика тому ли другому тесту исследователь часто принимает на интуитивном уровне, опираясь на собственный опыт.
Лекция 2.4. Планирование имитационных экспериментов
Экспериментом называют научно поставленный опыт для целенаправленного изучения некоторого явления в точно учтенных условиях, когда можно проследить ход изменения явления. Целью экспериментальных исследований является получение новой информации при изучении различных сложных систем.
По возможности исследователя влиять на независимые факторы эксперименты подразделяют на пассивные и активные.
Пассивный эксперимент заключается в анализе результатов наблюдений, которые зависят от многих одновременно действующих факторов.
Активный эксперимент позволяет исследователю определенным образом планировать эксперимент, чтобы упростить процедуру оценки влияния каждого из факторов, а также при необходимости воссоздавать эксперимент многократно.
Традиционный способ изучения зависимости исходной величины от многих независимых факторов заключается в её исследовании отдельно для каждого фактора при фиксированных значениях остальных факторов. Создаваемая при этом семья функций мало пригодна для практических целей и большей частью не содержит всей необходимой информации.
Это и стало причиной необходимости планировать эксперименты. Такое планирование должно предусматривать привлечение к практике исследовательских работ средств, которые дают возможность повысить эффективность наблюдений, получить наглядную интерпретацию результатов и наилучшим образом оценить случайные и систематические ошибки опытов. Эти вопросы рассматриваются в научной дисциплине ― теории планирования экспериментов, начало которой было положено в 1918 году работой Р. Фишера о разработке метода планирования экспериментов ― дисперсионного анализа. Большое значение для развития теории планирования экспериментов имела опубликованная в Англии 1951 года работа Бокса и Уилсона о проблемах планирования экспериментов многофакторных процессов для поиска оптимальных решений способом одновременного варьирования по заданным правилам всех факторов исследуемого процесса.
Планирование эксперимента ― это разработка такого плана эксперимента, который дает возможность с минимальным количеством опытов (а значит, затрат материальных, трудовых и временных ресурсов) сделать статистически значимые выводы или найти оптимальные решения относительно функционирования системы. Уменьшение числа попыток не должно существенно сказаться на качестве полученной информации.
В экономических исследованиях теория планирования экспериментов имеет довольно ограниченное распространение, прежде всего из-за сложности или невозможности постановки активных экспериментов в реальных условиях. Тем не менее, разработка методов машинной имитации дала возможность вести активные машинные эксперименты с моделями экономических систем.
Во время выполнения натурных или машинных экспериментов могут решаться две основные проблемы:
• исследование систем ― выявление закономерностей развития системы и установление количественных соотношений между переменными величинами и параметрами, которые описывают функционирование системы;
• оптимизация систем ― установление значений факторов, которые обеспечивают оптимальный режим функционирования системы.
План эксперимента размещается в факторном пространстве.
Факторное пространство ― множество значений внешних и внутренних параметров модели (факторов) , которые предположительно влияют на результаты экспериментов и значения которых может контролировать исследователь. Факторное пространство можно представить как сетку точек, каждая из которых отвечает одному опыту. Значения факторов называют уровнями.
Пусть y ― эндогенная случайная величина, а – контролируемые во время опытов факторы. Тогда изучаемый процесс описывается так:
(2.4.1)
Функцию называют функцией (реакцией, поверхностью) отклика.
Задача исследования системы заключается в установлении зависимости (2.4.1) или выявлении величины влияния разных факторов или их комбинаций на функцию отклика.
При оптимизации систем необходимо определить такие уровни факторов, в которых функция отклика приобретает экстремальные значения. В таком случае эндогенную величину y называют параметром оптимизации, а функцию отклика ― целевой.
Поверхность отклика для функции одной переменной вырождена в линию. Для двух факторов поверхность отклика представляет собой поверхность в трехмерном пространстве.
К факторам при планировании экспериментов выдвигаются требования относительно:
• измеримости и управляемости. В отличие от натурных экспериментов при имитационном моделировании любой фактор может быть управляемым;
• независимости, т.е. установление некоторого уровня одного фактора не должно зависеть от взятых значений других факторов;
• совместимости – любые комбинации уровней факторов должны быть осуществимы.
Следует установить границы областей определения факторов, их основные уровни и интервалы варьирования. При выборе количества уровней нужно выполнять два противоречивых требования:
• уровни фактора должны перекрывать весь возможный диапазон его изменения;
• общее количество уровней всех факторов не должно приводить к завышенному объему моделирования.
Выбор основных уровней (начальной точки факторного пространства) и интервалов варьирования основывается на предварительных знаниях относительно исследуемого процесса. Делают этот выбор, исходя из необходимости уменьшения числа опытов для решения поставленной задачи. Например, для поиска оптимального значения функции отклика в качестве начальной точки может быть выбрана точка факторного пространства, которая на основании некоторых соображений должна лежать вблизи области экстремума.
Итак, для каждого і-го фактора определяются:
– основной уровень і-го фактора;
– верхний уровень і-го фактора;
– нижний уровень і-го фактора;
– интервал варьирования.
Во время проведения экспериментов используются кодированные значения уровней факторов. Кодирование выполняют по формуле:
. (2.4.2)
После кодирования верхний уровень примет значение +1, нижний ― значение –1, основной уровень будет равен нулю.
Количество всех точек факторного пространства при двухуровневой системе смены факторов, для которых необходимо экспериментально находить значение функции отклика, равняется 2n, где n – число факторов.
Сначала функцию отклика (2.4.1) берут в виде линейной зависимости:
, (2.4.3)
где ― коэффициенты при факторах.
После проверки ее на адекватность (в случае отрицательного результата), модель усложняют к неполному квадратичному полиному ― зависимости с учетом взаимодействия факторов:
. (2.4.4.)
В случае неадекватности и этой модели, избирают полный полином второй степени:
. (2.4.5)
Обычно полинома второй степени достаточно, и лишь в редких случаях используется полином третьей степени.
Если при проведении опытов возможны ошибки измерения эндогенной величины y, либо она является случайной величиной и оценивается с помощью математического ожидания, то y получают обработкой результатов установленного заранее числа дублирований эксперимента.
Для определения коэффициентов уравнения регрессии экспериментально находят значение эндогенной величины y в N точках факторного пространства (при двухуровневой системе смены факторов ).
Попытки в каждой точке дублируются k раз. За расчетное значение функции отклика в некоторой точке факторного пространства берут среднее значение этого показателя. Число повторений опыта определяется статистическими методами в зависимости от принятой надежности и точности ожидаемых результатов (изложено в следующей теме).
При планировании имитационного моделирования для повторений опыта можно использовать несколько разных генераторов случайных чисел.
Для корректного выполнения регрессионного анализа необходимо, чтобы выполнялись рассмотренные ниже условия:
1. Результаты параллельных наблюдений величины y в каждой из N точек факторного пространства представляют собой реализацию нормально распределенной случайной величины.
2. Дисперсии реализаций равны между собой, т.е. дисперсия величины y не зависит от того, с какой точкой факторного пространства проводят параллельные опыты;
3. Факторы ― независимые величины, измеренные с настолько малой погрешностью, которой можно пренебречь сравнительно с погрешностью определения величины у.
В случае имитационного моделирования третье условие выполняется всегда, первое и второе должны проверяться с помощью специальных тестов.
Существуют два варианта постановки задачи планирования имитационного эксперимента:
• из всех допустимых выбрать такой план, который позволил бы получить наиболее достоверное значение функции отклика при фиксированном количестве опытов;
• выбрать такой допустимый план, при котором статистическая оценка функции отклика может быть получена с нужной точностью при минимальном количестве опытов.
Решение задачи планирования в первой постановке называют стратегическим планированием эксперимента, во второй ― тактическим планированием.
Полным факторным экспериментом (планом) называется эксперимент, в котором реализуются все возможные объединения (комбинации) уровней факторов, т.е. N=un, где u – число уровней факторов.
Таблица 2.4.1. Матрица планирования для полного факторного эксперимента
Номер опыта
1
-1
-1
+1
2
+1
-1
-1
3
-1
+1
-1
4
+1
+1
+1
5
-1
-1
-1
6
+1
-1
+1
7
-1
+1
+1
8
+1
+1
-1
Чаще всего в экспериментах используется двухуровневая система изменения факторов. Число всех точек факторного пространства равняется 2n (базовая точка, в окрестности которой ищут аппроксимацию функции отклика, во внимание не принимается, поскольку в этой точке эксперимент не проводится).
Полный факторный эксперимент удобно подавать в виде матриц планирования. Для трехфакторного эксперимента при кодированных значениях уровней факторов (2.4.2) такая матрица приведена в таб.2.4.1.
Геометрически полный факторный план при n=3 можно изобразить в виде куба, центр которого отвечает точке основного уровня факторов, а координаты вершин заданы условиями опытов. При n>3 полный факторный план геометрически означает n-мерный гиперкуб.
Полные факторные планы имеют важные свойства:
• симметричность плана относительно центра эксперимента:
, , (2.4.6)
где – значение уровня і-го фактора в j-м опыте (попытке);
• нормированность плана:
; (2.4.7)
• ортогональность плана – скалярные произведения векторов-столбцов матрицы планирования равняются нулю:
; (2.4.8)
• рототабельность (от лат. roto – оборачиваюсь) плана означает, что точность предсказания значения функции отклика одинакова на равных расстояниях от центра эксперимента и не зависит от направления движения (в рототабельных планах точки факторного пространства, используемые для опытов, лежат на поверхности сферы, центром которой является точка основного уровня).
Полные факторные планы дают возможность установить влияние на функцию отклика не только отдельно каждого фактора, но и их комбинаций, т.е. исследовать так называемый эффект взаимодействия. Для этого в матрицу планирования дополнительно вносят векторы-столбцы, которые содержат значение комбинаций уровней факторов (таб.2.4.2).
Таблица 2.4.2. Матрица планирования с эффектами взаимодействия
Номер опыта
1
+1
-1
-1
+1
+1
-1
-1
+1
2
+1
+1
-1
-1
-1
-1
+1
+1
3
+1
-1
+1
-1
-1
+1
-1
+1
4
+1
+1
+1
+1
+1
+1
+1
+1
5
+1
-1
-1
-1
+1
+1
+1
-1
6
+1
-1
-1
+1
-1
+1
-1
-1
7
+1
+1
+1
+1
-1
-1
+1
-1
8
+1
+1
+1
-1
+1
-1
-1
-1
С целью упрощения обработки данных к матрице планирования введен фиктивный фактор , который приобретает одно значение +1. Матрица планирования с эффектами взаимодействия сохраняет указанные выше свойства полных факторных планов.
Дробный факторный эксперимент
На практике довольно часто влияние эффектов взаимодействия на функцию отклика незначительно, и коэффициенты регрессии в уравнении (1.18) при нелинейных членах малы сравнительно с коэффициентами при линейных членах. Это означает, что функция отклика может описываться полиномом первой степени (1.17). Для определения такой модели нужно найти коэффициенты bi. Для этого достаточно иметь отклики в n+1 точках факторного плана, тогда как в полном факторном плане выполняется 2n попыток. Учитывая условие 2n > n+1, добытые данные будут чрезмерными. Например, при трехфакторном эксперименте для определения коэффициентов полный факторный план дает 8 попыток, хотя достаточно провести 4 попытки. Поэтому для оценок коэффициентов в линейных аппроксимирующих полиномах используются дробные факторные планы, в которых число попыток меньше числа точек в факторном пространстве.
Рассмотрим полный двухфакторный план, матрица которого приведена в таблице 1.3.
Таблица 2.4.3. Матрица планирования дробного факторного плана
Номер попытки
1
-1
-1
+1
2
+1
-1
-1
3
-1
+1
-1
4
+1
+1
+1
Если пренебречь эффектом взаимодействия факторов Х1 и Х2, то вектор-столбец матрицы планирования, в котором размещены элементы произведения , можно использовать для записи уровней третьего фактора . Полученный при этом дробный факторный план будет иметь свойства симметричности, нормированности, ортогональности, рототабельности. Сравнивая таб.2.4.2 и таб.2.4.3, можно заметить, что образованный таким способом дробный факторный план реализует первые 4 попытки (половину) полного факторного плана. Поэтому такой дробный факторный план называется полурепликой и обозначается .
Дополняющую полный факторный план полуреплику, которая реализует другую половину полного трехфакторного плана, можно получить, если в полном двухфакторном плане значения элементов () присвоить уровням фактора .
Для вычисления коэффициентов регрессии уравнений (2.4.3-5) в полных и дробных факторных планах нужно выполнить N опытов. Сначала выясняют, возможна ли линейная аппроксимация функции отклика на заданной области изменения факторов. К полиномам более высокой степени переходят в том случае, когда линейная модель неадекватна полученным исследовательским данным или нужно глубже изучить поведение функции отклика возле некоторой точки.
Для уравнения линейной регрессии (2.4.3) коэффициенты вычисляются методом наименьших квадратов:
(2.4.9)
В случае, когда учитывается взаимодействие факторов, коэффициенты регрессии bis определяются как:
(2.4.10)
Из формул (2.4.9) и (2.4.10) видно, что для определения любого коэффициента нужны лишь соответствующие столбики матрицы планирования и столбики отклика y. Это дает возможность усложнить модель, не пересчитывая найденные раньше коэффициенты. Это обеспечивается свойством ортогональности плана.
Коэффициенты регрессии bi и bis определяются для кодированных уровней факторов. Поэтому нужно перейти из пространства кодированных переменных к пространству натуральных с учетом. Например, для линейной регрессии:
(2.4.11)
Для вычисления коэффициентов регрессии полинома второй степени:
(2.4.12)
двухуровневые факторные эксперименты не пригодны, так как неизвестных коэффициентов в модели (1.26) больше, чем попыток в полном факторном плане (например, при трех факторах число неизвестных коэффициентов будет 11, а уровней факторов ― только 23=8).
Поэтому для построения полиномов второй степени нужно варьировать значение факторов, по крайней мере, уже на трех уровнях.
Лекция 2.5. Обобщение и статистическая оценка
результатов имитационного моделирования
Результаты имитационного моделирования могут быть полезными при принятии решений, только когда они имеют необходимую точность и достоверность, т.е. сама модель может считаться качественной.
Оценка качества имитационной модели является завершающим этапом ее разработки и преследует две цели:
1. Проверить соответствие модели ее назначению (целям исследования).
2. Оценить достоверность и статистические характеристики результатов, получаемых при проведении модельных экспериментов.
При аналитическом моделировании достоверность результатов определяется корректным выбором используемого математического аппарата и методической ошибкой, присущей данному математическому методу.
При имитационном моделировании на достоверность результатов влияет целый ряд дополнительных факторов, основные из которых:
• моделирование случайных факторов, основанное на использовании датчиков случайных чисел, которые могут вносить «перекручивание» в поведение модели;
• наличие нестационарного режима работы модели;
• использование нескольких разнотипных математических методов в рамках одной модели;
• зависимость результатов моделирования от плана эксперимента;
• необходимость синхронизации работы отдельных компонентов модели.
Пригодность имитационной модели для решения задач исследования характеризуется тем, в какой степени она отвечает целевым свойствам. Основными из этих свойств являются:
• адекватность;
• стойкость;
• чувствительность.
Рассмотрим некоторые способы проведения оценки модели по каждому из указанных свойств.
Оценка адекватности модели. В основном адекватность (соответствие модели явлению или процессу) проверяют с помощью ряда статистических критериев.
Процедура оценки адекватности основана на сравнении измерений на реальной системе и результатов экспериментов на модели и может проводиться разными способами. Наиболее распространенные из них:
• по среднему значению откликов модели и системы;
• по дисперсиям отклонений откликов модели от среднего значения откликов системы;
• по максимальному значению относительных отклонений откликов модели от откликов системы.
Названные способы оценки довольно близки между собой, поэтому рассмотрим первый из них.
При этом способе проверяется гипотеза близости среднего значения функции отклика модели среднему значению отклика реальной системы *.
В результате 0 опытов на реальной системе получают множество значений *. Выполнив М экспериментов на модели, также получают множество значений функции отклика модели переменной .
Затем вычисляют оценки математического ожидания и дисперсии откликов модели и системы, после чего выдвигается гипотеза о близости средних значений * и (в статистическом смысле). Основой для проверки гипотезы есть t-статистика (распределение Стьюдента). Ее расчетное значение сравнивается с критическим значением tКР, взятым из справочной таблицы. Если выполняется неравенство t tКР, то гипотеза принимается.
Статистические методы применимы только в том случае, если оценивается адекватность модели существующей системы. Если система только проектируется, в качестве эталонного объекта приходится принимать концептуальную модель проектируемой системы. Тогда оценка адекватности программно реализованной модели заключается в проверке того, насколько корректно она отображает концептуальную модель.
Оценка стойкости модели. Стойкость модели ― это ее способность сохранять адекватность при исследовании эффективности системы на всем возможном диапазоне значений внешних влияний, а также при внесении изменений в конфигурацию системы.
В общем случае можно утверждать, что чем ближе структура модели структуре системы и чем выше степень детализации, тем устойчивее модель.
Стойкость результатов моделирования может быть также оценена методами математической статистики, например, с помощью критерия Уилкоксона.
Критерий Уилкоксона служит для проверки того, относятся ли две выборки к одной и той же генеральной совокупности (т.е. владеют ли они одинаковым статистическим признаком). Например, в двух партиях некоторой продукции измеряется определенный признак, и нужно проверить гипотезу о том, что этот признак имеет в обеих партиях одинаковое распределение, другими словами, необходимо убедиться, что технологический процесс от партии к партии изменяется несущественно.
При статистической оценке стойкости модели соответствующая гипотеза может быть сформулирована так: при изменении значений независимых факторов или структуры имитационной модели закон распределения результатов моделирования остается неизменным.
Проверку указанной гипотезы проводят при следующих данных: есть две выборки X = (x1, ... xn) и Y = (y1, ... yn), полученные для разных значений независимых факторов (относительно законов распределения X и Y никаких предположений не делается).
Значения обеих выборок упорядочиваются вместе по возрастанию. Затем анализируется взаимное расположение xi и yj. В случае yj xi говорят, что пары значений (xi , yj) образовывают инверсию.
Например, пусть для n = m = 3 после упорядочения получилась такая последовательность значений: y1, x1, y3, x2, y2, x3; тогда примем инверсии: (x1, y1), (x2, y1), (x2, y3), (x3 , y1), (x3 , y2), (x3 , y3).
Подсчитывают полное количество инверсий U. Если гипотеза верна, то U не должно сильно отличаться от своего математического ожидания М:
. (2.5.1)
От гипотезы отказываются, если |U – М | > UКР (UКР определяется по таблице для заданного уровня значимости).
Оценка чувствительности модели. Если изменение значений внешних параметров модели (в некотором заданном диапазоне) не отражается на значениях исходных параметров, то польза от такой модели небольшая. В связи с этим возникает задача оценивания чувствительности модели к изменению внешних параметров, а также внутренних параметров самой системы.
Такую оценку проводят по каждому параметру Xk отдельно. Основана она на том, что обычно диапазон возможных изменений параметра известен. Одна из наиболее простых и распространенных процедур оценивания заключается в следующем.
1. Исчисляется величина относительного среднего увеличения параметра Xk:
. (2.5.2)
2. Проводится пара модельных экспериментов при значениях Xk= Xkmax, Xk= Xkmin и средних фиксированных значениях параметров. Определяются значение отклика модели Y1=f(Xkmax) и Y2=f(Xkmin).
3. Исчисляется относительное увеличение зависимой переменной Y:
. (2.5.3)
В результате для k-го параметра модели получают пары значений (Xk, Yk), что характеризует чувствительность модели по этому параметру. Аналогично формируются пары для других параметров модели, которые образуют множество Xk, Yk.
Данные, полученные при оценке чувствительности модели, могут быть использованы, в частности, при планировании экспериментов: большее внимание должно отводиться тем параметрам, к изменению значений которых модель оказалась более чувствительной.
Калибровка модели. Если в результате проведенной оценки качества модели оказалось, что ее целевые свойства не удовлетворяют разработчика, необходимо выполнить калибровку, т.е. коррекцию с целью приведения в соответствие предлагаемым требованиям. Процесс калибровки носит итеративный характер и составляется их трех основных этапов:
1. Глобальные изменения модели (например, введение новых процессов, изменение типов событий и т.д.).
2. Локальные изменения (в частности, изменения некоторых законов распределения моделируемых случайных величин).
3. Изменение специальных параметров, называемых калибровочными.
Целесообразно объединить оценку целевых свойств имитационной модели и ее калибровку в единый процесс. Именно такая стратегия принята в статистическом методе калибровки. Процедура калибровки состоит из трех шагов, каждый из которых является итеративным:
1. Сравнение исходных распределений. Цель ― оценка адекватности имитационной модели;
2. Балансировка модели. Основная задача ― оценка стойкости и чувствительности модели. По его результатам, как правило, выполняются локальные изменения (но возможны и глобальные);
3. Оптимизация модели. Цель этого этапа ― обеспечение необходимой точности результатов. Здесь возможные три основные направлений работ:
• дополнительная проверка датчиков случайных чисел;
• снижение влияния переходного режима;
• применение специальных методов снижения дисперсии.
Методика применения планирования эксперимента
Методика применения математического планирования эксперимента для построения уравнения регрессии функции отклика включает несколько этапов.
1. Выбор фактора, который выступает в роли функции отклика.
2. Определение контролируемых факторов, интервалов варьирования, уровней, кодирование.
3. Определение необходимого количества параллельных опытов в одной серии.
4. Выбор плана эксперимента и построение матрицы планирования.
5. Проверка воспроизводимости опытов с помощью статистического критерия Кохрена.
6. Определение коэффициентов полинома для построения функции отклика.
7. Проверка значимости коэффициентов полинома с помощью статистического критерия Стьюдента.
8. Проверка адекватности функции отклика с помощью статистического критерия Фишера.
9. Переход от уравнения функции отклика в пространстве кодированных переменных к уравнению в натуральном пространстве переменных.
Сначала есть смысл проверить линейный вид модели функции отклика, используя полный или дробный факторный план. Если модель окажется неадекватной, то полином дополняется элементами, которые отвечают возможным вариантам взаимодействия факторов влияния, т.е. линейная модель дополняется до неполной квадратичной. После этого пункты 6-8 повторяются. И лишь когда возникнет потребность в полной квадратичной или кубической модели, нужно возвращаться к пункту 4, изменив план на композиционный.
Определение необходимого количества параллельных опытов
Совокупность методов определения необходимого количества параллельных опытов (повторений в одной точке плана) относят к тактическому планированию эксперимента. Поскольку точность оценок наблюдаемой переменной характеризуется ее дисперсией, то основу тактического планирования эксперимента составляют так называемые методы снижения дисперсии.
Рассмотрим вариант вычисления необходимого количества параллельных опытов (прогонов имитационной модели) – k.
Если случайные значения эндогенной переменной не коррелированы, и их распределение не изменяется от прогона к прогону, то выборочное среднее можно считать нормально распределенным.
Количество прогонов k, необходимое для того, чтобы действительное среднее находилось в интервале y d с вероятностью (1–):
, (2.5.4)
где Z ― значение нормированного центрированного нормального распределения, которое определяется по справочной таблице при заданном уровне значимости /2;
Sy ― дисперсия реализации;
d ― доверительный интервал.
Если необходимое значение Sy к началу эксперимента неизвестно, целесообразно выполнить пробную серию из L прогонов и вычислить на ее основе выборочную дисперсию SL:
, (2.5.5)
где yL ― выборочное среднее по результатам L прогонов.
Подставив SL в формулу (2.5.4), получают предварительную оценку числа прогонов k. Потом выполняют N – L прогонов, которые остались, периодически уточняя оценку числа прогонов k.
Проверка однородности дисперсий
Согласно требованиям регрессионного анализа корректная обработка и использование результатов экспериментальных исследований возможны лишь в том случае, когда дисперсии измерения функции отклика в каждой точке эксперимента одинаковы. Такое свойство называется однородностью дисперсий. Прежде чем находить по результатам исследований математическое описание функции отклика в заданных границах изменения факторов, необходимо убедиться в однородности дисперсий значений величины y. Поскольку теоретические значения дисперсий неизвестны, то наличие однородности дисперсий определяется по их статистическим оценкам
Если проверка однородности дисперсии дает отрицательный результат (гипотеза об однородности дисперсии отбрасывается), то полученный эмпирический материал не рекомендуется использовать для аппроксимации функции отклика полиномами. Следует повторить эксперименты, увеличив при этом число параллельных попыток k.
Проверка значимости коэффициентов регрессии
Экспериментальные исследования проводят, чтобы найти оценки коэффициентов полинома, который аппроксимирует функцию отклика. Значения коэффициентов регрессии имеют экономическую (или техническую) интерпретацию. Для линейной зависимости коэффициент bi (i=1,…,n) характеризует величину влияния фактора xi на отклик y, а именно bi равняется величине прироста отклика Δyi, если фактор xi увеличить на единицу, не изменяя при этом значения других факторов. Для модели с эффектами взаимодействия коэффициенты bi j характеризуют величину эффекта от взаимодействия факторов xi и xj. Поэтому важно проверить значимость коэффициентов уравнения регрессии. Если некоторые из них не значащие (статистически равны нулю), то их можно не учитывать, что упрощает модель. Теоретически значение некоторых коэффициентов могут равняться нулю. Убедиться в этом можно с помощью оценок коэффициентов регрессии, проверяя гипотезу об их значимости.
Значимость коэффициентов линейной регрессии проверяют отдельно по каждому коэффициенту с помощью критерия Стьюдента.
Статистическая незначимость коэффициентов регрессии может быть обусловлена несколькими причинами, а именно:
1) соответствующий незначимому коэффициенту фактор не влияет на функцию отклика;
2) точка центра плана близкая к точке относительного экстремума функции отклика по переменной хі, т.е.
3) малый шаг варьирования факторов;
4) большая погрешность при определении функции отклика.
Прежде чем принимать решение по исключению из уравнения регрессии членов с незначащими коэффициентами, следует тщательно проверить, существуют ли упомянутые причины незначимости. Когда для такого решения есть все основания, то при ортогональном планировании признанный незначимым коэффициент можно отвергнуть без повторного вычисления других коэффициентов. Ведь при таком планировании коэффициенты регрессии независимы. После рассмотренной процедуры в математическом описании функции отклика остаются переменные, коэффициенты регрессии при которых являются статистически значимыми.
Значимость коэффициентов квадратичной регрессии проверяют по тем же правилам, что и линейной.
Проверка адекватности функции отклика
Описание функции отклика аппроксимирующими полиномами, коэффициенты которых определены по методу наименьших квадратов, может и не отвечать (быть неадекватным) наблюдаемым значением эндогенной величины. Поэтому перед использованием математической модели для анализа исследуемой системы следует убедиться в ее адекватности данным эксперимента.
Гипотеза адекватности модели проверяется оцениванием отклонения предусмотренных значений функции отклика от экспериментально найденных по числу повторений в экспериментальных точках факторного пространства. Для оценивания отклонений используется критерий Фишера.
Проверка гипотезы об адекватности возможна, когда число исследовательских точек факторного пространства больше числа членов аппроксимирующего полинома. Это необходимо учитывать, как при определении структуры аппроксимирующего полинома, так и при выборе соответствующего типа факторных планов.
Если гипотеза об адекватности математического описания исследуемого процесса отвергается, то необходимо или перейти к более сложной форме уравнения регрессии, или уменьшить интервалы варьирования факторов в эксперименте. Например, если неадекватна линейная модель, то линейный полином необходимо дополнить, добавив к нему члены, которые отвечают эффектам взаимодействия. Тем не менее, при этом нужно будет реализовать несколько попыток в середине области планирования для проверки гипотезы об адекватности.
Уменьшение интервалов варьирования с целью достижения адекватности математической модели может вызвать уменьшение коэффициентов регрессии, а из-за этого возрастает риск принять ошибочную гипотезу о статистической незначимости некоторых коэффициентов. В общем случае интервал варьирования выбирается из условия обеспечения адекватности математического описания исследуемого процесса. Часто при выборе необходимых интервалов варьирования проводятся предварительные экспресс-попытки, в которых шаг варьирования составляет 0,05…0,3 диапазона изменения значений уровней факторного пространства.
Лекция 2.6. Имитационное моделирование и системы массового обслуживания
Многие экономические системы представляют собой по существу системы массового обслуживания (СМО), т.е. системы, в которых, с одной стороны, имеют место требования по выполнению каких-либо услуг, а с другой — происходит удовлетворение этих требований
Рассмотрим основные элементы и общие принципы имитационного моделирования на примере системы информационно-вычислительного обслуживания. Каждая СМО в общем случае состоит из следующих основных элементов:
• блок обслуживания;
• поток заявок на обслуживание;
• очередь в ожидании обслуживания.
Блоки обслуживания могут различаться между собой по нескольким параметрам. Во-первых, блоки обслуживания могут быть одноканальными или многоканальными. Под каналом обслуживания здесь понимаются обслуживающие устройства (устройства связи, обработки данных, печатающие устройства, устройства памяти и т. п.). Во-вторых, каждый канал может обслуживать одну или несколько заявок одновременно. В-третьих, заявка после обслуживания может либо покидать систему (однофазная система обслуживания), либо проходить некоторую последовательность обслуживающих каналов (многофазная система обслуживания). В-четвертых, каждый канал может обслуживать заявки либо в течение одинаковых промежутков времени, либо время обслуживания заявок является случайной величиной с соответствующим заданным законом распределения.
Поток заявок, как правило, описывается вероятностным законом их поступления в СМО, определяющим длительности интервалов между двумя последовательно поступающими заявками. Эти длительности часто являются статистически независимыми, и их распределение не изменяется в течение некоторого достаточно продолжительного промежутка времени.
Очередь возникает в момент поступления в систему очередной заявки, если канал занят обслуживанием ранее поступившего требования.
По характеру реакции на такие ситуации системы массового обслуживания делятся на две группы: системы с отказами в обслуживании и системы с ожиданием, или очередью. Классическим примером системы с отказами может служить, например, система телефонной автоматической связи.
В системах с ожиданием заявка, пришедшая в момент, когда все каналы заняты, не покидает систему, а становится в очередь и ждет освобождения соответствующего канала обслуживания.
Правила постановки заявок в очередь на обслуживание называют дисциплинами буферизации. Речь идет о том, что очередь в общем случае не может быть неограниченной. В реальных системах очереди чаще всего имеют конечную длину, т. е. в очередь может быть поставлено только определенное количество заявок. Дисциплиной буферизации в таких случаях должно быть предусмотрено, что при заполнении очереди вновь пришедшая заявка либо теряется, т. е. покидает систему без обслуживания, либо замещает какую-нибудь заявку из очереди. В последнем случае выбор замещаемой заявки может происходить по тому или иному критерию (приоритету).
Например, выбор исключаемой заявки может быть осуществлен по критерию времени ожидания в очереди: исключается самая «старая» или самая «свежая» заявка.
Правила выбора заявок из очереди для обслуживания называют дисциплинами диспетчеризации. Дисциплины диспетчеризации подразделяются на бесприоритетные и приоритетные. К бесприоритетным дисциплинам относятся:
• обслуживание в порядке поступления заявок: «первый пришел — первым обслужен»;
• обслуживание заявок в инверсном порядке: «последним пришел — первым обслужен»;
• обслуживание со случайным выбором из очереди.
Второй и третий вариант дисциплин диспетчеризации используются, как правило, в «безлюдных» (или, как их еще называют, «беззащитных») системах, в основном, технического характера.
Для приоритетных дисциплин диспетчеризации, естественно, должен быть задан приоритет обслуживания, например, чем короче реализуемая на компьютере программа, тем выше ее приоритет.
Развитие имитационного моделирования и увеличение возможностей компьютеров привело к появлению систем поддержки принятия решений. Системы поддержки принятия решений представляют комплекс математических моделей и методов, объединенных общей методикой формирования альтернатив управленческих решений в организационных системах, определения последствий реализации каждой альтернативы и обоснования выбора наиболее приемлемого решения.
Каждая система поддержки принятия решения носит сугубо индивидуальный характер, поскольку определяется конкретным содержанием решаемой управленческой проблемы и особенностями процедуры принятия решений в той или иной организации. Если процедуры принятия решений регулярны, устойчивы, то состав и последовательность функционирования рассматриваемой системы закрепляются в качестве нормативных методик, использующих преимущественно формальные модели и методы при незначительном использовании диалоговых процедур. Например, периодическое планирование производственной деятельности. Системы поддержки принятия решений эффективны при решении периодически возникающих проблемных ситуаций с высокой степенью неопределенности и, как правило, не имеющих полных аналогов в прошлом. Системы поддержки приятия решений разрабатываются индивидуально под каждую проблему. В их состав включают преимущественно логико-эвристические и экспертные методы и модели, а главную роль начинают играть диалоговые процедуры. В этих условиях для оценки последствий, принимаемых в условиях неопределенности, и используются имитационные модели.
Первый признак имитационной модели — ориентированность на такую схему. В ходе экспериментов с имитационной моделью эксперты задают ей вопросы, модель доставляет ответы, эксперты их анализируют и формируют знания, суждения, решения.
Вторая особенность имитационной модели — более подробное, чем в классических моделях, отображение структуры прототипа в структуру модели, использующее богатые и гибкие возможности современных средств организации и обработки данных. В этом отличие современных имитационных моделей от дескриптивных эконометрических моделей, хотя последние можно рассматривать как частный случай имитационной модели. Эконометрическая модель устроена как «черный ящик» и не отображает внутренних связей в прототипе. Ее параметры оцениваются в результате статистической обработки наблюдений за действительностью. Может показаться, что эти оценки верны только в условиях действующего экономического механизма. Модель становится непригодной для проектируемого экономического механизма, более или менее существенно отличающегося от действующего. Особенно актуально изучение свойств экономических механизмов, радикально отличных от прежних. Если конструктор модели вынужден по такой причине отказаться от моделирования «в лоб», он пытается понять и отобразить внутренние причинно-следственные связи и механизмы. Для этого модель представляется в виде совокупности компонентов. Для каждого компонента конструктор должен быть способен построить правдоподобную модель, в которой необходимо отобразить все существенные отношения. Такой способ приводит к правдоподобной модели — особенно если в качестве компонентов модели выбирать модели компонентов системы прототипа: предприятия, цеха, банки, регионы, транспортные сети, органы управления, группы населения. Усложнение структуры имитационной модели вызывается стремлением использовать ее в качестве средства доброкачественности решений, формируемых экспертом или нормативной (т.е. более простой) моделью. Для моделирования первичных структурных единиц иногда удается привлекать и классические подходы. Так, для отображения технологических процессов уместно использовать эконометрические промышленные и сельскохозяйственные производственные функции, явно независящие от механизма управления производством. Для построения функций спроса могут быть использованы оптимизационные модели, т.к. здесь критерий оптимальности и ограничения можно иногда формулировать обоснованно.
Третья особенность имитационных моделей состоит в том, что модель, как правило, не «картинка» как, скажем, статическая модель межотраслевого баланса. В статической модели межотраслевого баланса разновременные события «склеены» в одномоментные. Имитационную модель скорее можно рассматривать как «фильм», отображающий функционирование прототипа в виде смен состояний модели в последовательные моменты и — в этой связи — появление разных способов моделирования времени. Эта особенность родилась из отмеченной выше потребности не только получить подходящие решения (роль нормативной модели на этом завершается), но и включить в модель компоненты, отображающие отклик системы на принятые решения — в виде показателей ее функционирования. Классическую динамическую балансовую модель и ее разновидности можно рассматривать как частный, «вырожденный» случай имитационной модели. Хотя функционирование и моделируется в этой модели, но моменты производства, распределения и потребления ресурсов сводятся в один. В результате модель слишком жестко описывает важные явления, связанные с разными ритмами производств поставщиков и потребителей, последствия срывов договоров поставки и т. п. В «невырожденных» имитационных моделях получает отражение то реальное обстоятельство, что процессу потребления ресурсов предшествуют процессы производства и распределения.
Четвертая особенность имитационной модели — свободный выбор средств для моделирования процессов. В то время как классические модели используют сравнительно узкий круг математических конструкций: линейные уравнения и неравенства, оптимизация линейных и дробно-линейных функций, регрессионный
анализ, методы теории массового обслуживания. Модели процессов — это компьютерные и человеко-компьютерные алгоритмы.
Они:
• вычисляют значения «модельного» времени;
• изменяют значения переменных, представляющих состояния компонентов модели;
• генерируют по ходу моделирования новые компоненты (например, сдаваемые в эксплуатацию строящиеся промышленные предприятия (жилые кварталы) или выставляемые платежные требования);
• уничтожают компоненты (разорившиеся предприятия, сносимое ветхое жилье, оплаченные платежи).
В алгоритмы моделирования процессов включают процедуры, генерирующие случайные значения некоторых переменных (представляющих, например, текущие погодные условия или отклонения объемов поставки от договорных).
Пятая особенность — широкие возможности диалога экспериментатора с моделью в ходе ее выполнения, в то время как с выполняемой на компьютере классической моделью экспериментатор контактирует лишь перед ее запуском (задавая значения ее изменяемых параметров) и после ее завершения (интерпретируя полученные результаты).
Перечисленные особенности не исчерпывают, возможно, всех свойств моделей, которые разные авторы склонны называть имитационными. С другой стороны, некоторые авторы называют имитационными модели, обладающие лишь частью этих свойств. Наконец, некоторыми из перечисленных свойств могут в той или иной степени обладать и классические модели, особенно их модификации.
Приведем несколько примеров, иллюстрирующих возможность представления реальных систем информационно-вычислительного обслуживания в виде СМО.
Пример 1.
Если в вычислительном центре имеется несколько вычислительных систем, каждая из которых может обслуживать любые заявки, например, несколько печатающих устройств при безразличном отношении пользователя к тому, какое из них используется для вывода результатов по его заданию, или многопультовое средство подготовки данных, то каждая из этих систем может быть представлена в виде многоканальной однофазной СМО с общим потоком заявок (рис.2.6.1).
Рис.2.6.1. Однофазная многоканальная СМО
Пример 2.
Рассмотрим пример несколько более сложной СМО. Предположим, что анализируется часть вычислительной системы, состоящая из устройств, изображенных на рис.2.6.2.
Рис.2.6.2. Фрагмен вычислительной системы
Здесь к процессору с оперативной памятью подсоединены через селекторный канал (СК) и устройства управления (УУ) два накопителя на магнитных лентах и три накопителя на магнитных дисках.
На устройствах внешней памяти располагаются наборы данных — файлы.
Поток запросов от пользователей на решение задач представляется неограниченным источником заявок.
Процесс решения одной задачи заключается в выполнении случайной последовательности этапов счета (обработки данных в процессоре) и обращений к файлам (обмена данными между внешней и оперативной памятью системы). Решение задачи начинается и завершается этапом счета.
Заявки считаются однородными в смысле одинакового распределения времени их обслуживания различными устройствами системы и отсутствия приоритетов. Заявки обслуживаются любым свободным устройством в порядке их поступления. Времена обслуживания заявок отдельными устройствами определяются по заданным законам распределения.
В этом случае рассматриваемая модель может быть представлена следующим образом (рис.2.6.3).
Рис.2.6.3. Модель системы информационно-вычислительного обслуживания
Модель состоит из двух одноканальных СМО (S1 — процессор, S4 —селекторный канал) и двух многоканальных СМО (S2 — внешняя память на магнитных лентах, S3 — внешняя память на магнитных дисках).
Предполагается наличие общей очереди заявок в группе однотипных устройств, что отражает наличие групповых устройств управления.
Примером системы массового обслуживания может служить и сама вычислительная система, обслуживающая нескольких пользователей, работающих в интерактивном режиме с индивидуальных терминалов. Представление систем информационно-вычислительного обслуживания системами массового обслуживания является методологической основой для их эффективного имитационного моделирования.
Подтвердим данное утверждение, построив имитационную модель для системы массового обслуживания, рассмотренной в первом примере.
В качестве конкретной системы информационно-вычислительного обслуживания, которая может быть представлена такой СМО, возьмем систему ремонтного обслуживания группы компьютеров, установленных в вычислительном центре.
Рассматриваемая система функционирует следующим образом. Когда инженер-ремонтник занят обслуживанием вышедших из строя машин, техника, поступающая на обслуживание, становится в очередь на обслуживание, т. е. простаивает. Во время работы всей вычислительной техники простаивает специалист-ремонтник. Возникает проблема установления для конкретных условий такого количества работников ремонтной службы, при котором величина потерь, связанных с простоями оборудования и обслуживающего его персонала ремонтников, была бы минимальной.
В качестве критерия оптимальности рассматриваемой модели может быть взят следующий функционал:
где З0 — текущие затраты, связанные с содержанием оборудования (компьютеры);
Зп — заработная плата специалистов-ремонтников;
Q — стоимость работ, выполненных на компьютерах;
V — количество ремонтного персонала.
Оптимизация такого функционала аналитическими методами практически невозможна вследствие его нелинейности. В то же самое время, построив имитационную модель (алгоритм) изучаемой системы, можно рассчитать значения функционала для различных значений величины V: (1, 2, 3,...) и выбрать рациональное (здесь в силу дискретности модели — оптимальное) решение (рис.2.6.4).
Рис.2.6.4. График целевой функции моделируемой системы
Динамика функционирования рассматриваемой системы характеризуется следующими состояниями обслуживаемого оборудования:
• начало работы компьютера после его обслуживания;
• выход компьютера из строя (поступление заявки).
• начало обслуживания компьютера.
Совершенно очевидно при этом, что событиями здесь по сделанному выше определению являются все три перечисленные состояния, т.к., хотя на момент выхода компьютера из строя обслуживающий персонал может быть занят обслуживанием других машин, необходимы действия алгоритма по постановке заявки в очередь. Продолжительность работы компьютера без поломки и продолжительность их обслуживания (ремонта) рассматриваются как случайные величины, которые при моделировании получаются с помощью известных законов распределения соответствующих случайных величин и датчика (подпрограммы) случайных чисел. Естественно, что в каждом конкретном испытании значения получаемых случайных величин могут и будут отличаться от реальных. Однако, как это следует из предельных теорем теории вероятностей, при увеличении числа испытаний результаты будут все более и более стабилизироваться, стремясь при этом к постоянным величинам, равным математическим ожиданиям соответствующих параметров исследуемой системы.
Для практического осуществления имитационного эксперимента с рассматриваемой системой должны быть заданы (известны) законы распределения времени работы Ui и времени обслуживания Ti, (ремонта) каждой единицы оборудования. Рассматриваемый аппарат имитационного моделирования позволяет ограничиться получением гистограмм распределения, что значительно упрощает процесс подготовки данных для модели (рис.2.6.5). Затем по гистограммам строятся кумуляты (рис.2.6.6).
Рис.2.6.5. Гистограммы исходных данных для моделирования
Рис.2.6.6. Кумуляты исходных данных для моделирования
Тогда для определения случайных величин Ui и Ti с помощью датчика случайных чисел в диапазоне 0-1 вырабатываются случайные числа, определяющие случайным образом соответствующие величины Ui и Ti.
Лекция 2.7. Компьютерное моделирование при реализации имитационных моделей
Компьютерное моделирование как новый метод научных исследований основывается на:
1. построении математических моделей для описания изучаемых процессов;
2. использовании новейших вычислительных машин, обладающих высоким быстродействием (миллионы операций в секунду) и способных вести диалог с человеком.
Суть компьютерного моделирования состоит в следующем: на основе математической модели с помощью ЭВМ проводится серия вычислительных экспериментов, т.е. исследуются свойства объектов или процессов, находятся их оптимальные параметры и режимы работы, уточняется модель. Например, располагая уравнением, описывающим протекание того или иного процесса, можно изменяя его коэффициенты, начальные и граничные условия, исследовать, как при этом будет вести себя объект. Имитационные модели - это проводимые на ЭВМ вычислительные эксперименты с математическими моделями, имитирующими поведение реальных объектов, процессов или систем.
Реальные процессы и системы можно исследовать с помощью двух типов математических моделей: аналитических и имитационных.
В аналитических моделях поведение реальных процессов и систем (РПС) задается в виде явных функциональных зависимостей (уравнений линейных или нелинейных, дифференциальных или интегральных, систем этих уравнений). Однако получить эти зависимости удается только для сравнительно простых РПС. Когда явления сложны и многообразны исследователю приходится идти на упрощенные представления сложных РПС. В результате аналитическая модель становится слишком грубым приближением к действительности. Если все же для сложных РПС удается получить аналитические модели, то зачастую они превращаются в трудно разрешимую проблему. Поэтому исследователь вынужден часто использовать имитационное моделирование.
Имитационное моделирование представляет собой численный метод проведения на ЭВМ вычислительных экспериментов с математическими моделями, имитирующими поведение реальных объектов, процессов и систем во времени в течение заданного периода. При этом функционирование РПС разбивается на элементарные явления, подсистемы и модули. Функционирование этих элементарных явлений, подсистем и модулей описывается набором алгоритмов, которые имитируют элементарные явления с сохранением их логической структуры и последовательности протекания во времени.
Имитационное моделирование - это совокупность методов алгоритмизации функционирования объектов исследований, программной реализации алгоритмических описаний, организации, планирования и выполнения на ЭВМ вычислительных экспериментов с математическими моделями, имитирующими функционирование РПС в течение заданного периода.
Под алгоритмизацией функционирования РПС понимается пооперационное описание работы всех ее функциональных подсистем отдельных модулей с уровнем детализации, соответствующем комплексу требований к модели.
"Имитационное моделирование" (ИМ)- это двойной термин. "Имитация" и "моделирование" - это синонимы. Фактически все области науки и техники являются моделями реальных процессов. Чтобы отличить математические модели друг от друга, исследователи стали давать им дополнительные названия. Термин "имитационное моделирование" означает, что мы имеем дело с такими математическими моделями, с помощью которых нельзя заранее вычислить или предсказать поведение системы, а для предсказания поведения системы необходим вычислительный эксперимент (имитация) на математической модели при заданных исходных данных.
Основное достоинство ИМ:
1. возможность описания поведения компонент (элементов) процессов или систем на высоком уровне детализации;
2. отсутствие ограничений между параметрами ИМ и состоянием внешней среды РПС;
3. возможность исследования динамики взаимодействия компонент во времени и пространстве параметров системы;
Эти достоинства обеспечивают имитационному методу широкое распространение.
Рекомендуется использовать имитационное моделирование в следующих случаях:
1. Если не существует законченной постановки задачи исследования и идет процесс познания объекта моделирования. Имитационная модель служит средством изучения явления.
2. Если аналитические методы имеются, но математические процессы сложны и трудоемки, и имитационное моделирование дает более простой способ решения задачи.
3. Когда кроме оценки влияния параметров (переменных) процесса или системы желательно осуществить наблюдение за поведением компонент (элементов) процесса или системы (ПС) в течение определенного периода.
4. Когда имитационное моделирование оказывается единственным способом исследования сложной системы из-за невозможности наблюдения явлений в реальных условиях (реакции термоядерного синтеза, исследования космического пространства).
5. Когда необходимо контролировать протекание процессов или поведение систем путем замедления или ускорения явлений в ходе имитации.
6. При подготовке специалистов для новой техники, когда на имитационных моделях обеспечивается возможность приобретения навыков в эксплуатации новой техники.
7. Когда изучаются новые ситуации в РПС. В этом случае имитация служит для проверки новых стратегий и правил проведения натурных экспериментов.
8. Когда особое значение имеет последовательность событий в проектируемых ПС и модель используется для предсказания узких мест в функционировании РПС.
Однако ИМ наряду с достоинствами имеет и недостатки:
1. Разработка хорошей ИМ часто обходится дороже создания аналитической модели и требует больших временных затрат.
2. Может оказаться, что ИМ неточна (что бывает часто), и мы не в состоянии измерить степень этой неточности.
3. Зачастую исследователи обращаются к ИМ, не представляя тех трудностей , с которыми они встретятся и совершают при этом ряд ошибок методологического характера.
И тем не менее ИМ является одним из наиболее широко используемых методов при решении задач синтеза и анализа сложных процессов и систем.
Одним из видов имитационного моделирования является статистическое имитационное моделирование, позволяющее воспроизводить на ЭВМ функционирование сложных случайных процессов.
При исследовании сложных систем, подверженных случайным возмущениям используются вероятностные аналитические модели и вероятностные имитационные модели.
В вероятностных аналитических моделях влияние случайных факторов учитывается с помощью задания вероятностных характеристик случайных процессов (законы распределения вероятностей, спектральные плотности или корреляционные функции). При этом построение вероятностных аналитических моделей представляет собой сложную вычислительную задачу. Поэтому вероятностное аналитическое моделирование используют для изучения сравнительно простых систем.
Подмечено, что введение случайных возмущений в имитационные модели не вносит принципиальных усложнений, поэтому исследование сложных случайных процессов проводится в настоящее время, как правило, на имитационных моделях.
В вероятностном имитационном моделировании оперируют не с характеристиками случайных процессов, а с конкретными случайными числовыми значениями параметров ПС. При этом результаты, полученные при воспроизведении на имитационной модели рассматриваемого процесса, являются случайными реализациями. Поэтому для нахождения объективных и устойчивых характеристик процесса требуется его многократное воспроизведение, с последующей статистической обработкой полученных данных. Именно поэтому исследование сложных процессов и систем, подверженных случайным возмущениям, с помощью имитационного моделирования принято называть статистическим моделированием.
Статистическая модель случайного процесса - это алгоритм, с помощью которого имитируют работу сложной системы, подверженной случайным возмущениям; имитируют взаимодействие элементов системы, носящих вероятностный характер.
При реализации на ЭВМ статистического имитационного моделирования возникает задача получения на ЭВМ случайных числовых последовательностей с заданными вероятностными характеристиками. Численный метод, решающий задачу генерирования последовательности случайных чисел с заданными законами распределения, получил название "метод статистических испытаний" или "метод Монте-Карло".
Так как метод Монте-Карло кроме статистического моделирования имеет приложение к ряду численных методов (взятие интегралов, решение уравнений), то целесообразно иметь различные термины.
Итак, статистическое моделирование - это способ изучения сложных процессов и систем, подверженных случайным возмущениям, с помощью имитационных моделей.
Метод Монте-Карло - это численный метод, моделирующий на ЭВМ псевдослучайные числовые последовательности с заданными вероятностными характеристиками.
Методика статистического моделирования состоит из следующих этапов:
1. Моделирование на ЭВМ псевдослучайных последовательностей с заданной корреляцией и законом распределения вероятностей (метод Монте-Карло), имитирующих на ЭВМ случайные значения параметров при каждом испытании;
2. Преобразование полученных числовых последовательностей на имитационных математических моделях.
3. Статистическая обработка результатов моделирования.
Обобщенный алгоритм метода статистических испытаний представлен на рис. 5.1.
Рис.2.7.1. Обобщенный алгоритм метода статистических испытаний
ТЕМА 3. МАТЕМАТИЧЕСКИЕ МОДЕЛИ В СИСТЕМЕ МОНИТОРИНГА РЫБОЛОВСТВА
Лекция 3.1. Назначение и основные задачи ОСМ
Основной целью функционирования отраслевой геоинформационной системы мониторинга рыболовства (ОСМ) является обеспечение эффективного государственного управления использованием водных биоресурсов в интересах обеспечения экономической безопасности Российской Федерации, рационального использования, изучения и сохранения рыбных запасов.
Географическими районами действия ОСМ являются внутренние морские воды, территориальное море, континентальный шельф, исключительная экономическая зона Российской Федерации, Каспийское и Азовское моря, морские акватории, находящиеся за пределами юрисдикции Российской Федерации. Объектами контроля являются российские суда на морских акваториях и иностранные суда в исключительной экономической зоне Российской Федерации (ИЭЗ РФ).
ОСМ предназначена для мониторинга использования водных биоресурсов на основе непрерывного наблюдения и контроля за деятельностью промысловых судов. Решение данной задачи обеспечивается путем наблюдения за местоположением и промысловой деятельностью судов и получения на этой основе косвенных показателей состояния водных биоресурсов: вылов на усилие и площади промысловых скоплений. Эти показатели позволяют оперативно отслеживать освоение квот вылова, интенсивность промысла и его влияние на состояние рыбных запасов.
Основными целями создания ОСМ является обеспечение:
• наблюдения и контроля промысловой деятельности российских и иностранных промысловых судов для предотвращения ущерба Российской Федерации от незаконного промысла биоресурсов;
• информационной поддержки комплекса задач по безопасности мореплавания, возложенных на Федеральное агентство по рыболовству, в рамках его компетенции по международным обязательствам Российской Федерации;
• косвенной оценки запасов водных биоресурсов, оперативное усвоение и использование полученных результатов на основе применения космических средств связи и позиционирования, а также новых измерительных информационных технологий;
• информационного взаимодействия отраслевых органов государственного управления с другими ведомствами на федеральном и региональном уровнях.
ОСМ разработана как комплексная информационная система, предусматривающая слияние с информационной системой «Рыболовство», введенной с 1993 г., а также интеграцию с другими информационными системами в целях обеспечения информационного взаимодействия между подразделениями Росрыболовства и другими ведомствами на федеральном и региональном уровнях. Она построена на принципах преемственности и естественного развития существующих информационных систем рыбного хозяйства с учетом новых национальных и международных правил и норм. Система создана путем вертикальной и горизонтальной интеграции этих систем в единую рыбопромысловую информационно-аналитическую систему при максимально возможном использовании существующих геоинформационных технологий и программно-технических решений.
При разработке ОСМ были учтены требования к контролю качества данных ОСМ, периодичности обновления сведений, порядку обмена выходными данными, архитектуре и структуре баз данных и другим критериям построения информационных систем. Программное обеспечение ОСМ учитывает неравномерность получения исходных данных с использованием таких методов и средств обработки, как накопление и хранение асинхронных (и периодически поступающих) данных, комплексная обработка, сопоставление и согласование однородных данных, полученных из различных источников. Формирование нормативно-справочных, учетно-отчетных объектно-ориентированных баз данных осуществляется на основе официальных документов, действующих форм отчетности, а также формализованных и неформализованных сообщений, поступающих от зарегистрированных в системе источников информации.
Средствами ОСМ обеспечивается информационная поддержка решения следующих взаимосвязанных задач:
• обеспечение безопасности мореплавания и предотвращение загрязнения окружающей среды;
• учет и анализ освоения квот водных биоресурсов;
• учет выданных судам разрешений на промысел и контроль соответствия результатов промысловой деятельности параметрам разрешений;
• анализ и оценка показателей промысловой деятельности флота.
С учетом изложенных задач ОСМ обеспечивает выполнение следующих функций:
• круглосуточный автоматизированный ввод и обработка данных спутникового позиционирования и промыслово-производственной деятельности судов в море, полученных по радио- и спутниковым каналам связи (Inmarsat-C/GPS и Argos);
• возможность изменения интервала регулярной передачи данных о позициях судна;
• возможность запроса и получения данных о текущих позициях судов;
• распознавание и усвоение различных стандартов и форматов принимаемых данных;
• автоматизированное распределение информации с передачей ее пользователям;
• организация санкционированного доступа пользователей к базам данных ОСМ;
• отображение дислокации судов на электронной карте;
• использование современного картографического интерфейса;
• вывод обобщенной или выборочной информации о текущем состоянии процесса позиционирования судов;
• обмен данными в рамках отраслевых задач, международных проектов и программ.
Единое информационное пространство системы базируется на комплексном подходе к методам и средствам сбора информации, совместной обработке и анализе разнородных данных, получаемых:
• от спутниковых средств или радиолокационных средств позиционирования судов;
• в виде формализованной промысловой отчетности (судовые суточные донесения, оперативные и статистические отчеты предприятий и др.);
• в виде неформализованной промысловой информации (ОДУ, квоты, доли, разрешения на промысел и др.).
Единое информационное пространство:
• формируется за счет использования баз данных и программного обеспечения ОСМ путем создания единой технологии телекоммуникационного обмена информацией между КЦСМ и пользователями системы на базе нормативно-правовых решений, регламентирующих их функционирование;
• открыто для расширения перечня пользователей и набора предлагаемых им услуг;
• обеспечивает всем пользователям санкционированный доступ к информации при условии соблюдения требований системной дисциплины использования единого информационного ресурса.
Программное обеспечение системы мониторинга учитывает неравномерность получения исходных данных с использованием таких методов и средств обработки, как комплексная обработка, сопоставление и согласование разнородных данных, полученных из различных источников, накопление и хранение асинхронных и периодически поступающих данных.
Реализация современных геоинформационных технологий системы основана на программном продукте, обеспечивающем обработку и визуализацию мониторинговых данных и решение прикладных аналитических задач с использованием электронной картографии.
Основу обеспечения функционирования ОСМ составляет решение следующих основных задач:
1. Регистрация судов и судовладельцев в ОСМ.
2. Регистрация технических средств контроля (ТСК), тестирование и выдача актов соответствия ТСК требованиям системы мониторинга.
3. Сбор, обработка и хранение информации спутникового позиционирования и промысловой отчетности, формирование базы данных ОСМ, а также доставка данных пользователям по телекоммуникационной сети системы.
4. Анализ и контроль качества данных спутникового позиционирования и промысловой отчетности, работоспособности ТСК. Информирование органов рыбоохраны о нарушениях мониторинга и промысловой отчетности в соответствии с приказом Госкомрыболовства России от 14 октября 2001 г. № 361.
5. Обработка запросов региональных подразделений Росрыболовства, заинтересованных ведомств и других организаций – пользователей ОСМ и подготовка информационных материалов, в том числе для расследования, профилактики и предотвращения противоправных действий при рыболовстве.
Элементами структуры информационной системы мониторинга рыболовства являются узлы поставки информации, узлы сбора и обработки информации (коммутационные узлы) и пользовательские узлы.
Узлы поставки информации обеспечивают подготовку и ввод в ОСМ совокупности показателей, закрепленных за данным узлом, а также их транспортировку на узел коммутации сообщений. В настоящее время основными узлами поставки информации являются: Росрыболовство, региональные рыбохозяйственные советы, территориальные управления Росрыболовства, сырьевые институты, администрации морских портов, рыбопромышленные предприятия, суда персонального учета, региональные структуры иных федеральных органов, осуществляющих контроль за использованием морских биоресурсов (рис.3.1.1).
рис.3.1.1. Узлы поставки информации
Коммутационные узлы, располагаемые в региональных информационных центрах, обеспечивают сбор и обработку сообщений от узлов поставки информации, находящихся в пределах региона, обобщение информации, предоставление доступа пользователям ОСМ к региональному и общему информационному ресурсу. Пользовательские узлы ОСМ обеспечивают доступ физическим лицам к единому информационному ресурсу. Для организаций такие узлы представляют собой локальную компьютерную сеть, связанную с коммутационным узлом. Как правило, узлы поставки информации являются и пользовательскими узлами.
В настоящее время основные пользовательские узлы располагаются в Росрыболовстве, его территориальных управлениях, сырьевых институтах, их филиалах и отделениях, администрациях морских рыбных портов, в других региональных структурах федеральных органов, осуществляющих контроль за использованием морских биоресурсов.
Лекция 3.2. Схема мониторинга в ОСМ
Стандартная схема мониторинга выглядит следующим образом:
1. На всех судах, включенных в систему мониторинга, устанавливаются технические средства контроля (ТСК) – станции связи Inmarsat-C/GPS или трансмиттеры Аргос.
2. ТСК, используя сигналы навигационных спутников, определяют координаты судна и направляют их через спутник на берег в центр мониторинга.
3. На судне готовится суточная промысловая отчетность и также через спутниковую связь отправляется в центр мониторинга. Отличие от спутниковых позиций в том, что координаты формируются без вмешательства экипажа судна, а при подготовке суточного отчета могут быть внесены умышленные или неумышленные субъективные искажения.
4. Центр мониторинга обрабатывает все поступившую информацию, анализирует её полноту, достоверность, согласованность с данными других источников и результаты направляет пользователям на информационные узлы либо отдельным пользователям.
5. По результатам контроля качества информации или несоответствия действий судна правилам рыболовства и ограничениям на промысел выдаются управляющие решения о дополнительных проверках, остановке промысла, наложении штрафа и других санкциях.
6. Управляющая информация спутниковыми или другими средствами связи передается на патрульное рыбоохранное судно или самолет, которые, взаимодействуя между собой, планируют и осуществляют рыбоохранные мероприятия.
Наиболее перспективной в настоящее время является схема мониторинга реализованная на спутниковой системе АРГОС.
Система АРГОС – система сбора метеорологической и океанографической информации и определения координат движущихся объектов, на которые устанавливаются соответствующие спутниковые радиомаяки (трансмиттеры). Система функционирует с 1978 г. и базируется на спутниках серии NОАА (Национальное управление по исследованию океана и атмосферы, США) и дополняющих друг друга глобальных и региональных наземных центрах приема и обработки данных. Глобальные центры этой системы находятся во Франции, США и Австралии. На сегодняшний день в систему включены шесть низкоорбитальных спутников (два спутника типа АРГОС I и четыре спутника типа АРГОС II).
На каждое регистрируемое в геоинформационной рыбопромысловой системе судно устанавливается трансмиттер АРГОС, который имеет свой уникальный идентификационный номер. Центр мониторинга получает заявки на включение судов в систему мониторинга, содержащие сведения о судне и идентификационном номере трансмиттера АРГОС. Эти сведения заносятся в базу данных и используются в дальнейшем для идентификации судна, на котором находится трансмиттер. На основе имеющихся регистрационных сведений поступающие координаты идентифицируются и записываются в базу данных.
Трансмиттер АРГОС каждые 120–140 секунд излучает сигнал, содержащий навигационную и служебную информацию. В момент пролета над судном спутник принимает сигнал, проводит идентификацию трансмиттера, фиксирует время начало приема сообщения и измеряет доплеровский сдвиг принимаемого сигнала. Этот сдвиг используется для определения местонахождения трансмиттера. Поступившие на спутник данные накапливаются запоминающим устройством спутника. Если в момент приема сигнала от трансмиттера в зоне действия спутника находится региональный центр системы АРГОС, то отраженный спутником сигнал поступает в этот центр. Если в момент приема сигнала от трансмиттера в зоне действия спутника нет региональных центров, то при входе спутника в зону радиовидимости любого из глобальных центров системы АРГОС на него поступают все накопленные данные. Затем по наземным каналам данные передаются в соответствующий центр мониторинга. Сбор и обработка данных позиционирования промысловых судов производится по схеме, приведенной на рис.3.2.1.
Вычисление координат трансмиттеров (и, как следствие, судов), производится в глобальных или региональных наземных центрах. Координаты рассчитываются на основе сферических координат спутника в момент приема сигнала и доплеровского сдвига несущей частоты навигационного сигнала, обусловленного относительным перемещением спутника (приемника) и трансмиттера (передатчика). По принципу доплеровского сдвига работают трансмиттеры модели MAR E2. Точность определения места по доплеровскому сдвигу составляет от 150 м до 2 км. На доведение информации до центра мониторинга уходит в среднем от 20 минут до 1 часа после пролета спутника над судном.
Для повышения частоты и точности обсервации на более совершенные модели трансмиттеров АРГОС, например, MAR GE или FVT, дополнительно устанавливаются GPS-приемники. Это позволяет постоянно снимать координаты местонахождения судна с высокой точностью (до 100 м), накапливать их, а затем, в момент пролета спутника, передавать на него всю последовательность координат, зафиксированных между двумя сеансами связи.
Рис.3.2.1. Сбор данных спутникового позиционирования по системе АРГОС
В системе АРГОС через трансмиттер можно в одном направлении с судна на берег посылать короткие сообщения, которые вводятся экипажем судна в компьютер, а затем передаются в эфир. Таким образом, она совмещает навигационные и частично телекоммуникационные функции.
Достоинствами системы АРГОС является то, что она обеспечивает охват практически всей территории Земли при решении задачи определения местонахождения судна или приема данных с судна. Кроме того, поскольку процесс позиционирования судна дублируется GPS – технологией и доплеровским сдвигом, фальсифицировать его результат практически невозможно. Это особенно актуально для борьбы с браконьерством.
Система АРГОС включена в российскую систему мониторинга промысловых судов, поскольку она обеспечивает независимое от действий экипажа позиционирование в любой точке Земли. Результаты позиционирования, полученные по данным этой системы, являются надежным сэмплером для оценки координат, поданных в ССД экипажем.
Лекция 3.3. Оптимизация обработки входной информации ОСМ
ОСМ объединяет в своем составе комплекс программно-аппаратных средств решения прикладных и системных задач в области контроля деятельности промысловых судов в море и обеспечения данными спутникового мониторинга пользователей информационных узлов.
Автоматизированная обработка потока данных большого объема в реальном масштабе времени, когда непрерывно поступают разнородные сведения более чем от 2500 судов, проверка их достоверности, хранение и анализ предъявляют особые требования к надежности работы программных средств. В процессе построения информационной системы необходимо решить целый комплекс задач, связанный не только с обработкой больших объемов информации, но также изучить вопросы использования существующих каналов связи для их получения, распространения, вопросы управления техническими средствами контроля, установленными на объектах мониторинга, вопросы надежности и устойчивости работы системы в целом.
Программные средства ОСМ решают следующие задачи:
• круглосуточный автоматизированный ввод и обработка данных о позициях и промысловой деятельности судов в море, полученных по радио и спутниковым каналам связи;
• удаленное управление работой технических средств контроля (ТСК), установленных на объектах мониторинга;
• распознавание и усвоение различных стандартов и форматов принимаемых данных;
• контроль достоверности данных;
• автоматизированное распределение информации с передачей ее пользователям системы;
• организация санкционированного удаленного доступа пользователей к базе данных.
Эти задачи предъявляют высокие требования не только к программно-техническим средствам, но и выбору такой модели передачи данных между программными процессами и информационными узлами, которая исключала бы возможность искажения или потери информации.
В общем случае, программно-техническая платформа отраслевой системы мониторинга рыболовства представляет собой совокупность средств и систем, состоящую из серверов, рабочих станций, средств телекоммуникаций, программного обеспечения, способную осуществлять процесс приема, обработки и передачи разнородных данных в реальном масштабе времени. Данными в системе мониторинга рыболовства являются позиции промысловых судов, судовые суточные донесения, оперативные и статистические отчеты предприятий, сведения об изменениях справочников системы и др. Особенность входного потока состоит в том, что данные, поступающие от разных источников, имеют специфичный формат и содержание.
Процесс обработки данных включает в себя первичную обработку, в процессе которой выполняется преобразование формата исходных данных во внутренний формат информационной системы, комплексный анализ, выполняющий синтаксический и семантических разбор данных и подготовку аналитического материала, ввода потока в базу данных и его рассылку другим пользователям. Общая схема потоков данных и процессов их обработки в отраслевой системе мониторинга рыболовства представлена на рис.3.3.1.
Основными источниками данных о позициях судов являются береговые земные станции (БЗС) системы «Инмарсат» и центр обработки «Аргос», расположенный в г. Тулуза (Франция). Судовые суточные донесения (ССД) поступают в Центр мониторинга непосредственно от промысловых судов через радиоцентры и другие виды связи.
Входные информационные потоки в ОСМ имеют различную интенсивность. Ввиду их неравномерности, причиной которой могут быть как внешние, так и внутренние факторы, на входе процессов обработки могут образовываться очереди. Внешним фактором может быть отсутствие канала связи, выход из строя оборудования, когда данные накапливаются на передающем сервере, а после восстановления канала лавинным потоком попадают на вход системы. Внутренним фактором - фатальный сбой программы обработки, ограничение в предоставлении процессорного времени при порождении на сервере большого количества других процессов. Анализ и моделирование очередей позволяет оценить эффективность информационной модели, рассчитать время восстановления работоспособности после сбоя, определить критические характеристики функционирования системы, а также установить оптимальную интенсивность входного информационного потока путем удаленного управления ТСК.
Рис.3.3.1. Общая схема обработки потока данных в ОСМ
В обычных условиях эксплуатации системы входной информационный поток можно считать равномерным. Тогда, вероятность поступления k записей за период времени t может быть рассчитана по формуле Пуассона:
P(k) = (t)k e-t/k!, (3.3.1)
где t - промежуток времени,
- интенсивность потока (количество записей в единицу времени),
k - количество записей.
Вероятность поступления хотя бы одной записи за период времени равным единице может быть рассчитан как:
P(k>0) = 1 – P(0) (3.3.2)
Если -это производительность обрабатывающей системы, то условием стационарности потока в обрабатывающей системе будет < [33]. А вероятность, что в системе находится n записей, можно найти по формуле:
Рn = (1-)n (3.3.3)
где , n – количество записей.
Другие операционные характеристики системы обработки входного информационного потока, позволяющие оценить ее производительность, рассчитываются по формулам [2]:
Ls = (3.3.4)
где Ls – среднее число записей, находящихся в информационной системе
Ws = Ls/ (3.3.5)
где Ws – средняя продолжительность пребывания записи в системе
Lq = (3.3.6)
где Lq – среднее число записей, находящихся в очереди
Wq = Lq/ (3.3.7)
где Wq – средняя продолжительность пребывания записи в очереди.
При остановке процесса обработки данных в результате сбоя или по другой причине на входе процесса будет образовываться очередь, размер которой прямо пропорционален средней интенсивности соответствующего входного потока и времени пребывания процесса в состоянии сбоя. Количество сообщений, поступивших за период времени сбоя t0, можно оценить как t0. Учитывая, что каждое сообщение из очереди после восстановления работоспособности процесса будет обработано за время 1/, время обработки всей очереди составит:
t1 = t0/ = t0 (3.3.8)
Следует иметь ввиду, что в процессе обработки очереди сообщений, интенсивность входного потока не изменяется и на вход программ будут непрерывно поступать новые информационные пакеты. Образуется новая очередь. Время обработки второй образовавшейся очереди составит t2 = t1.
Такой цикл в обобщенном смысле может продолжаться до бесконечности, тогда время обработки очереди на n-том цикле будет:
tn = tn-1 (3.3.9)
А общее время восстановления стационарного режима работы системы можно определяться как:
T = , (3.3.10)
где n – номер цикла обработки
tn - время обработки очереди на n-том цикле.
Учитывая (3.3.10), можно получить:
T = = == (3.3.11)
При условии стационарности потока в обрабатывающей системе, когда < 1, ряд сходится.
Тогда конечная формула для расчета времени восстановления стационарного режима работы:
, (3.3.12)
где t0 – период времени состояния сбоя.
Как видно из (3.3.12), соотношение интенсивности входного информационного потока и скорости его обработки не должно превышать 1, в противном случае, система не сможет восстановить стационарный режим работы, а очередь на ее входе будет непрерывно возрастать.
Процесс обработки данных в отраслевой системы мониторинга рыболовства простроен по принципу потока, в котором источник сообщения посылает данные на вход процесса обработки, а получатель сообщения видит на выходе результат преобразования данных. Причем, цепочка «источник-получатель» может строиться в несколько этапов.
Первоначально в программном комплексе ОСМ была реализована однопоточная схема обработки данных (рис. 3.3.2).
Все информационные потоки, объединяясь, попадали на вход программы, которая выполняла весь комплекс задач по первичной обработке, анализу, преобразованию данных, формированию таблиц базы данных и рассылке другим пользователям. Ввиду того, что алгоритм обработки данных достаточно сложный и требует большого количества процессорного времени, производительность программы была низкой, но, в то же время, достаточной для работы в стационарных условиях. Однако, в сбойных ситуациях, которые могли возникнуть при аварии канала связи или остановке программного процесса, устойчивость и равномерность обработки данных в системе значительно снижалась из-за образования одной общей очереди сообщений.
рис.3.3.2. Общая схема входного потока ОСМ
Операционные характеристики производительности работы процесса обработки данных представлены в табл. 3.3.1.
Таблица 3.3.1.
Операционные характеристики программы обработки данных ОСМ
- эффективная производительность системы, рассчитанная с учетом того, что программа после каждого цикла обработки входных данных, выполняет дополнительные операции, связанные с сортировкой больших объемов данных, поиском и т.п.
Время восстановления стационарного режима работы системы после сбоя, рассчитанное по формуле (3.3.12), представлено в табл.3.3.2.
Таблица 3.3.2.
Период восстановления стационарного режима работы программы
Задержка в поступлении данных на период 8 часов или 3 суток представляется вполне реальной из-за возможных сбоев работы систем связи и др. Из табл. 3.3.2 видно, что после сбоя системы более 1/3 времени работы программы уходит на обработку образовавшейся очереди. Это вызывает значительную задержку в обновлении базы данных и не может обеспечить устойчивую обработку и рассылку потока данных в реальном масштабе времени.
Теоретически, повысить производительность программы можно путем распределения обработки входных потоков между различными процессами и серверами. Однако это достаточно сложная и трудоемкая задача, на которую требуются значительные временные и финансовые затраты. При этом настоящие затраты будут оправданы, если распределенная система окажется более надежнее и производительнее однопоточной.
Лекция 3.4. Обоснование выбора модели обработки данных
В лекции излагаются результаты исследования, целью которого является построение модели распределенной системы обработки входных данных ОСМ и методов и численных алгоритмов оценки эффективности системы обработки на её основе.
Необходимость такого исследования была обусловлена темпами развития системы мониторинга и увеличения объектов информатизации. Так как увеличивается объем приходящей в систему информации, существующий программно-технический комплекс (ПТК), обеспечивающий работу ОСМ, вынужден обрабатывать все большее количество информации. Вскоре, по мере дальнейшего развития ПТК ОСМ перестанет удовлетворять информационным потребностям пользователя, что приведет к острой необходимости модификации системы как на программном, так и на техническом уровнях. При этом, для достижения наилучших как экономических, так и рабочих показателей эффективности информационной системы, необходимо предварительно оценить возможность модификации существующей ОСМ, что возможно реализовать посредствам моделирования планируемой модификации системы и сравнения показателей эффективности реальной системы и предложенных моделей, а также выбрать наиболее удачную модель системы. Только после этого возможно оценить экономический эффект модификации системы и уровень удовлетворения информационных потребностей пользователя.
В задачи разработки модели входит:
• сравнение альтернативных классов моделей;
• нахождение наилучших моделей в классе;
• проверка адекватности.
С использованием построенной модели решаются следующие задачи:
• расчет параметров производительности системы обработки входных данных, сравнение показателей моделирования и фактических данных функционирования ОСМ;
• оценка - времени восстановления работоспособности системы после - времени простоя при заданных параметрах системы;
• подбор параметров производительности системы обработки входных данных для обеспечения наперед заданного времени обработки скопившейся очереди входных сообщений;
• сравнение различных способов организации обработки входных данных с целью повышения эффективности и надежности работы системы;
• оценка возможностей системы при изменении характеристик технического обеспечения;
• оценка эффективности распараллеливания процесса обработки входного потока сообщений и разбиения процессов обработки на фазы;
• сравнительный анализ эффективности функционирования для разных вариантов конечной реализации системы при различных способах организации обработки данных, вариациях параметров входного потока и параметров технического обеспечения.
Способ организации обработки информации, основанный на принципах распределения информационных потоков между несколькими узлами обработки информации, уже успел зарекомендовать себя как мощный инструмент для построения надежных и эффективных информационных систем. Подобный способ организации обработки информации подразумевает распараллеливание информационных потоков и их распределение между узлами обработки. Системы, построенные на идеи распараллеливания информационных потоков, имеют потенциально большие возможности по скорости, надежности и, соответственно, эффективности обработки информации, в сравнении с системами нераспределенной обработкой информации. Особенно заметными данные преимущества становятся в случаях обработки больших объемов разнородной информации.
Исходя из того, что в ОСМ входящий поток информации не является однородным, а суточные распределения приходящих данных не являются равномерными, описать процесс обработки ОСМ с помощью аналитического аппарата теории массового обслуживания, обычно применяемого для подобного класса задач, не представляется возможным. С учетом малой полезности формализации законов суточных распределений входящих сообщений в виде аналитических формул, было принято решение произвести имитационное моделирование системы обработки входных данных ОСМ и ее возможных модификаций с использованием инструмента имитационного моделирования SimulinkMatLab.
Имитационная модель, в конечной ее декомпозиции (на элементы), построена на элементарных математических и логических звеньях. Все процессы суточного поступления в систему сообщений формализованы, с помощью аппарата математической статистики, в виде динамически изменяющихся графиков, т.е. стохастическая составляющая модели присутствует только во входной и выходной информации. Такой подход позволяет построить очень точную и очень устойчивую, а также достаточно простую модель системы, что также говорит и о потенциальной надежности модели.
Однозначно определенное представление в модели (с точки зрения взаимосвязей элементов внутри каждого функционального блока модели и внешних связей между всеми функциональными блоками модели) процесса обработки входной информации позволяет произвести приведение неоднородных потоков к единому эталону и рассчитать конечное число обработанных сообщений системой без каких-либо потерь. Иными словами, данный подход обеспечивает гарантированную точность модели при одних и тех же значения исходных параметров, что было подтверждено проведенными испытаниями модели на тестовых наборах данных. Учитывая, что в результате приведения к одному виду информационных потоков, в системе появляются не целочисленные составляющие, гарантированная точность модели является большим ее плюсом (следует отметить, что в данном случае модель, построенная на аппарате ТМО, не может произвести столь точных расчетов, по причине отсутствия в ТМО понятия нецелой заявки). Возможность приведения сообщений к единому эталону без потерь в точности расчетов, позволило с легкостью моделировать процессы обработки на разных временных масштабах n:1, где n – количество минут работы реальной системы в одном шаге имитационной модели. Последнее позволило существенно увеличить скорость воспроизведения моделью одного дневного цикла моделирования.
Для сравнения приведем следующие расчеты.
Предварительно обозначим, что моделирование в масштабе 1:1/60 лишено практической пользы, ввиду предполагаемых больших временных интервалов рассмотрения работы системы. Минимальным интервалом рассмотрения является минута. Если необходимо рассматривать работу системы в течение суток, модели понадобится 1 440 шагов (в масштабе по секундам это значение бы составило 86400 шагов, т.е. было бы в 60 раз больше) на имитацию. Время, затраченное на моделирование одних суток в масштабе 1:1 (при не полностью разгруженной ОП ЭВМ) в среднем составляет секунды. Это значение является удовлетворительным и при моделировании в данном масштабе 10 суток. Соответственно, при переходе к большему масштабу, например к масштабу 1:10 за приблизительно тоже самое время , возможно произвести моделирование уже 10 суток. Таким образом, возможностей модели достаточно для проведения необходимых экспериментов.
В качестве параметров модели системы обработки сообщений были выбраны значения времен обработки приходящих в систему сообщений , где – время обработки одной записи типа «позиции», и – время обработки одного ССД. При этом полученные значения этих параметров с доверительной вероятностью укладываются в доверительные интервалы и, где и – математические ожидания времени обработки одной записи типа «позиции» и времени обработки одного ССД , соответственно.
В виду того, что процессы проверки и устранения ошибок как в реальной системе, так и в предполагаемой ее модификации, одни и те же, а параметры ЭВМ, производящей расчеты предполагаются одинаковыми в обоях случаях, в качестве критерия оценки эффективности работы модели выбрано время обработки, скопившейся на входе в систему очереди, критерии качества обработки по тем же причинам не рассматриваются. При этом оцениваются максимально возможное время ожидания обработки сообщения и среднее максимально возможное время ожидания обработки сообщения из поступившего на вход системы пакета сообщений при работе системы в некритических условиях.
Максимально возможное время ожидания в очереди на обработку за минуту составит , где – время обработки одного эталонного сообщения – входной параметр модели, отражающий производительность системы. Такой случай возможен при поступлении единовременно на вход системы сообщений. Зависимость максимального времени ожидания в очереди и максимального среднего времени ожидания в очереди от количества необработанных сообщений, с учетом масштаба 1:1, можно наглядно представить в виде таб.3.4.1.
Тогда явно прослеживается зависимость от , разложив которую в ряд Ньютона мы получим формулу (3.4.1) оценки максимального среднего времени ожидания в очереди:
(3.4.1)
Такое рассмотрение принято, во-первых, по причине лавино-образного поступления большого числа сообщений (в один и тот же момент поступает большое число скопившихся на коммуникационном сервере сообщений), во-вторых, такая оценка является наиболее значимой ввиду того, что показывает максимальные возможности системы при полной загрузке обрабатывающей ЭВМ. Удовлетворительные значения времени обработки в критических условиях, говорят об удовлетворительной работе всей системы при обычной загрузки обрабатывающей ЭВМ. При этом выступает в роли оценки критической ситуации, когда на вход системы после сбоя поступает большое число сообщений, а – в роли оценки среднего времени обработки в случае работы системы в некритических условиях.
Таблица 3.4.1.
Представление максимального и максимального среднего времени ожидания в очереди
в зависимости от количества необработанных сообщений
1
2
2
3
3
4
4
5
5
6
…
…
…
…
n
Проверка адекватности модели была произведена за счет моделирования поведения системы на 125 тестовых наборах данных, значения которых были взяты с реальной системы.
В качестве критерия адекватности модели были выбраны часовые и суточные значения приходящих в систему сообщений, а также значения времени обработки, скапливающихся на входе в систему очередей. В результате проверки модель была признана адекватной, так как при моделировании 125 суток работы системы максимальная погрешность моделирования составила 5,94%, а расхождения в плотностях вероятностей генерации приходящих в систему сообщений за сутки отличается незначительно (рис.3.4.1).
Рис.3.4.1. Графическое сравнение реальной и моделированной
плотностей распределения приходящих в систему сообщений
(на переднем плане моделированная плотность распределения)
Рис.3.4.2. Имитационная модель распределенной
системы обработки входных информационных потоков
На рис. 3.4.2 зеленым цветом отображены блоки, участвующие в формировании исходного сигнала, а также блоки, отображающие ключевые моменты в формировании сигнала; голубым цветом – блоки, отвечающие за производительность системы, а также блок, отображающий значение пропускной возможности системы в минуту; серым – блок, отвечающий за коэффициент приведения длинных сообщений (ССД) к коротким (позициям судов), а также блок, отображающий этот коэффициент; оранжевым – выходные сигналы: графики накопления сообщений в очереди и обработки сообщений. С помощью переключателей Switch возможно управлять потоками позиций судов, ССД и анализировать их обработку по отдельности.
Обработка данных распределена между несколькими системными процессами и осуществляется в общей сложности в два этапа:
• первичная обработка и комплексный анализ данных;
• ввод потока в базу данных.
На этапе первичной обработки выполняется декодирование данных, поступающих по различным каналам связи, выявляются грубые ошибки, связанные, как правило, с неправильной работой ТСК. Формат данных приводится к каноническому виду, единому для всей информационной системы в целом и пригодному для дальнейшей обработки. Процессы первичной обработки данных выполняются параллельно, независимо друг от друга и обеспечивают непрерывный поток данных даже при аварии одного или нескольких каналов связи. Программа комплексного анализа выполняет основной процесс обработки данных. Ею собираются воедино все входные информационные потоки, прошедшие этап первичной обработки и формируется выходной поток для его ввода в базу данных. В процессе обработки выявляются синтаксические и семантические ошибки, которые регистрируются в протоколе работы программы. Программа формирует ряд аналитических таблиц, отображающих количественные и качественные характеристики входного потока. На основании этих таблиц имеется возможность в реальном масштабе времени классифицировать входной поток по различным характеристикам, оперативно выявлять нарушения и принимать решения по изменениям режимов работы ТСК.
Программа ввода в базу данных выполняет дополнительный синтаксический контроль записей, полученных от программы комплексного анализа, проверяет соответствия ключевых значений полей входных записей справочникам базы данных и преобразует информационный поток в последовательность SQL-операторов для их выполнения сервером базы данных. Результатом работы программы являются заполненные и скорректированные таблицы базы данных ОСМ.
Обработка входного информационного потока обеспечивает живучесть системы при аварии одного или даже нескольких каналов связи. В этом случае будет обеспечен ввод данных от других источников, а кратковременное увеличение интенсивности потока после восстановления канала не окажет заметных влияний на производительность системы ввиду распределения вычислений между процессами первичной обработки данных и комплексным анализом данных. Центральное звено в системе обработки информационного потока занимает программа StreamCX. В процессе её работы осуществляется:
• обработка данных о позициях судов, поступающих от программ первичной обработки;
• обработка судовых суточных донесений;
• обновление и поддержка архивов позиций и ССД;
• создание аналитических таблиц в реальном масштабе времени.
Обработка данных включает в себя:
• контроль полученной информации на соответствие утвержденному формату;
• контроль достоверности данных;
• формирование пакета данных для их ввода в базу данных и для рассылки другим пользователям информационной системы;
• создание выходных документов, содержащих аналитические данные о функционировании системы мониторинга.
Высокая производительность работы программы достигнута тем, что обработка данных выполняется параллельными программными потоками, что позволяет в полной мере использовать возможности двухпроцессорного сервера и многозадачной операционной системы Windows 2000. Программа циклически проверяет входной каталог и, при поступлении новых сообщений, немедленно обрабатывает их. В процессе обработки выявляется практически 100% ошибок, связанных как с представлением данных (синтаксические ошибки), так и с нарушением смысла передаваемых сообщений (семантические ошибки). Последние, как правило, имеют место в ССД. Следует отметить, что выявление ошибок в данных о позициях судов, поступающих от ТСК, практически полностью автоматизировано, в то время как исправление ошибок ССД в большинстве случаев требует вмешательства со стороны диспетчера.
Необходимым условием перехода в стационарный режим работы после сбоя, является то, что производительность программ StreamCX и UpdateCX должна превышать суммарную производительность программ первичной обработки данных. А, учитывая тот факт, что программа StreamCX после каждого цикла обработки формирует ряд аналитических таблиц, на которые уходит 3/4 общего времени работы, ее производительность должна превышать производительность программ UpdateCX в 4-5 раз. Средняя интенсивность входных информационных потоков представлена в табл. 3.4.2.
Таблица 3.4.2.
Интенсивность входных информационных потоков ОСМ
Входной поток
Позиции Инмарсат
Позиции Аргос
ССД
(записей/сек.)
0.0410
0.0239
0.0802
Производительность процессов обработки данных представлена втабл. 3.4.3.
Таблица 3.4.3.
Производительность программ обработки данных
Операционные характеристики процессов обработки входного информационного потока представлены в табл. 3.4.4.
Таблица 3.4.4.
Операционные характеристики процессов обработки данных ОСМ
Ls
(записей)
Ws
(сек.)
Lq
(записей)
Wq
(сек.)
UnpInmarsatCX
0.0209
0.5105
0.0004
0.0105
UnpArgosCX
0.0245
1.0245
0.0006
0.0245
StreamCX
0.0094
0.0288
0.0001
0.0003
UpdateCX
0.0426
0.1303
0.0017
0.0053
На рис. 3.4.4 наглядно видно, что период восстановления стационарных режимов работы процессов, по сравнению с программой в однопоточной схеме, уменьшился в 8-10 раз.
Параметр,характеризующий степень загруженности системы обработки данных, много меньше 1 и показывает, что программные процессы отраслевой системы мониторинга рыболовства обладают достаточным запасом прочности. Данные представлены в табл. 3.4.5.
Таблица 3.4.5.
Степень загруженности процессов обработки данных ОСМ
UnpInmarsatCX
UnpArgosCX
StreamCX
UpdateCX
0.0390
0.0030
0.0090
0.0446
Параллельная обработка входного информационного потока обеспечивает живучесть системы при аварии одного или даже нескольких каналов связи. В этом случае будет обеспечен ввод данных от других источников, а кратковременное увеличение интенсивности потока после восстановления канала не окажет заметных влияний на производительность системы ввиду распределения вычислений между процессами первичной обработки данных и комплексным анализом данных.
Рис.3.4.3. График периодов восстановления стационарного
режима работы процессов ОСМ
В целом, отраслевая система мониторинга рыболовства благодаря разработанной гибкой системе обработки данных показала свою эффективность, устойчивость к сбоям и практически неограниченные возможности по обеспечению информацией пользователей.
Лекция 3.5. Динамико-стохастические модели ОСМ
Построение динамико-стохастических моделей среды
Создание динамико-стохастических моделей (ДСМ) предполагает объединение теоретических моделей и наблюдений, так как и те и другие содержат информацию относительно поставленных задач управления. Динамическая модель учитывает физические связи, наложенные на изменчивость характеристик исследуемых процессов, а стохастическая модель - неопределенности при их моделировании.
При построении ДСМ и использовании их в информационной системе, главной проблемой является выбор динамической модели. Форма записи функционального оператора в уравнениях динамики зависит от наличия и вида априорной информации, заключенной в физических и других законах. ДСМ рыбопромысловой системы включает модели динамики атмосферы и океана, популяции объектов промысла и промысловой деятельности судов. Содержание физических (и др.) закономерностей для подсистем и, соответственно для их моделей, различно и связано с отдельным их изучением.
Разработка моделей динамики океана, объектов промысла и промысловых судов и использование их в информационных системах имеет ряд специфических особенностей, так как такие модели описывают объекты разной природы: физической, биологической и др. Поэтому целесообразно рассмотреть отдельно подходы к построению моделей в зависимости от процесса моделирования и его масштаба.
Разработка ДСМ среды, позволяющих прослеживать изменчивость геофизических полей по наблюдениям, решает важные практические задачи контроля среды для целей прогноза погоды, оценки биологической продуктивности отдельных районов океана, загрязнения вод и т.д.
Особое значение приобретают вопросы усвоения данных в ДСМ изменчивости океана в связи с появлением океанологических искусственных спутников Земли. Разработка эффективных алгоритмов включения спутниковых измерений в подобные модели позволяет осуществлять оперативный контроль за синоптической изменчивостью океана на больших акваториях. Интерес к синоптической изменчивости океана обусловлен общим энергетическим балансом океанической среды. Известно, что основная энергия содержится в длинных волнах планетарного масштаба, бароклинных волнах и интенсивных вихревых образованиях. Этими явлениями определяется взаимодействие океана и атмосферы, столь важное в практических задачах народного хозяйства, в том числе промышленного рыболовства.
Для анализа и обобщения данных гидрофизических измерений в настоящее время используются как термогидродинамические модели полей океана, применяемые в теоретической океанологии, так и статистические методы обработки наблюдений.
Важным обстоятельством является факт, что эмпирическая и теоретическая информации взаимно дополняют друг друга. Это позволило сформулировать принципы системного исследования информационных гидрофизических систем на основе которых интенсивно развиваются теоретические аспекты динамико-стохастического моделирования. Особенностью динамико-стохастического подхода является учет флуктуационных составляющих полей океана не только в параметризованной форме, как это обычно происходит в моделях динамики океана, но также в явном виде за счет восстановления отдельных реализаций пульсационных компонент полей по данным наблюдений в реальном времени.
При исследовании синоптической изменчивости поступление данных в модель происходит на фоне роста дисперсии ошибок прогноза от нуля до некоторой величины, характеризующей предел предсказуемости. Для уменьшения роста дисперсии ошибок определяющее значение имеют два обстоятельства: выбор гидродинамической модели океана и разработка оптимальных статистических алгоритмов адаптации расчетных значений полей океана к наблюдениям. Таким образом, исследование синоптической изменчивости океана на основе динамико-стохастического подхода к анализу наблюдений потребовало разработки специальных ДСМ океана для слежения за эволюцией основных полей, характеризующих состояние океана. Вот почему построение ДСМ синоптической изменчивости океана основывается на совместном использовании результатов статистической гидромеханики, относящихся к выводу моментных уравнений турбулентности и результатов теории фильтрации в стохастических распределенных системах.
Моделирование динамики популяций объектов промысла
Практика интенсивного рыбного промысла в Мировом океане давно поставила перед наукой проблемы регулирования промысловых запасов рыб. В настоящее время широко используются различные математические методы и экономико-биологические модели, которые позволяют повысить точность оценки состояния и прогноза сырьевой базы.
Имеется чрезвычайно большое число отечественных и зарубежных публикаций по математическому моделированию биологии моря и оцениванию промысловых запасов в зависимости от отдельных групп факторов. Отечественная отраслевая наука на протяжении более двух десятков лет проводит исследования по применению математических методов и моделей для долго, средне и краткосрочного прогнозирования состояния и объема запасов различных видов биоресурсов. На первых этапах исследования по формированию математических моделей проводились на предпосылках независимости динамики популяций от факторов океанической среды.
Развитие аппарата статистического оценивания и возможность подбора наилучших моделей путем их многократной реализации на вычислительной технике позволяет проводить поиск функциональных зависимостей "вход-выход" на основе многофакторного регрессионного анализа в области оценки запасов биоресурсов.
В этом смысле определенную ценность для совершенствования моделей имеют также исследования, где приведен ряд частных моделей для определения зависимостей между параметрами среды, биопродуктивностью и запасами. К их числу следует отнести также биостатистические и аналитические модели Баранова, рекомендуемые к применению для оценки запасов интенсивно эксплуатируемых популяций. Однако эти модели дают относительно точные результаты для рыб с большим жизненным циклом и небольшими колебаниями пополнения и в настоящее время используются как оценочные - для выявления общей тенденции возможного улова и объема запаса при разных режимах промысла.
Один из методов, рассмотренный Ф.И.Барановым. сведен к одному входному параметру из нескольких исходных - возрастному составу когорты (поколения) рыб. Однако такая постановка в ряде случаев может ухудшить прогноз, так как возрастной состав определяется с меньшей точностью, чем, например, объем изъятия.
Существуют разработки, связанные с использованием уравнений регрессии и большим числом (до 23) значимых факторов окружающей среды. Среди исследуемых факторов, априори, влияющих на сырьевую базу, были приняты:
1) температура воды на стандартных горизонтах и ее градиенты;
2) параметры сезонного термоклина, его мощность и вертикальный градиент;
3) общая биомасса планктона;
4) биомасса зоопланктона и т.д.
В процессе определения функции отклика, в качестве которой был взят вылов на усилие, выявилось, что результат при обработке 23 факторов мало отличается от такового при обработке 9 значимых факторов, полученных в ходе их перебора. Среди таких значимых факторов - параметры термоклина и термическая структура на горизонтах в 30-50 м. Влияние планктона и температуры поверхностного слоя оказались незначительными.
Очевидно, что эти результаты, а также исследования и выводы по формированию значимых факторов внешней среды на состояние сырьевой базы с использованием стохастических зависимостей помогают сделать дальнейшие шаги по формированию математических моделей, адекватных оперативной промысловой обстановки.
Специфика рыбного промысла связана с подвижностью сырьевой базы и подвижным характером самих промысловых судов, что обусловливает сложность решения моделирования и управления. Поэтому рассмотрим один из наиболее простых подходов построения модели динамики объекта промысла. Предполагаем, что скорость изменения численности популяции пропорциональна ее численности и некоторой функции :
(3.5.1)
Можно привести некоторые общепринятые представления относительно функции . Модель Верхулста, при имеет решение:
,
(3.5.2)
где - постоянные коэффициенты. Это решение представляет собой известную логическую функцию и при .
Модель Гомпертца при имеет решение:
(3.5.3)
и при .
Можно записать стохастический вариант модели (3.5.1):
,
(3.5.4)
где - случайный процесс, описывающий влияние среды на популяцию: климат, пища, хищники, промысел.
Для модели Верхулста имеем:
(3.5.5)
или
(3.5.6)
Уравнение (3.5.6) запишем в конечно-разностном виде:
(3.5.7)
Для модели Гомпертца имеем следующий конечно-разностный аналог:
(3.5.8)
Дадим более обобщающее представление для шума в правой части:
,
(3.5.9)
где - тренд (например, соответствующий климату) - детерминированная функция, - белый шум с нулевым средним. Разделив формулу (3.5.4) на , продифференцировав по и подставив в формулу (3.5.9) получим:
(3.5.10)
Обобщенную конечно-разностную модель на основании формулы (3.5.10) с учетом формул (3.5.7-8) можно записать в виде:
(3.5.11)
где - неизвестные параметры, - детерминированная функция, - белый шум с нулевым средним.
Модель (3.5.11) принадлежит к классу наиболее простых авторегрессионных моделей и может усложняться в конкретных условиях.
Рассмотрим несколько моделей добычи рыбы и проведем оценку параметров этих моделей. В качестве данных моделируемого процесса использовался временной ряд уловов рыбным хозяйством СССР за период с 1958 по 1988 гг.
Первую модель сформулируем в следующем виде:
,
(3.5.12)
где - годовой улов рыбы и нерыбных объектов.
Вторую модель сформулируем в следующем виде:
(3.5.13)
Оценивание параметров моделей проводилось по методу, изложенному во втором разделе. В результате оценивания было получено следующее выражение для модели и :
Сравнивая модели из двух классов и можно сделать следующие выводы: несмотря на то, что анализируется довольно короткий временной ряд, коэффициенты в моделях и статистически значимы. Обе модели дают весьма близкие величины дисперсии ошибки прогноза на один шаг времени. Однако модель содержит на один коэффициент меньше. Сравнение двух классов моделей и по методу максимального правдоподобия позволяет сделать вывод о том, что модель более предпочтительна. Расширение классов моделей в окрестности классов и дают близкие результаты, но все же менее предпочтительные, чем .
Оба класса моделей дают результат в виде модификации логистической кривой. По той и другой модели добыча стабилизируется на уровне около 10 млн.т. Однако такая стабилизация добычи является постулатом при формулировке модели. На самом же деле при прогнозе вылова особый интерес представляет обнаружение тенденции к снижению или к повышению уловов.
Будем рассуждать следующим образом: главными факторами, определяющими объемы добычи рыбы, являются внутренняя динамика (воспроизводство сырьевых запасов), развитие средств и методов обнаружения промысловых скоплений и увеличение мощности промыслового оборудования. Несомненно, что два последних фактора сыграли весьма важную роль в увеличении добычи от 3508,7 тыс. т в 1960 г. до 10313,8 тыс. т в 1975 г. В этот период в рыбном хозяйстве шло монотонное увеличение количества промысловых судов, их мощности и технической оснащенности. Это позволяет достаточно обоснованно попытаться ввести в функцию уравнения (3.5.4) слагаемые, связанные с монотонным ростом добычи за счет вышеупомянутых факторов. В результате получим нестационарную модель, и поведение параметра при нестационарном слагаемом в правой части модели будет характеризовать тенденцию к повышению или к снижению добычи.
Для того чтобы убедиться в этом, проведем модельный численный эксперимент. Предположим, что динамика добычи промысловых объектов описывается моделью:
(3.5.14)
В соответствии с данной моделью моделировался временной ряд, содержащий 600 точек: =1.2, =0.004, =0.005, =0.3. Модель сформулирована таким образом, чтобы она описывала на начальном этапе освоения сырьевых ресурсов монотонный рост, близкий к логистической кривой, а в дальнейшем тенденцию к снижению уловов. Оценивание, проведенное по 600-там точкам, дает в результате коэффициенты, близкие к истинным:
Возникает вопрос, можно ли на коротком временном ряду (30 точек), вырезанном из всего временного ряда, получить модель, отражающую тенденцию к снижению добычи? Результат оценивания в этом случае позволяет дать утвердительный ответ:
Из расчетов видно, что коэффициенты данной модели далеки от истинных (имеют даже противоположный знак), однако модель хорошо описывает тенденцию к снижению добычи рыбы.
Теперь проведем оценку параметров этой же модели на основе фактических данных о добыче промысловых объектов за период 1958 г. по 1988 г. Модель, полученная в этом случае, выглядит следующим образом:
Как видим, коэффициент при нестандартном слагаемом больше нуля и, несмотря на то, что статистическая значимость этого коэффициента невелика, можно сделать предположение о тенденции небольшого увеличения объема добычи. Модель является более предпочтительной в сравнении с моделями и , так как имеет наименьшую дисперсию шума модели.
Моделирование промысловой деятельности судов
Проблема моделирования промыслового флота имеет специфику, которая заключается в сосредоточении основных производственных мощностей в судах промыслового флота, как подвижных средствах производства. Рассматривая промысловый флот как систему, необходимо выделить объекты этой системы, взаимодействие которых могут её охарактеризовать. В дальнейшем под объектом будем понимать отдельный структурный элемент системы. Каждый объект описывается набором параметров, которые определяют его свойства и состояние. Кроме того, существуют действия объектов, которые вызывают изменение значений параметров. Необходимо учесть, что различные типы событий в системе рассматриваются в разных масштабах времени, причем диапазон изменений масштабов временных шкал является важным показателем степени детализации модели.
В качестве объекта в системе промыслового флота целесообразно рассматривать судно. Судно является подвижным производством и осуществляет производственный цикл в зависимости от состояния среды (например, сырьевая база, метеообстановка).
Промысловые суда в своей деятельности базируются на среднесрочные и оперативные прогнозы возможного вылова того или иного объекта в соответствующих районах. На эти прогнозы существенное влияние оказывают гидрометеобиологическая обстановка и результаты промыслового изъятия. В каждый момент времени действия судна характеризуются основными показателями: координаты местонахождения, вылов, выпуск рыбопродукции, запасы и грузы на борту, рыбопродукция на борту. В качестве параметров могут выступать производные показатели: стоимость выпущенной рыбопродукции, прибыль и другие.
Будем предполагать, что система, представляющая собой промысловый флот, является стохастической системой с конечным числом состояний. Каждое состояние в моменты времени t=0,1,… принадлежит пространству состояний . Эволюция системы описывается уравнением динамики состояния:
(5.3.15)
где - совокупность наблюдений вектора до момента времени t-1 включительно; – управляющее воздействие, либо экзогенный фактор; – последовательность независимых одинаково распределенных величин; - детерминированная функция.
Особенность действия промыслового судна - ярко выраженная последовательность фаз: переход, поиск, промысел, производство, выгрузка в порту и др. Очевидно, что смена фаз зависит от параметров самого процесса. И даже при линейном операторе на каждой фазе процесса в целом для промыслового судна будем иметь нелинейную модель с характерной пороговой нелинейностью. Поэтому необходимо для каждой фазы подбирать наилучший класс моделей, а в каждом классе - наилучшую модель.
Переключение промыслового судна с одной фазы на другую описывается в виде арифметических и логических условий, либо, процедурой принятия решений в условиях расплывчатых целей и ограничений. Проблема моделирования деятельности промыслового судна осложняется еще и тем, что модель должна функционировать в реальном масштабе времени. Поэтому скоростные характеристики компьютера накладывают ограничения на число переменных, вводимых в модель.
Модель траектории движения судна. Траектория движения промыслового судна очень важная характеристика. В каждый дискретный момент времени траекторию можно описать набором точек , где - широта, - долгота местонахождения судна. Модель траектории должна быть построена таким образом, чтобы удовлетворять критерию минимума параметров, описывающих траекторию и удовлетворять заданной точности при воспроизведении требуемых параметров траектории. Такими параметрами могут быть: скорость движения судна, курс, время прохождения отрезка пути, расстояние от траектории до заданной точки или линии, точка местонахождения в заданный момент времени и др. Пусть истинная траектория судна аппроксимируется некоторой параметрической кривой:
(5.3.16)
Форма функций может быть выбрана в виде сплайнов или других наиболее часто употребляемых разложений.
Разобьем траекторию движения судна на -участков, k=1,2,…,K. Пусть на одном из участков имеем набор последовательных измерений координат судна , n=0,1,…,N; через равные промежутки времени.
Задача формулируется следующим образом: необходимо найти такое разбиение траектории движения судна на участков, чтобы на каждом отрезке траектории выполнялось неравенство:
(5.3.17)
где - расстояние между двумя точками, - максимально допустимое расстояние между истинной траекторией и её аппроксимацией. Дополнительно к условию (8.3) должно выполняться условие минимума:
(5.3.18)
если на каждом участке траектории применяется одна и та же модель аппроксимации (8.2), либо
(5.3.19)
если эти модели разные.
Пренебрегая сферичностью, рассмотрим задачу на плоскости , где имеем набор точек . Поставим задачу аппроксимации точек траектории прямой линией:
(5.3.20)
Соединяем отрезком прямой линии точку и точку . Выражение (5.3.20) примет вид:
(5.3.21)
Предполагаем, что на выделенном участке - судно движется равномерно. Прообразами точек , на отрезке (5.3.21) являются точки с координатами . Тогда, если расстояние от точки до соответствующей точки отрезка прямой (5.3.21) удовлетворяет условию для каждого :
(5.3.22)
то аппроксимацию можно считать удовлетворительной.
Можно предложить следующий алгоритм вычислений:
1. .
2. пробегает значения от 1 до . Если выполняется условие (8.8), т.е. все то увеличивается на единицу и повторяется пункт 2.
Процедура 2 продолжается до тех пор, пока не будет нарушено условие (5.3.22). Таким образом, модель траектории в виде отрезка кривой на участке траектории найдена. Вместо набора -точек (-параметров) имеем 2 точки: и , т.е. 4 параметра. Отрезок траектории представляется набором отрезков прямых, каждый из которых описывается 2-мя параметрами (точка конца предыдущего отрезка и точка начала последующего отрезка совпадают).
Соответствующая двухпараметрическая стохастическая модель может быть представлена в виде:
(5.3.23)
где - некоторый функционал от других составляющих вектора состояния (расход топлива), - коэффициенты модели, - последовательности белого шума.
Здесь приведена наиболее простая информационно-математическая модель траектории движения судна. Усложнение модели можно производить, используя данную модель как базовую, и минимизируя по сравнению с базовой моделью такие характеристики модели как число параметров, описывающих траекторию, и дисперсия шумов .
Модель суточной добычи. По каждой промысловой операции в соответствующий журнал заносятся следующие параметры:
1. время начала операции
2. время окончания операции
3. средняя глубина ведения операции лова
4. общий вылов
5. %-ное содержание 1-ого объекта лова
6. %-ное содержание 2-ого объекта лова
7. %-ное содержание 3-ого объекта лова
- промысловых операций за отчетные сутки. Параметры 4-7 являются приближенной визуальной оценкой, выполненной после поднятия улова на борт. Предварительная оценка улова -того объекта промысла по -той операции - .
После обработки улова путем взвешивания (или частичного взвешивания) определяется объем рыбной продукции, выпущенной за прошедшие сутки - -объект промысла, -вид рыбной продукции. Величина суточной добычи -того объекта промысла за сутки определяется с использованием коэффициентов расхода сырья .
,
(5.3.24)
где- количество сырца (объекта промысла) затраченное на выпуск одной единицы продукции вида .
Уточненный вылов -того объекта промысла по -той операции будет иметь вид:
(5.3.25)
Введем в рассмотрение параметр:
- среднесуточный вылов на 1 час работы орудием лова (например, на 1 час траления).
- средняя за сутки глубина выполнения промысловых операций.
Соответствующую стохастическую модель можно представить в виде:
(5.3.26)
где может иметь смысл среднего вылова на усилие по всем промысловым судам, работающим в данном районе.
Моделирование изменения запасов на борту. Изменение запасов на борту описывается уравнением:
,
(5.3.27)
где - -тый вид запасов (напр. дизельного топлива); - норматив расхода; - количество принятых на борт запасов.
Информационно-математическую модель судна можно дополнить другими параметрами состояния судна и использовать в разных аспектах технологии обработки и анализа информации, в том числе наиболее эффективно при контроле вновь поступившей входной информации, для целей прогноза, для иммитационных расчетов.
Ожидаемая невысокая эффективность применения модели промыслового судна для прогноза характеристик связана с ожидаемым небольшим пределом предсказуемости. Поэтому одной из задач прогнозирования является поиск и выделение структур с большим интервалом предсказуемости, т.е. устойчивых к прогнозу на большие интервалы времени. Поиск таких структур следует осуществлять, скорее всего, в направлении агрегированных показателей, снижающих взаимное влияние шумовых воздействий. Интуитивно ясно, что положительный результат поиска ожидается при исследовании линейных, либо слаболинейных систем. В качестве одного из агрегированных показателей работы судов промыслового флота можно брать суммарный суточный вылов судами отдельного бассейна.
Необходимо сделать ряд замечаний в отношении предположения стационарности. Во многих случаях рассматриваемые в экономике рыбного хозяйства процессы либо обладают свойством стационарности, либо гипотеза о стационарности приемлема даже тогда, когда процесс, строго говоря, нестационарен. Гипотеза о стационарности даже не может быть проверена экспериментально, поскольку по самому определению стационарного процесса для этого необходимо располагать ансамблем его реализаций.
В ряде случаев строгое понятие стационарности подменяют локальной ("внутренней") стационарностью, т.е. считают, что стохастические характеристики анализируемой реализации не меняются во времени в пределах интервала наблюдений. Такую гипотезу уже можно проверить, оценив статистические характеристики для разных отрезков временного ряда и сопоставив оценки с их выборочной изменчивостью. Несмотря на отсутствие математической строгости, такой подход оказывается вполне плодотворным и именно он лежит в основе большей части исследований.
Если принимать предложение стационарности, то необходимо затронуть проблему присутствия в характеристиках вылова, и д.р. периодических компонентов и трендов. В каких-то случаях наличие гармоник следует просто из физических соображений, (например, связанных с сезонностью динамики сырьевой базы, атмосферы).
СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ
Основная литература
1. Мониторинг рыболовства-2005: инструкции и рекомендации экипажам промысловых судов и судовладельцам / Кошкарева Л.А., Образцов Ф.А., Проценко И.Г. [и др.]; под общ. ред. д.т.н. Проценко. И.Г. – Петропавловск-Камчатский: Новая книга, 2005.
2. Исследование информационных моделей. Элективный курс: учебное пособие / Угринович Н.Д. – , 2004.
Дополнительная литература
1. Моделирование и формализация: методическое пособие / Бешенков С.А. – , 2002.
2. Информационные технологии моделирования процессов управления экономикой: учебное пособие / Гринберг А.С. – , 2003.
3. Информационное моделирование. Величины, объекты, алгоритмы / Суворова Н.И. – , 2002.
Ресурсы Интернета
1. Мониторинг камчатского краба / Красников И.В., Проценко И.Г., Резников В.Ю. – Петропавловск-Камчатский: Камчатпресс, 2005. [Электронный ресурс]. - Режим доступа: https://www.morkniga.ru/p832640.html
2. Построение динамических стохастических моделей по экспериментальным данным / Кашьяп Р.Л., Рао А.Р. - Пер. с англ.,- М.: Наука, 1983. [Электронный ресурс] - Режим доступа: http://scask.ru/i_book_dyn.php
3. Российское образование. Федеральный портал: [Электронный ресурс]. - Режим доступа: http://www.edu.ru
4. Судовая автоматическая идентификационная система / Маринич А.Н., Проценко И.Г., Резников В.Ю [и др.] ; под общ. ред. д.т.н., проф. Устинова Ю.М.. – СПб: Судостроение, 2003. [Электронный ресурс]. - Режим доступа: https://www.morkniga.ru/p238.html
5. Фильтр Калмана-Бьюси / Браммер К., Зиффлинг Г. - М.: Наука, 1982. [Электронный ресурс] - Режим доступа: https://www.twirpx.com/file/21556/
6. Фильтрация и стохастическое управление в динамических системах/Под. ред.Леондеса К.Т. М.: Мир, 1980, 407с. [Электронный ресурс]. - Режим доступа: https://www.livelib.ru/book/1001199459
7. Электронная библиотека диссертаций РГБ: [Электронный ресурс]. - Режим доступа: http://www.diss.rsl.ru