Прикладная математика. Сложные системы и их стохастические модели
Выбери формат для чтения
Загружаем конспект в формате docx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
МИНИСТЕРСТВО образованиЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное бюджетное образовательное учреждение высшего образования
«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ СТРОИТЕЛЬНЫЙ УНИВЕРСИТЕТ»
Кафедра прикладной математики
«Прикладная математика»
Москва 2018
Составители:
Мацеевич Т.А. д.физ.-мат.н., Ахметов В.К. д.т.н., Мозгалёва М.Л. д.т.н.,
Хайруллин Р.З. д.физ.-мат.н., Кирьянова Л.В. к.физ.-мат.н., Макаров В.И. к.т.н.
Часть 1. Сложные системы и их стохастические модели
Лекция 1
1.1 Системность - общее свойство материи
С позиций современных научных представлений системность всегда была методом любой науки. Возможно, что принципы системности применялись не всегда осознанно, но, тем не менее, любой ученый прошлого, который и не помышлял о системном подходе, так или иначе, имел дело с системами и моделями объектов или процессов. Ранее всего системные проблемы были осознаны философами. Следует отметить, что обсуждение системных проблем в таких дисциплинах как философия, логика, математика осуществлялось еще древними учеными. Однако в настоящее время представляет особый интерес развитие системных представлений в применении к системным и техническим дисциплинам.
Первым в явной форме вопрос о научном подходе к управлению сложными системами поставил М.-А. Ампер. Он впервые выделил кибернетику как специальную науку об управлении государством, обозначил ее место в ряду других наук, и сформулировал ее системные особенности. Идеи системности применительно к управлению государством развивались в работах польского ученого Б. Трентовского. Он отмечал, что действительно эффективное управление должно учитывать все важнейшие внешние и внутренние факторы, влияющие на объект управления. В своих работах Трентовский пишет, что при выработке управляющего воздействия необходимо учитывать национальные особенности населения с учетом временного аспекта, при одной и той же политической идеологии кибернет (в современной терминологии, лицо, принимающее решение) должен управлять различно в Австрии, России или Пруссии, точно так же и в одной и той же стране он должен управлять завтра иначе, чем сегодня. Трентовский рассматривает общество как систему, которая развивается путем разрешения противоречий. И все- таки общество середины 19-го столетия было не готово к восприятию системных представлений. Прошло еще более полувека, прежде чем системная проблематика прочно заняла свое место в научных публикациях. К числу основоположников теории систем можно заслуженно отнести российского ученого, академика Е.С. Федорова. Основные научные результаты были достигнуты им в области минералогии. Он установил, что существует только 230 типов кристаллической решетки, тем не менее, любое вещество при определенных условиях может кристаллизоваться. Таким образом, было показано, что великое многообразие кристаллов и минералов использует для своего строения ограниченное количество типов структур. Далее им были отмечены аналогичные закономерности в области архитектурных и музыкальных 12 конструкций, языковых построений, строения вещества и ряда других систем. Развивая системные представления Федоров установил ряд других закономерностей развития систем, в частности, им было замечено такое свойство систем как самоорганизация, способность к приспособлению, к повышению стройности.
Следующим этапом в развитии системных представлений явились работы А.А. Богданова, который в начале XX в. начал создавать теорию организации (тектологию). Основная идея теории Богданова заключается в том, что все существующие объекты и процессы имеют определенный уровень организованности, который тем выше, чем сильнее свойства целого отличаются от простой суммы свойств комплектующих элементов. Именно анализ свойств целого и его частей был впоследствии заложен в качестве основной характеристики понятия сложной системы. Заслугой Богданова явилось также то, что он изучает не только статическое состояние структур, а занимается исследованием динамического поведения объектов, уделяет внимание вопросам развития организации, подчеркивает значение обратных связей, указывает на необходимость учета собственных целей организации, отмечает роль открытых систем. Он подчеркивает роль моделирования и математических методов как потенциальных методов решения задач теории организации. Позднее идеи теории организации развивались в трудах выдающихся представителей отечественного естествознания И.И. Шмальгаузена, В.Н. Беклемишева и ряда других специалистов, вклад которых во многих отношениях явился решающим в формировании вышеназванной теории. Вклад русских и советских исследователей в развитие теории систем и формирование системных представлений явился определяющим, поскольку большинство развиваемых ныне идей связано с работами Богданова и трудами его последователей.
Однако нельзя не отметить также и зарубежных ученых, работы которых являются основополагающими в области развития теории систем и системного анализа. В первую очередь следует обратить внимание на труды австрийского ученого JI. фон Берталанфи, который в 50-х гг. XX в. организовал в Канаде центр системных исследований. Он опубликовал большое количество работ, в которых исследовал взаимодействие систем с окружающей средой. Подчеркнуто большое значение обмена системы веществом, энергией и энтропией с внешним миром, отмечено, что в системе устанавливается динамическое равновесие, которое может быть направлено в сторону усложнения организации, функционирование системы является не просто откликом на изменение внешних условий, а сохранением старого или установлением нового внутреннего равновесия системы. В своих работах Берталанфи исследует общие закономерности, присущие любым достаточно сложным организациям материи как биологической, так и общественной природы. Берталанфи и организованная им школа последователей в своих трудах пытаются придать общей теории систем формальный характер.
Массовое распространение системных представлений, осознание системности мира, общества и человеческой деятельности связано с именем американского математика Н. Винера. В 1948 г. он опубликовал книгу «Кибернетика» и далее «Кибернетика и общество». В своих трудах он развивает идеи управления и связи в животном мире и машинах, анализирует с позиций кибернетики процессы, происходящие в обществе. Н.Винером и его последователями было указано, что предметом кибернетики является исследование систем. Причем отмечается, что хотя при изучении системы на каком-то этапе потребуется проводить учет ее конкретных свойств, для кибернетики в принципе несущественно, какова природа системы. То есть для изучения систем различных типов, будь она физической, биологической, экономической, организационной или вовсе представленной в виде модели, кибернетика предлагает единые подходы к ее исследованию. Ф.И. Перегудов и Ф.П. Тарасенко в своей книге отмечают, что с кибернетикой Винера связаны такие продвижения в развитии системных представлений как типизация моделей систем, выявление особого значения обратных связей в системе, подчеркивание принципа оптимальности в управлении и синтезе систем, осознание информации как всеобщего свойства материи и возможности ее количественного описания, развитие методологии моделирования вообще и в особенности идеи математического эксперимента с помощью ЭВМ.
Существенное место в развитии кибернетики занимают советские ученые. Можно отметить многочисленные работы академика А. И. Берга. Фундаментальный вклад в развитие кибернетики внес также академик А.Н. Колмогоров. Так в период, когда в Советском Союзе кибернетику считали лженаукой и в стране шли горячие дискуссии о сути кибернетики, были сформулированы достаточно общие и полные определения кибернетики. Приведем эти определения: «Кибернетика — это наука об оптимальном управлении сложными динамическими системами» (А.И. Берг); «Кибернетика - это наука о системах, воспринимающих, хранящих, перерабатывающих и использующих информацию» (А.Н. Колмогоров).
Наконец, отметим достижения в области исследования систем бельгийской школы во главе с И. Пришжиным. Ученые этой школы исследовали механизм самоорганизации систем. Они отмечают, что в результате взаимодействия с окружающей средой система может перейти в неравновесное состояние. В результате такого взаимодействия изменяется организованность системы. Переломные точки, в которых наблюдается неустойчивость неравновесных состояний, называются точками бифуркации. Таким образом, согласно теории И. Пришжина, материя не является пассивной субстанцией, ей присуща спонтанная активность.
1.2. Понятие сложной системы. Способы описания систем
Системный анализ как дисциплина сформировался в результате возникновения необходимости исследовать и проектировать сложные системы, управлять ими в условиях неполноты информации, ограниченности ресурсов и дефицита времени. Системный анализ является дальнейшим развитием целого ряда дисциплин, таких как исследование операций, теория оптимального управления, теория принятия решений, экспертный анализ, теория организации эксплуатации систем и т.д. Для успешного решения поставленных задач системный анализ использует всю совокупность формальных и неформальных процедур. Перечисленные теоретические дисциплины являются базой и методологической основой системного анализа. Таким образом, системный анализ - междисциплинарный курс, обобщающий методологию исследования сложных технических, природных и социальных систем. Широкое распространение идей и методов системного анализа, а главное - успешное их применение на практике стало возможным только с внедрением и повсеместным использованием ЭВМ. Именно применение ЭВМ как инструмента решения сложных задач позволило перейти от построения теоретических моделей систем к широкому их практическому применению. В связи с этим Н.Н. Моисеев пишет, что системный анализ - это совокупность методов, основанных на использовании ЭВМ и ориентированных на исследование сложных систем - технических, экономических, экологических и т.д. Центральной проблемой системного анализа является проблема принятия решения. Применительно к задачам исследования, проектирования и управления сложными системами проблема принятия решения связана с выбором определенной альтернативы в условиях различного рода неопределенности. Неопределенность обусловлена многокритериальностью задач оптимизации, неопределенностью целей развития систем, неоднозначностью сценариев развития системы, недостаточностью априорной информации о системе, воздействием случайных факторов в ходе динамического развития системы и прочими условиями. Учитывая данные обстоятельства, системный анализ можно определить как дисциплину, занимающуюся проблемами принятия решений в условиях, когда выбор альтернативы требует анализа сложной информации различной физической природы.
Системный анализ является дисциплиной синтетической. В нем можно выделить три главных направления. Эти три направления соответствуют трем этапам, которые всегда присутствуют в исследовании сложных систем:
1) построение модели исследуемого объекта;
2) постановка задачи исследования;
3) решение поставленной математической задачи.
Рассмотрим данные этапы.
Построение модели (формализация изучаемой системы, процесса или явления) есть описание процесса на языке математики. При построении модели осуществляется математическое описание явлений и процессов, происходящих в системе. Поскольку знание всегда относительно, описание на любом языке отражает лишь некоторые стороны происходящих процессов и никогда не является абсолютно полным. С другой стороны, следует отметить, что при построении модели необходимо уделять основное внимание тем сторонам изучаемого процесса, которые интересуют исследователя. Глубоко ошибочным является желание при построении модели системы отразить все стороны существования системы. При проведении системного анализа, как правило, интересуются динамическим поведением системы, причем при описании динамики с точки зрения проводимого исследования есть первостепенные параметры и взаимодействия, а есть несущественные в данном исследовании параметры. Таким образом, качество модели определяется соответствием выполненного описания тем требованиям, которые предъявляются к исследованию, соответствием получаемых с помощью модели результатов ходу наблюдаемого процесса или явления. Построение математической модели есть основа всего системного анализа, центральный этап исследования или проектирования любой системы. От качества модели зависит результат всего системного анализа.
Постановка задачи исследования. На данном этапе формулируется цель анализа. Цель исследования предполагается внешним фактором по отношению к системе. Таким образом, цель становится самостоятельным объектом исследования. Цель должна быть формализована. Задача системного анализа состоит в проведении необходимого анализа неопределенностей, ограничений и формулировании, в конечном счете, некоторой оптимизационной задачи. Анализируя требования к системе, т. е. цели, которые предполагает достигнуть исследователь, и те неопределенности, которые при этом неизбежно присутствуют, исследователь должен сформулировать цель анализа на языке математики. Язык оптимизации оказывается здесь естественным и удобным, но вовсе не единственно возможным.
Решение поставленной математической задачи. Только этот третий этап анализа можно отнести собственно к этапу, использующему в полной степени математические методы. Хотя без знания математики и возможностей ее аппарата успешное выполнение двух первых этапов невозможно, так как и при построении модели системы, и при формулировании цели и задач анализа широкое применение должны находить методы формализации. Однако отметим, что именно на завершающем этапе системного анализа могут потребоваться тонкие математические методы. Ho следует иметь в виду, что задачи системного анализа могут иметь ряд особенностей, которые приводят к необходимости применения наряду с формальными процедурами эвристических подходов. Причины, по которым обращаются к эвристическим методам, в первую очередь связаны с недостатком априорной информации о процессах, происходящих в анализируемой системе. В данном случае трудности, возникающие в результате необходимости применения неформальных процедур анализа зачастую являются определяющими. Успешное решение задач системного анализа требует использования на каждом этапе исследования неформальных рассуждений. Ввиду этого проверка качества решения, его соответствие исходной цели исследования превращается в важнейшую теоретическую проблему.
Наибольший вклад в формализацию представлений о сложных системах был сделан в связи с развитием автоматизированных систем управления. Авторы работ по теории систем применительно к техническим системам понятие системы формулируют в виде следующих определений.
Под автоматизированной системой понимается программно-аппаратный комплекс, выполненный на базе средств измерительной и вычислительной техники, предназначенный для решения задач управления на основе получения и использования моделей объекта управления. В данном определении констатируется, что автоматизированная система является искусственной системой, создаваемой человеком. Для таких систем конечное состояние или цель функционирования задается заранее, а их поведение направлено на достижение поставленной цели. Цель автоматизированной системы состоит в решении выделенного набора задач автоматизации управления, как правило, поведением технического объекта.
Автоматизированная система - это совокупность частей (технических средств, математических методов, коллектива исполнителей), образующая организационное комплексное единое целое и обеспечивающая решение требуемого набора задач автоматизации с заданной точностью в пределах ограничений во времени и стоимости.
В данном определении уточняется состав элементов, из которых строится система. Также отмечается, что разработка и функционирование системы должны производиться с учетом некоторых ограничений. Иными словами, к системе предъявляются определенные требования оптимальности.
Логичным кажется не искать в литературе всеобъемлющего определения сложной системы, а указать на основные свойства системы, которые всесторонне характеризуют ее и так или иначе присутствуют в различных формулировках определений. Первая существенная особенность системы состоит в том, что система обладает новыми свойствами по сравнению с элементами, из которых она состоит. При этом система есть не просто механический набор элементов, а целенаправленное их соединение в виде определенных структур и взаимосвязей. Система есть организационное единство элементов. Нарушение взаимосвязей приведет к разрушению системы.
Вторая особенность систем состоит в том, что они обладают свойствами оптимальности. Системы проектируются с учетом критериев оптимальности и функционируют согласно построенным заранее оптимальным планам. Следующая черта, которая отражается в определении системы, — это цель или назначение системы. Системы создаются для достижения какой-либо цели, для решения определенных задач. He существует систем, не предназначенных ни для чего, не решающих никаких задач. Любая система имеет свое предназначение.
Подходы к классификации системы могут быть самыми разными:
- по виду отображаемого объекта-технические, биологические, социальные и т. п.;
- по характеру поведения — детерминированные, вероятностные, игровые;
- по типу целеустремленности - открытые и закрытые;
- по сложности структуры и поведения - простые и сложные;
- по виду научного направления, используемого для их моделирования - математические, физические, химические и др.;
- по степени организованности - хорошо организованные, плохо организованные и самоорганизующиеся.
Рассмотрим некоторые из представленных видов классификации. Детерминированной называется система, состояние которой в будущем однозначно определяется ее состоянием в настоящий момент времени и законами, описывающими переходы элементов и системы из одних состояний в другие. Составные части в детерминированной системе взаимодействуют точно известным образом. Примером детерминированной системы может служить механический арифмометр. Установка соответствующих чисел на валике и задание порядка вычисления однозначно определяют результат работы устройства. То же самое можно сказать о калькуляторе, если считать его абсолютно надежным.
Вероятностные или стохастические системы - это системы, поведение которых описывается законами теории вероятностей. Для вероятностной системы знание текущего состояния и особенностей взаимной связи элементов недостаточно для предсказания будущего поведения системы со всей определенностью. Для такой системы имеется ряд направлений возможных переходов из одних состояний в другие, т. е. имеется группа сценариев преобразования состояний системы, и каждому сценарию поставлена в соответствие своя вероятность. Примером стохастической системы может служить мастерская по ремонту электронной и радиотехники. Срок выполнения заказа по ремонту конкретного изделия зависит от количества аппаратуры, поступившей в ремонт до поступления рассматриваемого изделия, от характера повреждений каждого из находящихся в очереди объектов, от количества и квалификации обслуживающего персонала и т. п.
Игровой является система, осуществляющая разумный выбор своего поведения в будущем. В основе выбора лежат оценки ситуаций и предполагаемых способов действий, выбираемых на основе заранее сформированных критериев, а также с учетом соображений неформального характера. Руководствоваться этими соображениями может только человек. Примером игровой системы может служить организация, выполняющая некоторые работы и выступающая в качестве исполнителя. Исполнитель вступает в отношения с заказчиком. Интересы исполнителя и заказчика противоположные. Исполнитель старается продать свою работу как можно выгоднее. Заказчик, наоборот, пытается сбить цену и соблюсти свои интересы. В данном торге между ними проявляется игровая ситуация.
Классификация по данному признаку условна, как и многое другое, касающееся характеристики сложных систем. Она допускает разные толкования принадлежности той или иной системы к сформированным классам. Так в детерминированной системе можно найти элементы стохастичности. С другой стороны, детерминированную систему можно считать частным случаем стохастической системы, если положить вероятности переходов из состояния в состояние соответственно равными нулю (перехода нет) и единице (переход имеет место). Точно также стохастическую систему можно рассматривать как частный случай игровой, когда идет игра с природой.
Следующий признак классификации: открытые и закрытые системы. По данному признаку классификации системы характеризуются различной степенью взаимодействия с внешней средой. Открытые системы обладают особенностью обмениваться с внешней средой массой, энергией, информацией. Замкнутые (или закрытые) системы изолированы от внешней среды. Предполагается, что разница между открытыми и замкнутыми системами определяется с точностью до принятой чувствительности модели.
По степени сложности системы подразделяются на простые, сложные и очень сложные. Простые системы характеризуются небольшим количеством возможных состояний, их поведение легко описывается в рамках той или иной математической модели. Сложные системы отличаются разнообразием внутренних связей, но допускают их описание. Причем набор методов, привлекаемых для описания сложных систем, как правило, многообразен, т. е. для построения математической модели сложной системы применяются различные подходы и разные разделы математики. Очень сложные системы характеризуются большой разветвленностью связей и своеобразностью отношений между элементами. Многообразие связей и отношений таково, что нет возможности все их выявить и проанализировать. Простыми системами можно считать лентопротяжные механизмы, механические передачи, системы слежения за целью и т.д. Сложными системами являются электронно-вычислительная машина, система управления и защиты энергоблока, система электроснабжения промышленного объекта и пр. Очень сложными являются социотехнические системы, такие как автоматизированные системы управления крупным предприятием, экспертные системы с функциями поддержки и принятия управленческих решений.
В системном анализе имеется большая группа задач, в которых требуется спрогнозировать процессы развития системы и принять решение, в результате которого система в будущем должна попасть в некоторое оптимальное состояние. Например, в экономических системах требуется спланировать ассортимент и объем выпускаемой продукции в некоторый будущий период времени с целью получения максимальной прибыли после ее реализации. При этом необходимо спрогнозировать потребность рынка в продукции соответствующего типа, спрос на данный вид продукции. Как уже было отмечено, потребность рынка определяется многими факторами, например, соотношением цены и качества товара, уровнем доходов населения, модой и т.д. При решении задач такого типа на помощь приходит прогностика - наука о способах и методах разработки прогнозов.
Прогнозом называется научно обоснованное суждение об ожидаемых состояниях системы, объекта или явления окружающей действительности.
Прогнозирование - это разработка прогнозов, состоящая в организации и проведении специальных исследований перспектив развития исследуемых объектов, систем или явлений. Научное прогнозирование чаще всего применяется в социально-экономических и научно-технических областях человеческой деятельности. Процесс прогнозирования базируется на изучении объективных тенденций развития объекта исследования. Разработка общей проблемы предсказания должна основываться на изучении реальных закономерностей развития объекта исследования. Содержание и степень достоверности прогноза определяются информацией о поведении объекта исследования, накопленной до того времени, на который составляется прогноз, закономерностями, выявленными при функционировании объекта исследования, а также опытом, знаниями и научной интуицией специалистов, занимающихся данным видом деятельности.
Известны три группы методов прогнозирования, предлагаемых для практического применения - это методы экстраполяции, методы экспертных оценок и логического моделирования. Методы экстраполяции основаны на аппроксимации результатов, полученных при анализе развития исследуемых процессов, описании полученных данных с помощью математических моделей и дальнейшем расчете моделей для будущих моментов времени. Данные методы позволяют осуществлять поиск приемлемых оценок состояний системы в будущем, однако их применение обоснованно только для описания процессов эволюционного развития. Хотя хорошо известно, что процессы развития систем включают в себя как периоды эволюционного изменения, так и скачкообразные переходы от одних состояний к другим. Скачкообразные переходы обусловлены открытиями новых физических принципов, реализацией оригинальных технических решений, осуществлением крупных проектов. Это обстоятельство должно учитываться при проведении исследований, для чего используются различного рода приемы, позволяющие выделить ожидаемые скачки на общем фоне изменений, интересующих исследователя. Рекомендуемым методом прогнозирования скачкообразных изменений развития систем может быть метод экспертных оценок. При этом в качестве экспертов должны выступать высококвалифицированные в данной области знаний специалисты. Необходимая для формирования прогноза информация обобщается путем обработки мнений экспертов. В результате разрабатывается сценарий развития системы, а также возможные его варианты, учитывающие наличие скачков, предсказание которых особенно ценно для системных аналитиков.
1.3 Сбор данных о функционировании системы. Построение моделей систем. Отражение свойств системы в математической модели. Анализ и синтез - методы исследования систем. Проверка адекватности моделей, анализ неопределенности и чувствительности
Основные процедуры системного анализа:
- изучение структуры системы, анализ ее компонентов, выявление взаимосвязей между отдельными элементами;
- сбор данных о функционировании системы, исследование информационных потоков, наблюдения и эксперименты над анализируемой системой;
- построение моделей;
-проверка адекватности моделей, анализ неопределенности и чувствительности;
- исследование ресурсных возможностей;
- определение целей системного анализа;
- формирование критериев;
- генерирование альтернатив;
- реализация выбора и принятие решений;
- внедрение результатов анализа.
Любая задача системного анализа начинается с построения модели исследуемой системы. Для решения задачи построения модели необходимо вначале произвести изучение структуры системы, выполнить анализ ее компонентов, выявить взаимосвязи между отдельными элементами.
При проведении системного анализа исследователя интересуют вопросы, касающиеся изучения свойств системы. Свойства системы реализуются в процессе ее функционирования, т.е. в процессе динамического поведения системы. Чтобы построить модель системы, которая имела бы возможность отражать свойства и характеристики системы, реализующиеся в процессе ее функционирования во времени, необходимо помимо структуры системы знать ее параметры, поэтому следующим этапом работ при проведении системного анализа является сбор данных о функционировании системы и исследование информационных потоков.
Параметры системы подразделяются на внутренние и внешние.
Внешние параметры системы - характеристики функционирования системы, служащие показателями качества ее работы как единого целого. В качестве примера внешних параметров можно привести параметры автоматизированной системы:
- общая производительность системы по обработке данных;
- объем передаваемой информации;
- достоверность выходной экспериментальной информации;
- точность получения результатов (для информации, заданной количественно);
- количественные характеристики надежности системы;
- объем используемой в системе аппаратуры (объем памяти, количество преобразователей формы информации, количество внешних устройств и т.д.);
- время задержки с момента поступления в систему исходных данных до момента выдачи окончательных результатов (во время решения определенной задачи);
- стоимость системы (с учетом разработки математического обеспечения);
- показатели удобства системы в эксплуатации (наличие элементов «психологического комфорта») и др.
Внутренние параметры системы - характеристики, показывающие особенности технических решений, принятых при организации системы в целом и отдельных технических средств, входящих в состав системы, а также в совокупности, влияющие на значения внешних параметров системы. Примерами внутренних параметров автоматизированных систем являются:
- вид и характеристики сигналов для представления информации в системе, в каналах связи - при обмене информацией между отдельными звеньями системы;
- способ кодирования информации;
- вид приоритетности при приеме и обработке информации от различных источников;
- способ организации программы-диспетчера;
- быстродействие отдельных элементов и т.д.
Наблюдения с целью сбора данных могут проводиться в процессе функционирования системы либо же для сбора данных организуются специальные экспериментальные исследования. В первом случае говорят, что данные получены в результате пассивного эксперимента. Во втором случае имеет место активный эксперимент. Активный эксперимент проводится по специально составленному плану с использованием методов планирования эксперимента. При этом предусматривается возможность изменения входных параметров, влияющих на процесс функционирования системы. Исследуется изменение выходных параметров системы в зависимости от уровней входных параметров. Результаты испытаний фиксируются с помощью измерений, т.е. изображения результатов опыта в виде символов, номеров или чисел. Измерение - это алгоритмическая операция, которая данному наблюдаемому состоянию системы или процесса ставит в соответствие определенное обозначение: число, номер или символ. Такое соответствие обеспечивает то, что результаты измерений содержат информацию об исследуемой системе. Требуемая информация в виде оценок параметров получается путем преобразования результатов измерения или, как еще говорят, с помощью статистической обработки экспериментальных данных.
1.4. Имитационное моделирование, как метод проведения системных исследований
Выделяют два класса моделей: аналитические и имитационные. В аналитических моделях поведение сложной системы записывается в виде некоторых функциональных соотношений или логических условий. Наиболее полное исследование удается провести в том случае, когда получены явные зависимости, связывающие искомые величины с параметрами сложной системы и начальными условиями ее изучения. Однако это удается выполнить только для сравнительно простых систем. Для сложных систем исследователю приходится идти на упрощение реальных явлений, дающее возможность описать их поведение и представить взаимодействия между компонентами сложной системы. Это позволяет изучить хотя бы некоторые общие свойства сложной системы, например, оценить устойчивость системы, характеристики надежности и т.п. Для построения математических моделей имеется мощный математический аппарат (функциональный анализ, исследование операций, теория вероятностей, математическая статистика, теория массового обслуживания и т.д.). Наличие математического аппарата и относительная быстрота и легкость получения информации о поведении сложной системы способствовало повсеместному и успешному распространению аналитических моделей при анализе характеристик сложных систем.
Когда явления в сложной системе настолько сложны и многообразны, что аналитическая модель становится слишком грубым приближением к действительности, системный аналитик вынужден использовать имитационное моделирование. В имитационной модели поведение компонентов сложной системы описывается набором алгоритмов, которые затем реализуют ситуации, возникающие в реальной системе. Моделирующие алгоритмы позволяют по исходным данным, содержащим сведения о начальном состоянии сложной системы, и фактическим значениям параметров системы отобразить реальные явления в системе и получить сведения о возможном поведении сложной системы для данной конкретной ситуации. На основании этой информация аналитик может принять соответствующие решения. Отмечается, что предсказательные возможности имитационного моделирования значительно меньше, чем у аналитических моделей.
Вопрос о том, какой модели следует отдать предпочтение при проведении исследований характеристик системы, не является очевидным. Аналитическая модель имеет некоторые преимущества по сравнению с имитационной моделью. Во-первых, аналитическая модель дает решение поставленной задачи в законченной форме. Во-вторых, применение аналитической модели обеспечивает глубину анализа. С помощью аналитических моделей можно проводить исследование характеристик в некоторой области определения параметров, в которой модель адекватна описываемым явлениям или процессам. Применение аналитических моделей позволяет получить решение в виде функциональной зависимости исследуемых характеристик от параметров модели. Имитационная модель за один цикл ее применения производит расчет характеристик в одной точке. Для получения функциональной зависимости выходной характеристики от параметров модели необходимо провести многократные расчеты на имитационной модели.
С другой стороны, построить аналитическую модель для сложной системы очень трудно. При таком построении требуется принимать существенные упрощающие предположения, которые могут привести к тому, что построенная модель будет неадекватна описываемым процессам или явлениям. В этом смысле имитационные модели имеют преимущества, так как они могут быть построены в самых общих предположениях о функционировании системы. Следовательно, имитационные модели могут быть более адекватны. К недостаткам аналитических моделей относится также и то, что простая модификация проекта или изменение предположений о функционировании элементов структуры может потребовать коренной перестройки модели, в то время как у имитационной модели потребуется изменить лишь входную информацию.
Рассмотрим простой пример. Пусть необходимо оценить характеристики надежности системы, структура которой известна. Если проводить расчеты в предположении об отсутствии восстановительных мероприятий после отказов элементов, то аналитическая модель для такого расчета строится с использованием логико-вероятностного подхода. Если изменить предположения и считать, что после отказа элементов осуществляется восстановление и потоки отказов и восстановлений пуассоновские, то для расчета надежности используются уравнения Колмогорова-Чепмена. Если же будем предполагать восстановление элементов, но потоки отказов или восстановлений описывать не пуассоновским, а каким-нибудь другим распределением, то для построения моделей расчета надежности необходимо использовать аппарат теории восстановления, т.е. для решения одной и той же задачи при смене предположений о характере функционирования системы для построения аналитической модели приходится полностью менять теоретический аппарат. В имитационной модели в этом случае меняются лишь входные данные. Таким образом, на основании сказанного нельзя однозначно решить, какая модель лучше. Обе модели являются полезным инструментом исследования и об их соответствии решаемым проблемам надо судить в контексте конкретного применения. В задачах системного анализа целесообразно проводить комбинированные исследования, использующие как аналитические, так и имитационные модели.
Лекция 2
2.1. Вероятностное описание событий и процессов. Статистическая обработка экспериментальных данных
Математическая статистика – это раздел математики, в котором изучаются методы обработки и анализа экспериментальных данных с помощью аппарата теории вероятностей.
Статистической совокупностью называют совокупность предметов или явлений, объединённых каким – либо общим признаком.
Результатом наблюдений над статистической совокупностью являются статистические данные. Обработка статистических данных методами математической статистики приводит к установлению определенных закономерностей, присущих массовым явлениям.
Генеральной совокупностью называется совокупность объектов или явлений, все элементы которой подлежат изучению при статистическом анализе.
В математической статистике генеральная совокупность понимается как совокупность всех мысленных наблюдений, которые могли быть произведены при выполнении данного комплекса условий. Изучение всей генеральной совокупности часто оказывается невозможным, в таком случае рассматривают некоторую часть объёма.
То есть, генеральная совокупность - это множество каких – либо однородных элементов, из которого по определенному правилу выделяется некоторое подмножество – выборка.
Выборочной совокупностью (выборкой) называют множество результатов наблюдений, случайно отобранных из генеральной совокупности. Выборка (случайная) обозначается X = (X1, X2,… Xn).
Таким образом, выборка представляет собой совокупный результат n независимых наблюдений над некоторой генеральной случайной величиной X.
Величина n – (количество проведенных измерений или наблюдений) называется объёмом выборки.
С точки зрения теории вероятностей, выборка – это n-мерный случайный вектор с одинаково распределёнными независимыми компонентами.
Любая конкретная выборка x = (x1, x2,… xn) (её также называют простой выборкой) есть реализация этой совокупности случайных величин.
Выборочное пространство – это пространство, состоящее из реализаций вектора X:
,
где xi – выборочное наблюдение (i = 1, 2,…n).
Таким образом, понятия выборочного пространства и генеральной совокупности совпадают.
Информация о генеральной совокупности, полученная на основе выборки, всегда будет обладать некоторой погрешностью, так как основывается на изучении только части объектов. Это выдвигает требования к отбору части объектов – выборка должна быть репрезентативной, то есть правильно отражать пропорции генеральной совокупности. Теоретически репрезентативность достигается случайностью отбора, но на практике зачастую прибегают к различным приемам неслучайного отбора. Основой математической статистики будет простая случайная выборка.
Характеристики (параметры) генеральной совокупности, оцененные с помощью выборки, называют выборочными характеристиками, и они, естественно, являются случайными величинами как функции от случайной выборки.
Задачи математической статистики состоят в обоснованном суждении об объективных свойствах генеральной совокупности по результатам случайной выборки (по значениям выборочных характеристик). Решение таких задач требует знания законов распределения выборочных характеристик.
На первом этапе статистической обработки производят ранжирование, то есть упорядочение данных. Упорядоченные по возрастанию числовых значений элементы выборки называют вариационным рядом X (1) ≤ X(2) ≤ …≤ X(n) .
Члены вариационного ряда называют порядковыми статистиками.
Крайние члены: X(1) = Xmin и X(n) = Xmax называют экстремальными значениями вариационного ряда.
Разность X(n) – X(1) = Xmax – Xmin называют размахом выборки.
Промежуток между экстремальными значениями вариационного ряда (X(1), X(n)) называют интервалом варьирования.
Если выборочные наблюдения в простой выборке представить в порядке неубывания числовых значений, то получится реализация вариационного ряда х(1) ≤ х(2) ≤ …≤ х(n).
При статистическом анализе дискретных случайных величин используют простую таблицу частот.
Если выборка содержит m n различных значений и значение х(i) встречается ni раз, тогда ni называется частотой, а сам неповторяющейся элемент вариационного ряда х(i) – варианта.
Если для каждой варианты х(i) указать частоту её появления ni, то множество пар (х(i), ni) называется статистическим рядом.
Статистический ряд для дискретной случайной величины записывают в виде простой таблицы частот (табл.1).
Таблица 1
№
значения
частоты
1
x min
n1
…
…
…
m
x max
nm
Очевидно, что сумма всех частот равна объёму выборки:
Если генеральная случайная величина – непрерывная, то её интервал варьирования разбивают на небольшие интервалы, проводя группировку выборочных данных.
Число интервалов группировки m рассчитывают по формуле Стерджеса:
тогда ширина (или величина) интервала равна
где в числителе дроби стоит вариационный размах; xmax – значение Xmax; xmin – значение Xmin .
Сгруппированные данные записывают в виде (табл.2):
Таблица 2
№ интервала
Интервал
Частоты
1
(xmin , xmin + )
n1
2
(xmin + , xmin + 2)
n2
…
…
…
m
(xmax – xmax )
nm
Частота ni – количество данных, попавших в интервал. Таблицу такого вида называют интервальной. Иногда в интервальной таблице также указывают середины интервалов группировки.
Для графического изображения (представления) выборочных данных используют следующие характеристики: эмпирическую функцию распределения, гистограмму и полигон (рис.1-3).
Эмпирическая функция распределения имеет вид:
где n(x) – число элементов выборки, оказавшихся меньше x ( – накопленная частота).
Рис.1. Эмпирическая функция распределения
Для построения эмпирической функции распределения нанесём на ось OX члены вариационного ряда, затем построим ступенчатую функцию. Высота каждой ступеньки равна
На основе теоремы Бернулли для эмпирической функции распределения можно доказать следующую теорему.
Теорема Гливенко: для любого действительного числа x верно:
где F(x) – теоретическая функция распределения, Fn(x) – эмпирическая функция распределения. (В утверждении теоремы имеется в виду поточечная сходимость последовательности функций).
Теорема Колмогорова:
То есть, если вокруг эмпирической функции распределения построить узкую зону, то с большой вероятностью можно утверждать, что функция распределения будет лежать в этой зоне.
Полигон частот – представляет собой ломаную, концы отрезков прямой имеют координаты (xi; ). Полигон, как правило, служит для графического представления дискретного вариационного ряда. Для интервального ряда тоже строят полигон, только его ломанная проходит через точки, абсциссы которых являются серединами интервалов группировки.
Рис.2. Полигон частот
Гистограмма. При построении гистограммы используются сгруппированные данные. По оси OX откладывают интервалы шириной от хmin до хmax. На каждом интервале строят прямоугольник площадью (равной относительной частоте попадания в данный интервал), то есть, высота прямоугольника . Объединение этих прямоугольников называется гистограммой выборки. Таким образом, площадь каждого прямоугольника гистограммы равна его частоте, а общая площадь равна единице.
Рис.3. Представление данных в форме гистограммы
С увеличением объема выборки n и уменьшением длины интервала k гистограмма будет приближаться к кривой плотности распределения, поэтому гистограмму используют в качестве оценки для плотности распределения.
Вариационный ряд содержит достаточно полную информацию о генеральной случайной величине X, однако обилие числовых данных, с помощью которых он задаётся, усложняет их использование. На практике достаточно часто оказывается достаточным знание лишь сводных характеристик вариационного ряда: выборочных моментов, моды, медианы, асимметрии и эксцесса.
Расчёт статистических характеристик представляет собой второй после группировки данных этап обработки результатов наблюдений. Рассмотрим основные характеристики.
Выборочная (эмпирическая) средняя:
где m – число интервалов группировки, x(j) – соответствующее значение варианты для дискретного случая или середина интервала группировки для непрерывного, nj – соответствующая частота. В частном случае, когда выборка содержит n различных значений (количество значений равно объёму выборки), все частоты nj = 1 и формула для выборочного среднего примет более простой вид:
Выборочная медиана – значение признака, приходящееся на середину вариационного ряда:
Медиану, как меру средней величины, используют в том случае, если крайние члены вариационного ряда по сравнению с остальными, оказались чрезмерно большими или малыми.
Выборочная мода – выборочное значение, которому соответствует наибольшая частота.
Моду можно найти по простой или интервальной таблице частот.
Моду легко найти графическим путем с помощью гистограммы (рис.4).
Рис.4. Нахождение моды с помощью гистограммы
Выборочная дисперсия:
Для практических вычислений S2 более удобной является следующая формула:
(выборочная дисперсия равна разности среднего квадрата и квадрата выборочного среднего), где
Выборочное среднеквадратическое отклонение есть арифметический квадратный корень из дисперсии S.
Эмпирический коэффициент асимметрии
Если A = 0, то распределение имеет симметричную форму.
При A 0 говорят о положительной (или правосторонней) асимметрии.
При A 0 говорят о отрицательной (или левосторонней) асимметрии.
Эмпирический эксцесс
Если E 0, то полигон вариационного ряда имеет более крутую вершину по сравнению с нормальной (гауссовой) кривой.
Если E 0, то полигон вариационного ряда имеет более пологую вершину по сравнению с нормальной (гауссовой) кривой.
2.2 Оценивание показателей систем и определение их точности методами математической статистики
Основные положения теории проверки статистических гипотез.
На практике часто приходится проверять на основе выборочных данных различные предположения относительно генеральной совокупности. Процедура сопоставления выдвинутых гипотез с выборкой и вынесения решения относительно приемлемости этих гипотез получила название проверки гипотез.
Такая процедура используется всякий раз, когда необходим обоснованный вывод о преимуществах того или иного способа инвестиций, измерений, стрельбы, технологического процесса, об эффективности нового метода обучения, управления, о пользе удобрений, лекарств, об уровне доходности ценных бумаг, и т.д.
Гипотезой в математической статистике называется любое утверждение о виде или свойствах распределения вероятностей, лежащее в основе наблюдаемых явлений.
По своему содержанию статистические гипотезы можно подразделить на несколько основных типов:
1. гипотезы о числовых значениях параметров случайной величины;
2. гипотезы о виде распределения исследуемой случайной величины;
3. гипотезы об общем виде модели, описывающей статистическую зависимость между случайными величинами.
Проверка статистической гипотезы заключается в том, чтобы оценить, можно ли считать случайным расхождение между выдвинутой гипотезой и результатами выборочного наблюдения. Такая оценка всегда носит вероятностный характер.
Если расхождение между эмпирическими и теоретическими значениями не выходит на пределы случайной ошибки, то можно считать, что с заданной вероятностью выдвинутая гипотеза не опровергается.
При этом справедливость самой гипотезы не доказывается, а лишь делается вывод о том, можно ли считать её допустимой или необходимо опровергнуть.
Гипотезы подразделяют на параметрические и непараметрические, простые и сложные.
Гипотеза называется параметрической, если в ней содержится некоторое утверждение о значении параметра распределения известного вида.
В непараметрической гипотезе заключается утверждение обо всём распределении.
Простая гипотеза полностью определяет теоретическую функцию распределения.
Сложная гипотеза определяет область возможных значений исследуемого параметра.
Например, гипотеза «вероятность успеха в одном испытании Бернулли равна » - простая; гипотеза «вероятность успеха в одном испытании Бернулли меньше, чем » - сложная.
Обычно выделяют некоторую основную (нулевую) гипотезу Н0. Наряду с ней рассматривают конкурирующую (альтернативную) гипотезу Н1, являющуюся логическим отрицанием основной.
Статистический критерий – это правило, по которому нужно принять или опровергнуть выдвинутую гипотезу.
Т.е. статистический критерий представляет собой такое правило, по которому устанавливается, при каких результатах выборочного обследования основная гипотеза не может быть отклонена, а при каких от неё необходимо отказаться.
Суть проверки статистической гипотезы заключается в следующем: используется специально составленная статистика (некоторая функция от выборки), точное или приближенное распределение которой известно. Множество возможных значений статистики делится на две взаимно дополняющих области:
W - область отклонения выдвинутой гипотезы или критическая область критерия;
- область принятия гипотезы или область допустимых значений статистики.
При этом возможны 4 случая (табл. 3):
Таблица 3
Основная гипотеза
Принимается
Отвергается
Верна
Правильное решение
Ошибка -го рода
Неверна
Ошибка -го рода
Правильное решение
Вероятности ошибок и рода однозначно определяются выбором критической области.
Будем обозначать вероятность ошибки I-го рода через . Вероятность ошибки -го рода обозначим .
Применяя юридическую терминологию, можно интерпретировать величины и следующим образом:
- вероятность вынесения судом обвинительного приговора, когда на самом деле обвиняемый невиновен;
- вероятность вынесения судом оправдательного приговора, когда на самом деле обвиняемый виновен.
Вероятность отвергнуть гипотезу, когда она верна, называют уровнем значимости критерия, т.е. это вероятность совершить ошибку I-го рода.
Обычно уровень значимости принимают равным: 0,05; 0,01; 0,005; 0,001.
Вероятность 1- отвергнуть гипотезу, когда она не верна, т.е. не допустить ошибку -го рода, называются мощностью критерия.
Уменьшая уровень значимости , мы снижаем вероятность появления ошибки первого рода. Однако, если основная гипотеза не верна, то, уменьшая , мы увеличиваем область допустимых значений и, соответственно, вероятность появления ошибки второго рода .
Стремление увеличить мощность критерия 1- при неизменном объёме выборки приводит к расширению критической области, то есть повышает вероятность ошибки первого рода .
Одновременно уменьшить вероятности и можно, лишь увеличивая объём выборки n.
Если же объём выборки фиксирован, то при равных выбирают тот критерий, где меньше . То есть критическая область критерия должна быть такой, чтобы при заданном уровне значимости мощность критерия 1- была максимальной.
Задача построения наиболее мощного критерия для простой гипотезы решается с помощью леммы Неймана – Пирсона:
Среди всех критериев заданного уровня значимости , проверяющих простую гипотезу Н0 против альтернативы Н1, критерий отношения правдоподобия является наиболее мощным.
Рассмотри применение этой леммы.
Так как гипотеза является простой, то можно однозначно определить функцию правдоподобия при основной и альтернативной гипотезах:
…
Чем правдоподобнее выборка в условиях гипотезы Н1, тем больше L1 по сравнению с L0, следовательно больше отношение L1/L0. В качестве критической области выбирают область больших значений ln[L1/L0].
Границу критической области вычисляют исходя из конкретного вида распределения и заданного уровня значимости. Построенный таким образом (по лемме Неймана – Пирсона) критерий будет наиболее мощным.
Точка, разделяющая критическую область и область принятия нулевой гипотезы, называется критической.
При заданном уровне значимости критическая область (т.е. область отклонения выдвинутой гипотезы) может быть односторонняя (правосторонняя, левосторонняя) или двусторонняя в зависимости от вида альтернативной гипотезы
Рис.5.Типы критических областей
Общий порядок проверки статистических гипотез
1. Формулируется основная (проверяемая) и альтернативная гипотезы.
2. Выбирается статистический критерий для проверки справедливости основной гипотезы.
3. Определяются критическая область и область допустимых значений, значения статистики критерия в критических точках
4. По результатам статистического исследования подсчитывается фактическое значение статистики критерия.
5. На основе сравнения фактического и критического значений статистики критерия делается вывод о правдоподобности или необходимости отклонения выдвинутой гипотезы.
Схема проверки статистической гипотезы не даёт точного вывода о её верности или неверности, так как принятие гипотезы всегда происходит на некотором субъективно принятом уровне надёжности и основывается на значении статистики, построенной по конечной выборке.
Принятие основной гипотезы не означает, что она является единственно подходящей, просто она не противоречит выборочным данным. Однако таким же свойством могут обладать и другие гипотезы.
Проверка гипотез о законе распределения
Критерии согласия относительно закона распределения
При проверке статистических гипотез не всегда есть основание высказать альтернативную гипотезу в явном виде. Часто имеется в виду просто невыполнение основной гипотезы.
В этом случае требуется выяснить, согласуются ли данные с основной гипотезой или противоречат ей. Критерии, которые позволяют это сделать, называют критериями согласия.
Анализируя выборочные данные: эмпирические частоты и гистограмму (или полигон), можно высказать предположение о виде закона распределения генеральной случайной величины Х.
При этом в виду ограниченного числа наблюдений, опытный (эмпирический) закон распределения будет в какой - то мере отличаться от предполагаемого, даже если предположение о законе распределения сделано правильно.
В связи с эти возникает необходимость решать следующую задачу: является ли расхождение между опытным и предполагаемым законами распределения следствием ограниченного числа опытов, или оно является существенным и истинное распределение отличается от предполагаемого.
Для окончательного решения вопроса о виде закона распределения в подобных случаях представляется целесообразным проверить, насколько сделанное предположение согласуется с опытом.
Так как все предположения о виде теоретического распределения – это гипотезы, а не категорические утверждения, то они, естественно должны быть подвергнуты статистической проверке с помощью критериев согласия относительно закона распределения.
Критерии согласия, опираясь на установленный закон распределения, дают возможность установить, когда расхождение между эмпирическими и теоретическими частотами следует признать несущественными (случайными), а когда – существенными (неслучайными).
Таким образом, критерии согласия позволяют отвергнуть или подтвердить правильность выдвинутой гипотезы о виде распределения в эмпирическом ряду и дать ответ, можно ли принять для данного эмпирического распределения модель, выраженную некоторым теоретическим законом распределения.
Существует ряд критериев согласия проверки гипотезы о виде распределения.
Критерий согласия 2 (хи-квадрат) Пирсона является одним из основных статистических критериев. Этот критерий был предложен английским математиком Карлом Пирсоном (1857 – 1936) для оценки существенности расхождения между частотами эмпирического и теоретического распределений.
Сформулируем постановку задачи. Дана выборка (Х1 , Х2 , ... , Хn ) объёма n. Основная гипотеза состоит в том, что эта выборка произведена из совокупности, имеющей некоторое заданное распределение.
Основная гипотеза может быть простой (т.е. функция распределения определена однозначно) или параметрической (функция распределения зависит от к неизвестных параметров).
Процедура проверки гипотезы о виде распределения с помощью критерия 2 Пирсона состоит из 5 этапов.
1.Весь диапазон значений генеральной случайной величины Х разбивают на интервалы: 1 , 2 , ... , m без общих точек и подсчитывают число наблюдений, попавших в каждый интервал (интервалы выбирают так, чтобы в каждый попало не менее 5 наблюдений).
2. Предположив справедливость основной гипотезы, подсчитывают вероятность попадания в каждый интервал:
pi=P {Xi |H0 } ; i=1, 2, …, m.
3. При проверке параметрической гипотезы о виде распределения параметры распределения оказываются неизвестными, поэтому их заменяют наилучшими оценками по имеющейся выборке.
Составляют статистику критерия:
Здесь k – число неизвестных параметров распределения.
4. Обоснуем выбор статистики. Относительная частота попадания в интервал i - является состоятельной оценкой для pi - вероятности попадания в этот интервал (согласно закону больших чисел). Таким образом, если проверяемая гипотеза истинна, то разность должна быть мала, следовательно, и вся сумма должна быть мала. Следовательно, если значение статистики велико, то гипотезу надо отвергнуть. Таким образом, статистика критерия характеризует отклонение теоретических данных от гипотетических.
5. Задавшись уровнем значимости (то есть вероятностью отвергнуть основную гипотезу, если на самом деле она верна) , строят критическую область, используя следующую предельную теорему.
Теорема Пирсона: при выполнении основной гипотезы распределение статистики критерия сходится к 2 распределению с m – к – 1 степенью свободы.
Критическая область – это область больших значений статистики критерия. Критическое значение – 2кр - квантиль уровня 1- распределения 2 с m – к – 1 степенью свободы.
Если значение статистики критерия меньше критического значения:
то гипотезу принимают. В этом случае говорят, что выборочные данные согласуются с гипотезой или не противоречат ей.
Если значение статистики критерия больше (или равно) критическому значению:
то гипотезу отвергают. В этом случае говорят, что выборочные данные не согласуются с гипотезой или противоречат ей.
Приведём небольшую таблицу для определения критических значений критерия 2 Пирсона при двух заданных уровнях значимости.
Таблица 4
Уровень значимости
Число степеней свободы
1
2
3
4
5
7
9
11
15
0,05
3,84
5,99
7,82
9,49
11,1
14,1
16,9
19,7
25,0
0,01
6,64
9,21
11,3
13,3
15,1
18,5
21,7
24,7
30,6
При использовании данной методики требуется, чтобы объём выборки n>50.
Лекция 3
3.1. Модели факторного, дисперсионного и регрессионного анализа. Основные понятия дисперсионного анализа
Первоначально дисперсионный анализ был предложен Рональдом Фишером (1890 – 1962) в 1925 году для обработки результатов агрономических опытов по выявлению условий, при которых испытываемый сорт сельскохозяйственной культуры даёт максимальный урожай.
Современные приложения дисперсионного анализа охватывают широкий круг задач техники, экономики, социологии и биологии.
В настоящее время дисперсионный анализ определяется как статистический метод, предназначенный для выявления влияния отдельных факторов на результат эксперимента.
Дисперсионный анализ часто используется для выявления влияния на изучаемый показатель некоторых факторов, обычно не поддающихся количественному измерению.
Модели дисперсионного анализа в зависимости от числа факторов, влияние которых изучается, подразделяются на однофакторные, двухфакторные и т.д.
По цели исследования выделяют детерминированные, случайные и смешанные модели.
В детерминированной модели уровни всех факторов заранее фиксированы и проверяют именно их влияние.
В случайной модели уровни каждого фактора получены как случайная выборка из генеральной совокупности уровней фактора.
В смешанной модели уровни одних факторов заранее фиксированы, а уровни других – случайная выборка.
Изучаемую случайную величину Х (на которую влияют один или несколько факторов) в дисперсионном анализе называют результативным признаком.
Суть метода дисперсионного анализа состоит в разложении общей вариации изучаемого показателя на части, соответствующие раздельному и совместному влиянию факторов, и статистическом изучении этих частей с целью выяснения приемлемости гипотез о существовании влияний факторов.
Рассмотрим сначала подробно однофакторную модель дисперсионного анализа.
Пусть имеется результативный признак Х и фактор А, с уровнями А1, А2, ..., Аr. При i – ом уровне фактора А (где i меняется от 1 до r) случайная величина Х приняла значения
В основе дисперсионного анализа лежит следующая вероятностная модель:
где - математическое ожидание случайной величины Х;
- эффект влияния уровня Аi на результативный признак;
- случайный остаток, отражающий влияние всех остальных (неучтённых) факторов.
Основными предположениями дисперсионного анализа являются два следующих.
1) Остатки взаимно независимы для любых i и j.
2) Распределение остатков является нормальным и не зависит от i и j,
Величины могут быть как постоянными (для детерминированной модели), так и случайными (для случайной модели). В последнем варианте полагают независимыми друг от друга и от случайных остатков.
В любой модели зависимость от уровня фактора i указывает на влияние фактора на результативный признак, и следовательно, если не зависят от уровня фактора i, то это говорит о том, что фактор А не влияет на результирующий признак Х.
Целью исследования является выяснение изменчивости величин в зависимости от уровня фактора, в частности, гипотеза об их равенстве. Если a1=a2=…=aγ, то можно сделать вывод о том, что фактор А не влияет на результирующий признак Х.
Основная идея дисперсионного анализа основана на разложении суммы квадратов отклонений.
Исходными данными в дисперсионном анализе являются r групп наблюдений над случайной величиной Х (группа характеризуется определенным значением фактора):
…
Общее количество наблюдений (объем выборки):
Оценкой математического ожидания (согласно методу моментов) генеральной случайной величины Х является среднее арифметическое всех выборочных значений:
Оценкой дисперсии (по методу моментов) генеральной случайной величины Х является нормированная сумма квадратов:
Основная идея дисперсионного анализа заключается в разбиении последней суммы квадратов отклонений на несколько компонент, каждая из которых соответствует предполагаемой причине изменения значений .
Оценка условного математического ожидания - это среднее арифметическое выборочных данных в i-ой группе:
.
Оценка условной дисперсии ):
Можно показать, что справедливо тождество для суммы квадратов отклонений:
Разделив все части этого равенства на n, получим:
В левой части написанного равенства стоит S2 - оценка дисперсии генеральной случайной величины Х, в правой части – два слагаемых.
Второе слагаемое в правой части – это нормированная сумма квадратов между группами, которая является дисперсией групповых средних, ее называют межгрупповой дисперсией:
Межгрупповая дисперсия отражает влияние фактора А на генеральную случайную величину Х.
Первое слагаемое в правой части, нормированная сумма квадратов внутри групп, представляет собой среднюю из групповых дисперсий, ее называют внутригрупповая дисперсия:
Внутригрупповая дисперсия отражает влияние остаточных факторов (не включенных в модель).
Итак, получено правило сложения дисперсий:
- общая дисперсия наблюдений равна сумме внутригрупповой дисперсии и межгрупповой дисперсии.
Факторный анализ – раздел корреляционного анализа, позволяющий провести отбор факторов модели.
Основной задачей корреляционного анализа является выявление статистической зависимости между случайными переменными (факторами) путём оценок различных коэффициентов корреляции.
При функциональной зависимости между величинами y=f(x), которую изучает математический анализ, каждому значению независимой переменной х соответствует определённое значение величины у.
В теории вероятностей и математической статистике изучается, как правило, стохастическая зависимость между случайными величинами, когда одному и тому значению х может соответствовать в зависимости от случая различные значения величины y. При стохастической зависимости величины не связаны функционально, но как случайные величины связаны совместным распределением вероятности.
Наличие стохастической зависимости объясняется тем, что на результирующую переменную Y действует на только контролируемый фактор Х, но и множество других неконтролируемых случайных факторов.
Корреляционной зависимостью между переменными называется функциональная зависимость между значениями одной из них и условным математическим ожиданием другой.
Корреляционная зависимость может быть представлена в виде:
При изучении по выборке корреляционной зависимости двух случайных величин Х и Y, сначала на координатной плоскости изображают все выборочные точки . Это изображение называют корреляционным полем.
Рис.6.Пример корреляционного поля
Иногда уже по виду корреляционного поля можно сделать предварительные выводы о связи между случайными переменными X и Y.
Затем составляют корреляционную таблицу:
Таблица 5
Возможные значения
… …
Всего
…
…
… …
……………………………
… …
……………………………
… …
…
…
Всего
… …
n
где nij- частота, с которой пара (xi , yj) встретилась в выборке;
для непрерывных распределений в качестве xi и yj берут середины интервалов группировки.
Корреляционная таблица является основой для всех последующих вычислений.
Методы корреляционного анализа дают хорошие результаты в том случае, когда данные эксперимента можно считать выбранными из совокупности, распределённой по многомерному нормальному закону.
Коэффициент корреляции и гипотеза о значимости связи.
Коэффициент корреляции между случайными переменными X и Y определяется как
.
Его оценкой является выборочный коэффициент корреляции, который можно вычислить как: где
– выборочное среднее произведение величин Х и Y,
– выборочное среднее значение случайной величины Х,
– выборочное среднее значение случайной величины Y,
– выборочная дисперсия случайной величины Х,
– выборочная дисперсия случайной величины Y,
Выборочный коэффициент корреляции обладает свойствами, аналогичными свойствам теоретического коэффициента корреляции:
1) Коэффициент корреляции принимает значения из промежутка
[-1; 1] .
2) Если переменные Х и Y умножить на одно и то же число, то коэффициент корреляции не измениться.
3) Если , то корреляционная связь между переменными представляет собой линейную зависимость.
После вычисления выборочного коэффициента корреляции проверяют гипотезу о значимости связи, так как выборочный коэффициент корреляции, как правило, не совпадает с теоретическим коэффициентом корреляции и может не равняться нулю из–за отбора переменных в выборку.
Обычно проверяется основная гипотеза об отсутствии корреляционной связи.
0 против альтернативы .
В случае справедливости основной гипотезы Н0 статистика
имеет распределение Стьюдента с n-2 степенями свободы.
Считают, что выборочный коэффициент корреляции значимо отличается от нуля, если значение статистики по модулю больше критического
,
где - критическое значение распределения Стьюдента, определённое на уровне значимости при числе степеней свободы, равном (т.е. квантиль уровня распределения Стьюдента с степенями свободы).
Введение в регрессионный анализ
Первоначально термин «регрессия» был употреблён Ф. Гальтоном (1886) в теории наследственности в следующем специальном смысле. «Возвратом к среднему состоянию» (regression to mediocrity) было названо явление, состоящее в том, что дети тех родителей, рост которых превышает среднее значение на а единиц, имеют в среднем рост, превышающий среднее значение, меньше, чем на а единиц.
Регрессионная зависимость является частным случаем стохастической зависимости и подразумевает зависимость среднего значения величины Y от другой случайной величины Х (одномерной или многомерной).
Регрессионная зависимость Y от Х проявляется в изменении средних значений Y при изменении Х, хотя при каждом фиксированном значении Х=х величина Y остаётся случайной величиной с определённым распределением.
Регрессия случайной величины Y по Х – это условное математическое ожидание Y, вычисленное при условии, что случайная величина Х приняла значение, равное х:
В математической статистике имеют дело с оценками соответствующих вероятностных характеристик, поэтому в качестве оценки условного математического ожидания принимают условное среднее. Если при каждом значении наблюдается значений величины y , то зависимость средних арифметических
от и является регрессией в статистическом понимании этого термина.
Если число наблюдений, соответствующее некоторым значения Х недостаточно велико, то такой метод может привести к ненадёжным результатам.
Уравнение в котором х играет роль «независимой» переменной, называют уравнением регрессии, а соответствующий график – линией или кривой регрессии.
Линия регрессии может быть приближенно восстановлена по достаточно обширной корреляционной таблице: за приближенное значение принимают среднее из тех наблюдённых значений Y , которым соответствует значение Х = х.
Для выяснения вопроса, насколько хорошо регрессия передаёт изменение Y при изменении Х, используется условная дисперсия Y при данном значении Х = х – дисперсия Y относительно линии регрессии (мера рассеяния относительно линии регрессии):
.
При точной функциональной зависимости величина Y при данном Х=х принимает лишь одно определённое значение, то есть рассеяние вокруг линии регрессии равно нулю. Таким образом, если при всех значения х, то можно с достоверностью утверждать, что Y и Х связаны строгой функциональной зависимостью. Если ни при каком значении х и y(x) не зависит от x, то говорят, что регрессия Y по Х отсутствует.
Наиболее простым является тот случай, когда регрессия Y по Х линейна:
( числа a и b называют коэффициентами регрессии).
Коэффициенты линейной регрессии вычисляют по формулам:
, .
Здесь , , , , .
Если двумерное распределение Y и Х нормально, то линия регрессии Y по Х (так же как и Х по Y) является прямой с уравнением
.
В этом случае корреляционное отношение совпадает с коэффициентом корреляции и условная дисперсия не зависит от х (является постоянной величиной): .
Следовательно, коэффициент корреляции полностью определяет степень концентрации распределения вблизи линии регрессии.
Если регрессия Y по Х отлична от линейной, то уравнение
.
является линейным приближением истинного уравнения регрессии.
Коэффициенты регрессии обычно неизвестны, и их оценивают по выборочным данным:
Линейная функция
определяет эмпирическую линию регрессии, которая служит статистической оценкой неизвестной истинной линии регрессии.
Рассеяние вокруг линии регрессии можно оценить, используя эмпирическую среднюю дисперсию относительно линии регрессии:
Этот метод, в предположении нормальной распределённости результатов наблюдений, даёт, в некотором смысле, оптимальные результаты и позволяет проводить экстраполяцию (прогнозирование) значений величины Y по имеющимся значениям величины Х.
Часть 2. Основы математического программирования и теории оптимизации
Лекция 4
4.1. Математическое программирование
Методы математического программирования представляют собой класс моделей, применяемых для формализации задач планирования целенаправленной деятельности, предусматривающих распределение ограниченного количества ресурсов разных видов. Подобного рода задачи решаются в различных отраслях деятельности: в экономике, при разработке проектов, составлении расписаний, планировании военных операций и т.п. Модели математического программирования относятся к категории детерминированных моделей. Термин программирование в применении к рассматриваемому типу задач понимается как поиск наилучших планов (от английского слова programming – составление плана, программы действий). Когда говорят о задачах математического программирования, имеют в виду задачи, цель которых состоит в повышении эффективности промышленных, транспортных систем, систем управления деятельностью учебных, проектных, научных организаций.
В общем виде задача математического программирования формулируется так: найти значения переменных составляющих оптимум заданной в общем случае нелинейной функции:
при выполнении системы ограничений, задаваемых в общем случае нелинейными функциями. Ограничения могут быть заданы как в форме равенств, так и неравенств.
Математическое программирование подразделяется на линейное, целочисленное, нелинейное, динамическое программирование.
Рассмотрим некоторые постановки задач, методы и алгоритмы их решения.
Математические постановки задач, приводящие к моделям линейного программирования
Задачи линейного программирования относятся к категории оптимизационных. Многие распространенные классы задач системного анализа, в частности, задачи оптимального планирования, распределения различных ресурсов, управления запасами, календарного планирования, межотраслевого баланса укладываются в рамки моделей линейного программирования. Несмотря на различные области приложения, данные задачи имеют единую постановку:
Найти значения переменных , доставляющие оптимум заданной линейной формы:
при выполнении системы ограничений, представляющих собой также линейные формы.
4.2. Задача об оптимальном использовании ресурсов
Имеется видов ресурсов в количествах и q видов изделий. Задана матрица , где характеризует нормы расхода - гo ресурса на единицу - гo изделия .
Эффективность выпуска единицы -го изделия характеризуется показателем , удовлетворяющим условию линейности. Требуется определить план выпуска изделий (оптимальный ассортимент), при котором суммарный показатель эффективности принимает наибольшее значение.
Обозначим количество единиц j- го изделия, выпускаемых предприятием, через , тогда математическая модель задачи будет иметь следующий вид:
Определить максимум линейной формы:
при ограничениях на ресурсы .
Кроме указанных ограничений по ресурсам в модель могут быть введены дополнительные ограничения на планируемый выпуск продукции , условия комплектности изделий и т.п.
4.3. Транспортная задача
В некоторых пунктах находятся склады, в которых хранятся товары в количествах соответственно. В пунктах находятся потребители, которым необходимо поставить эти товары в количествах, не меньших, чем соответственно. Обозначим через стоимость перевозки единицы груза из пункта в пункт , - количество товара, перевозимого из пункта в пункт . Для того, чтобы удовлетворить запросы потребителей, необходимо, чтобы выполнялась система неравенств
С другой стороны, необходимо учитывать, что с i-гo склада нельзя вывезти больше продукта, чем там имеется. Следовательно, должна выполняться еще одна система .
Удовлетворить сформулированным условиям можно бесконечным числом способов. Для того, чтобы выбрать оптимальное правило перевозок, необходимо сформулировать критерий, который будет отражать представления о цели функционирования транспортного предприятия. В данной задаче одним из возможных критериев может выступать стоимость перевозок, тогда вид функционала будет определяться очевидным образом:
Таким образом, рассмотрены задачи, математическая формулировка которых описывается схожими моделями, а именно, и оптимизируемый функционал, и ограничения представляют собой линейные формы некоторых переменных. Рассмотрим подходы к решению такого типа задач.
Постановка задачи линейного программирования .
Задачи линейного программирования (ЗЛП) - простейший тип оптимизационных задач. Постановка данной задачи выглядит следующим образом. Имеется множество переменных . Целевая функция линейно зависит от управляемых параметров:
Имеются ограничения - неравенства, которые задаются с помощью линейных форм:
Задача линейного программирования формулируется так: определить максимум линейной формы
при условии, что точка (принадлежит некоторому множеству D, которое определяется системой линейных неравенств
При этом предполагается, что .
Любое множество значений , которое удовлетворяет указанной выше системе неравенств, является допустимым решением данной задачи.
Если при этом выполняется неравенство
для всего множества значений , то значение - является оптимальным решением задачи линейного программирования.
Задачу линейного программирования удобно представлять в векторной форме, тогда она будет выглядеть следующим образом:
при условии ,
где представляет собой n – мерный вектор, составленный из коэффициентов целевой функции, причем - транспонированная вектор-строка; - n-мерный вектор переменных решений;
- n- мерный вектор свободных членов ограничений;
матрица А размерности (m х n), составленная из коэффициентов всех линейных ограничении:
Простые ЗЛП допускают геометрическую интерпретацию, позволяющую получить решение непосредственно из анализа графиков функций и проиллюстрировать идею решения более сложных задач линейного программирования.
Каноническая форма задачи линейного программирования
Любую задачу линейного программирования можно свести к некоторой стандартной форме с ограничениями, записанными в виде уравнений. Это достигается путем введения так называемых свободных (дополнительных) переменных во все ограничения - неравенства. Свободная переменная учитывает разницу между правой и левой частями неравенства.
Пусть
- дополнительная переменная, которая численно равна:
- дополнительная переменная, которая численно равна:
…
- дополнительная переменная, которая численно равна:
В результате получаем новую систему ограничений:
Целевая функция будет иметь вид
Или в матричной форме:
при условии
где - вектор первоначальных переменных; - вектор свободных переменных; P - единичная матрица размерности .
При записи задачи линейного программирования в стандартной или канонической форме число линейно независимых уравнений, как правило, меньше числа переменных (на практике всегда m 0 уравнение (7.2) эллиптического типа.
При y>0 уравнение (2) гиперболического типа.
При y=0 уравнение (2) параболического типа.
7.2. Возможности аналитических методов решения
Существует два вида методов решения уравнения (7.1):
• аналитический, при котором результат выводится различными математическими преобразованиями;
• численный, при котором полученный результат соответствует действительному с заданной точностью, но который требует много рутинных вычислений и поэтому выполним только при помощи вычислительной техники (ЭВМ).
Аналитические решения уравнений (7.1) можно получить различными способами. Например: используя функцию Грина; используя метод разделения переменных Фурье; с помощью теории потенциала; используя формулу Кирхгофа.
Линейная задача о распределении тепла (задача о нагревании или охлаждении стержня)
Рассмотрим стержень, сделанный из однородного проводящего материала с плотностью ρ, теплоизолированный с боков (то есть тепло может распространяться только вдоль оси ОХ) и достаточно тонкий (это значит, что температура во всех точках любого поперечного сечения стержня одна и та же).
Рассмотрим функцию , определяющую температуру стержня в сечении x в момент времени t. Тогда уравнение теплопроводности имеет вид
,
где - коэффициент температуропроводности, С - удельная теплоемкость материала (равна количеству тепла, которое нужно сообщить 1 кг вещества, чтобы поднять его температуру на 1°С), k - коэффициент теплопроводности материала (равен количеству тепла, протекающего в секунду через стержень единичной длины и единичной площади поперечного сечения при разности температур на противоположных концах, равной 1°С).
В случае, когда внутри стержня имеются источники тепла, непрерывно распределенные с плотностью q(x,t), получится неоднородное уравнение теплопроводности
где , S- площадь поперечного сечения.
Определим начальные условия и граничные условия.
Для уравнения теплопроводности задается одно начальное условие (). Оно определяет температуру во всех точках стержня в начальный момент времени.
Граничные условия показывают тепловой режим на концах стержня. Условия первого рода
и
означают, что на концах стержня задана температура. Если она не изменяется со временем, то где - постоянные. Если концы поддерживаются все время при нулевой температуре, то Т1= Т2 = 0 и условия будут однородными.
Граничные условия второго рода
и
определяют тепловой поток на концах стержня. В частности, если , то условия становятся однородными. Физически они означают, что через концы не происходит теплообмен с внешней средой (эти условия еще называют условиями теплоизоляции концов).
Решение начально-краевой задачи для уравнения теплопроводности
Рассмотрим однородную начально-краевую задачу для уравнения теплопроводности.
Найти решение уравнения
,
(7.3)
удовлетворяющее граничным условиям
, t>0,
(7.4)
и начальному условию
, .
(7.5)
Решим эту задачу методом, предложенным французским математиком Ж.Б.Фурье (его еще называют методом разделения переменных). Основная идея этого метода состоит в том, что решение задачи для уравнения второго порядка в частных производных сводится к решению двух обыкновенных дифференциальных уравнений первого порядка.
Будем искать решения уравнения (7.3) в виде произведения
Найдем частные производные:
, .
Подставим эти производные в уравнение и разделим переменные:
.
Так как в левой части уравнения у нас находится функция, зависящая только от t, а в правой — только от x, то, фиксируя любое значение x в правой части, получаем, что для любого t значение левой части уравнения постоянно. Таким же образом можно убедиться, что и правая часть постоянна, то есть равна некой константе (минус взят для удобства).
.
Таким образом, мы получаем два обыкновенных линейных дифференциальных уравнения:
a)
б)
Теперь можно решить каждое из этих обыкновенных дифференциальных уравнений. Обратим внимание на то, что используя граничные условия (7.4), можно искать не общее решение уравнения б), а частные решения, удовлетворяющие соответствующим граничным условиям:
Учитывая, что (в противном случае мы имели бы решение , а мы ищем только нетривиальные решения), получаем:
Решим задачу Штурма-Лиувилля
, .
Её решение сводится к решению линейного дифференциального уравнения и рассмотрению трёх случаев:
1. λ < 0. В этом случае общий вид решения будет следующим:
.
Подставив граничные условия, мы убедимся, что решение будет , а мы ищем только нетривиальные решения, следовательно, этот случай не подходит.
2. λ = 0. Общий вид решения .
Несложно убедиться, что этот вариант нам также не подходит, здесь только тривиальное решение.
3. Общий вид решения λ > 0..
Подставим граничные условия:
, .
Так как мы ищем только нетривиальные решения, нам не подходит, следовательно ,
Отсюда собственные значения ,
а собственные функции .
Подставим собственные значения в уравнение а) и решим его:
.
.
Выпишем частные решения уравнения (7.3):
=
(7.6)
В силу линейности и однородности уравнения (7.3) их линейная комбинация
u(x,t) =
(7.7)
также будет решением этого уравнения, причем функция u(x,t) удовлетворяет и граничным условиям (7.4).
Определим коэффициенты An в (7.7), используя начальное условие (7.5):
(7.8)
Приходим к тому, что начальная функция разлагается в ряд Фурье по собственным функциям задачи Штурма-Лиувилля. По теореме Стеклова такое разложение возможно для функций, удовлетворяющих граничным условиям и имеющих непрерывные производные второго порядка. Коэффициенты Фурье находятся по формулам
Вычислив эти коэффициенты для конкретной начальной функции φ(x) и подставив их значения в формулу (7.7), мы тем самым получим решение задачи (7.3)-(7.5).
Замечание. Используя формулу (7.7), можно получить решение первой начально-краевой задачи для уравнения . Оно будет иметь вид
,
где
7.3 Устойчивость решений
Решение дифференциального уравнения называется устойчивым, если поведение решений с условиями, близкими к начальным, «не сильно отличается» от поведения исходного решения. Слова «не сильно отличается» при этом можно формализовать по-разному, получая разные формальные определения устойчивости: устойчивость по Ляпунову, асимптотическую устойчивость и т.д.
Лекция 8
8. Численные и численно-аналитические методы расчета строительных конструкций
8.1. Введение
8.1.1. Метод конечных разностей
Метод конечных разностей (МКР) заключается в следующем. Область определения краевой задачи покрывается сеткой. В каждом узле сетки производные соответствующего дифференциального уравнения заменяются разностными аналогами (во внутренних узлах – аналоги дифференциального уравнения, определенного внутри области, в граничных узлах – аналоги краевых условий). Таким образом, переходим к системе линейных алгебраических уравнений относительно значений неизвестной функции в узлах сеточной области. Далее, полученная система уравнений, как правило, легко может быть решена с использованием стандартных методов.
При переходе от аналитической краевой задачи к ее конечноразностному аналогу необходимо следить за тем, чтобы правая и левая части уравнений имели согласованную разностную аппроксимацию, а также, чтобы матрица разрешающей системы уравнений была хорошо обусловлена.
МКР эффективен в случае прямоугольной области определения краевой задачи. Когда же граница области имеет сложную конфигурацию, возникают сложности с заданием граничных условий. Некорректная аппроксимация граничных условий приводит к существенным ошибкам в решении задачи. Существуют определенные приемы, позволяющие получить достоверное решение. В частности, путем введения законтурных точек. Стремление получить результат удовлетворительной точности приводит к увеличению числа узлов сеточной области и тем самым к увеличению порядка разрешающей системы.
8.1.2. Метод конечных элементов
Суть метода конечных элементов (МКЭ) заключается в следующем. Исходная область разбивается на конечные элементы. Зависимые переменные на каждом конечном элементе аппроксимируются, как правило, кусочно-полиномиальными функциями с неизвестными параметрами. Такая аппроксимация после подстановки в определяющие уравнения приводит к построению разрешающей системы линейных алгебраических уравнений (конечноэлементных уравнений) относительно неизвестных параметров аппроксимирующих функций. Решение полученной системы дает значения этих параметров, которые полностью определяют искомые функции внутри элемента через их значения в узловых точках.
МКЭ получил широкое распространение благодаря следующим факторам: общность подхода при решении различных задач расчета конструкций, наличие большого числа универсальных расчетных программных комплексов, например, таких как ANSYS, NASTRAN, ABAQUS, SCAD, Robot Millenium, MicroFE, «Лира», «СТАДИО».
Основным недостатком МКЭ является необходимость дискретизации всего тела, приводящей к большим порядкам разрешающей системы уравнений.
8.1.3. Численно-аналитические методы
Область применения таких методов традиционно составляют строительные конструкции, здания и сооружения, в которых имеется постоянство физико-геометрических параметров (характеристик) по одному из координатных направлений (это так называемое основное или «продольное» направление). Методы являются численно-аналитическими в том смысле, что по основному направлению сохраняется континуальный характер задачи и соответственно аналитический (абсолютно точный) вид получаемого решения, в то время как по остальным производится дискретизация с использованием стандартной техники численных методов и обоснованно контролируемой степенью точности.
Численно-аналитические методы снижают размерность и объем вычислений, особенно в многомерных задачах. Эффективность методов проявляется особенно наглядно при расчете конструкций, у которых размер по основному направлению существенно превышает размеры по остальным направлениям.
8.2. Задача теплопроводности
8.2.1. Математическая формулировка задачи
Математическая постановка задачи имеет вид:
(8.1)
где – координата по длине, ; – длина объекта; – координата по времени, ; – значение температуры в точке во время ; – коэффициент температуропроводности материала объекта; – функция, характеризующая мощность возможного источника тепла.
Рис. 8. К постановке задачи теплопроводности.
Задача (1) определена в пространственно-временной области (рис. 8):
.
(8.2)
Отметим, что
; .
(8.3)
Заметим, что поскольку задача (8.1) содержит начальные условия по времени, то она является задачей Коши.
8.2.2. Решение задачи теплопроводности методом конечных разностей
Нанесем на пространственно-временную область (8.2) прямоугольную сетку. Пронумеруем узлы сетки: – номер узла по длине (ось ); – номер узла по времени (ось ). Таким образом, каждый узел сетки имеет номер, состоящий из двух компонент (мультииндекс). В свою очередь, каждый узел сетки имеет координаты .
Введем обозначения: – шаг по времени; – шаг по длине,
; ;
(8.4)
; ;
(8.5)
(8.6)
В зависимости от типа разностной схемы, принимаемой для решения задачи теплопроводности, различаются явная и неявная схемы, каждая из которых имеет свои преимущества и недостатки.
Явная схема. Заменим в дифференциальном уравнении задачи (8.1) для внутренних точек области производные конечно-разностными отношениями. Начальные и краевые условия будем рассматривать в граничных узлах сетки.
(8.7)
В результате конечно-разностной аппроксимации получаем в каждой точке сетки одно неизвестное и одно условие (граничное или разностное уравнение). Первую группу уравнений из (7) можно переписать в виде
, .
(8.8)
Таким образом (рис. 9), по этой формуле, имея значения для всех , можно вычислить значения для всех (без решения уравнений).
Рис. 9. Шаблон аппроксимации по явной схеме.
При решении по явной схеме следует учитывать фактор устойчивости счета, который накладывает ограничение на величину шага по времени в зависимости от величины шага по :
– условие устойчивости.
(8.9)
Нарушение условия устойчивости приводит к неправильному результату. Это ограничение весьма существенно при необходимости решения задачи для большого периода времени.
Матричная запись явной схемы.
В целях большей наглядности представим явную схему (8.7) в виде
, ;
, ; , .
(8.10)
Введем следующие матрицы и векторы
; ;
(8.11)
, , ,
(8.12)
Тогда явной схеме (8.10) соответствует матрично-векторное представление
, ,
(8.13)
где .
(8.14)
Неявная схема. Существует конечно-разностная аппроксимация, счет по которой не требует выполнения условия устойчивости (рис. 10).
(8.15)
Как видно из записи, аппроксимация второй производной по в правой части (8.15) осуществляется для точек -го момента времени.
Первую формулу в (8.15) можно переписать в виде
,
(8.16)
Следовательно, если все величины известны, то величины
получаем из решения системы уравнений (8.16) с учетом краевых условий:
; .
(8.17)
Таким образом, начиная с использования начальных условий
, ,
(8.18)
последовательно из решения системы уравнений (8.16) на каждом -ом шаге по времени получаем значения неизвестных для всех -ых моментов времени.
Рис. 10. Шаблон аппроксимации неявной схемы.
Преимущество неявной схемы состоит в том, что она устойчива при любом шаге по времени. Недостатком метода является необходимость решения системы уравнений на каждом шаге по времени.
Матричная запись неявной схемы.
В целях большей наглядности представим неявную схему (8.15) в виде
, ;, ; , .
(8.19)
С учетом принятых ранее обозначений (8.11)-(8.12) матрично-векторное представление системы разностных уравнений (8.19) будет иметь вид
,
(8.20)
здесь – единичная матрица -го порядка.
Обозначим
.
(8.21)
Тогда матричная запись решения на каждом шаге по времени по неявной схеме может быть представлена в виде
, ,
(8.22)
при этом
.
(8.23)
8.2.2. Численно-аналитическое решение задачи теплопроводности
Ниже рассмотрим дискретно-аналитический метод решения задачи, который состоит в следующем: по оси x осуществляется конечно-разностная аппроксимация, а по времени t рассматривается непрерывная (континуальная) задача.
Пусть , – координаты точек разбиения, причем и – граничные точки (координаты точек, в которых заданы краевые условия). Искомыми будут функции , (температура) во внутренних узлах сетки. Схема аппроксимации пространственно-временной области в данном случае условно показана на рис. 11.
Во всех внутренних точках узлах () уравнение теплопроводности в (8.1) примет вид:
,
(8.24)
Рис. 11. Пространственно-временная область:
В соответствии с краевыми условиями из (8.1) для граничных точек, в свою очередь, можем записать:
, , .
(8.25)
Следовательно, уравнения теплопроводности для узлов с номерами и имеют соответственно вид:
;
(8.26)
.
(8.27)
Введем обозначения:
; ,
(8.28)
где ; , , .
(8.29)
Получаем матричную формулировку разрешающей системы уравнений:
(8.30)
где ; ;
(8.31)
Общее решение задачи (8.30) имеет вид:
(8.32)
.
где
(8.33)
8.3 Сходимость и устойчивость численных методов
Для анализа сходимости и устойчивости численных решений рассмотрим порядок аппроксимации производных методом конечных разностей.
Для упрощения оценок предположим, что . По формуле Тейлора получим:
,
где
. (8.34)
Тогда для правой разности получим
т.е. аппроксимация первой производной правой разностью получена с точностью порядка :
(8.35)
Аналогично для левой разности
,
также получаем результат (8.35) и точность порядка .
Рассмотрим также центральную разность.
т.е. имеем аппроксимацию первой производной с точностью порядка :
(8.36)
Следовательно, центральная разность является, как правило, более точной аппроксимацией первой производной.
Установим порядок аппроксимации для второй производной. Имеем:
т.е. имеем аппроксимацию второй производной с точностью порядка :
. (8.37)
Аналогично можно установить порядок аппроксимации для любой разностной формулы.
Рассмотрим теперь понятие об устойчивости разностной схемы.
Следует отметить, что условие устойчивости, как правило, получается из дополнительных аналитических оценок и носит достаточно общий характер для широкого класса задач. Рассмотрим простой и характерный пример анализа устойчивости, связанной с выбором шага, на простом примере задачи Коши вида
, где . (8.38)
В этом случае известен вид аналитического решения
, (8.39)
из которого следует, что
. (8.40)
Разностная формула метода Эйлера численного решения задачи (8.38) имеет вид
. (8.41)
Из (8.41) следует, что
. (8.42)
Обозначим
. (8.43)
Исходя из (8.42)-(8.43), можем записать:
, (8.44)
Очевидно, что для выполнения условия требуется выполнение условия
, (8.45)
что соответствует соотношениям
или , (8.46)
откуда следуют ограничения для величины :
. (8.47)
Последнее неравенство называется условием устойчивости счета.
Абсолютно устойчивая схема. Существуют разностные схемы, обеспечивающие устойчивость счета при любом шаге . В частности, для рассматриваемого примера абсолютно устойчивой будет схема
, (8.48)
откуда
(8.49)
В этом случае
. (8.50)
Из (8.50) и (8.44) очевидно, что при любом :
и ,
т.е. такая схема устойчива при любом .
Заметим, что в общем случае (при произвольной функции ) абсолютно устойчивой разностной схеме соответствует разностное уравнение вида
. (8.51)
Из такого уравнения не всегда удается выделить (для этого может потребоваться явное решение нелинейного уравнения).
Содержание
Часть 1. Сложные системы и их стохастические модели.
Лекция 1. Системность - общее свойство материи. Понятие
сложной системы. Способы описания систем. Сбор данных о функционировании системы. Построение моделей систем.
Отражение свойств системы в математической модели. Анализ
и синтез - методы исследования систем. Проверка адекватности
моделей, анализ неопределенности и чувствительности.
Имитационное моделирование, как метод проведения системных исследований ……………………………………………………………………….3
Лекция 2. Вероятностное описание событий и процессов.
Статистическая обработка экспериментальных данных.
Оценивание показателей систем и определение их точности
методами математической статистики ………………………………………..28
Лекция 3. Модели факторного, дисперсионного и регрессионного
анализа. Основные понятия дисперсионного анализа ………………………….50
Часть 2. Основы математического программирования и теории оптимизации
Лекция 4. Математическое программирование. Решение задач линейного программирования симплекс – методом. Задача об оптимальном
использовании ресурсов. Транспортная задача…………………………………..64
Лекция 5. Дискретное программирование. Целочисленное
программирование. Динамическое программирование. Задача
управления запасами ………………………………………………………………76
Лекция 6. Концепция риска в задачах системного анализа. Принятие решений в условиях неопределенности. Проблема оптимизации и экспертные методы принятия решений…………………………………………………………………………….94
Часть 3. Элементы анализа детерминированных систем.
Лекция 7. Анализ детерминированных систем с помощью дифференциальных уравнений или их систем. Возможности аналитических методов решения. Устойчивость решений……………………………………………………….…..112
Лекция 8.Численные и численно-аналитические методы расчета строительных конструкций……………………………………………………………….…..…..122