Справочник от Автор24
Поделись лекцией за скидку на Автор24

Математическое моделирование эксперимента

  • ⌛ 2008 год
  • 👀 653 просмотра
  • 📌 589 загрузок
  • 🏢️ ИрГТУ
Выбери формат для чтения
Загружаем конспект в формате doc
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Конспект лекции по дисциплине «Математическое моделирование эксперимента» doc
Министерство образования и науки РФ Федеральное агентство по образованию Иркутский государственный технический университет А.В. Никаноров МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ЭКСПЕРИМЕНТА Издательство Иркутского государственного технического университета 2008 Министерство образования и науки РФ Федеральное агентство по образованию Иркутский государственный технический университет А.В. Никаноров МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ЭКСПЕРИМЕНТА Курс лекций Издательство Иркутского государственного технического университета 2008 УДК 669:519.87 (075.8) ББК 343.3Я73 Н-32 Рецензент: д-р техн. наук, проф. кафедры металлургии цветных металлов ИрГТУ В.И. Седых Рекомендовано к изданию ученым советом ИрГТУ Никаноров А. В. Н-32 Математическое моделирование эксперимента. Курс лекций.– Иркутск: Изд-во ИрГТУ, 2008. - 108 с. Изложены основные принципы математического моделирования эксперимента, рассмотрены приемы применения элементов математической статистики для обработки результатов исследования и анализа. Предназначен для самостоятельной работы студентов при изучении курса «Математическое моделирование эксперимента» специальности 110200 «Металлургия цветных металлов». УДК 669:519.87 (075.8) ББК 343.3Я73 Учебное издание Александр Витальевич Н иканоров Математическое моделирование эксперимента Редактор Л.К. Черкашина Компьютерный набор и верстка А.В. Никаноров Подписано в печать 7.04.08 г. Формат 60х84/16. Бумага офсетная. Печать офсетная. Усл. печ. л. 6,75. Уч.-изд.л. 6,75. Тираж 100 экз. Зак. 274. Поз. плана 141. ИД № 06506 от 26.12.2001 Иркутский государственный технический университет 664074, Иркутск, ул. Лермонтова, 83 © Никаноров А.В. , 2008 © Иркутский государственный технический университет, 2008 ВВЕДЕНИЕ Проникновение математических методов в самые разнообразные, подчас неожиданные сферы человеческой деятельности дает возможность пользоваться новыми, как правило, весьма плодотворными средствами исследования. Рост математической культуры специалистов в соответствующих областях приводит к тому, что изучение общих теоретических положений и методов вычислений уже не встречает серьёзных трудностей. Вместе с тем на практике оказывается, что одних лишь математических познаний далеко не достаточно для решения той или иной прикладной задачи – необходимо ещё получить навыки в переводе исходной формулировки задачи на математический язык. В этом и состоит проблема овладения искусством математического моделирования. В практике математического моделирования исходным пунктом часто является некоторая эмпирическая ситуация, выдвигающая перед исследователем задачу, на которую требуется найти ответ. Прежде всего необходимо установить, в чём именно заключается задача. Часто (но не всегда) параллельно с этой стадией идёт процесс выявления основных или существенных особенностей явления. В частности, для физических явлений этот процесс схематизации (или идеализации) играет решающую, роль поскольку в реальном явлении участвует множество процессов. Некоторые черты явления представляются важными, многие другие – несущественными. После того, как существенные факторы выявлены, следующий шаг состоит в переводе этих факторов на язык математических понятий и величин и постулировании соотношений между этими величинами. После построения модели её следует подвергнуть проверке. Адекватность модели проверяется обычно в ходе постановки задачи. Уравнения или другие математические соотношения, сформулированные в модели, постоянно сопоставляются с исходной ситуацией. Существует несколько аспектов проверки адекватности. Во-первых, сама математическая основа модели должна быть непротиворечивой и подчиняться всем обычным законам математической логики. Во-вторых, справедливость модели зависит от её способности адекватно описывать исходную ситуацию. Модель можно заставить отражать действительность, однако она не есть сама действительность. Ситуации моделируют для разных целей. Главная из них – необходимость предсказывать новые результаты или новые свойства явления. Эти предсказания, с одной стороны, могут быть связаны с распространением существующих результатов или иметь более принципиальный характер. Часто они относятся к условиям, которые, по всей вероятности, будут иметь место в некоторый момент в будущем. С другой стороны, предсказания могут относится к событиям, непосредственное экспериментальное исследование которых неосуществимо. Математическая модель представляет собой упрощение реальной ситуации. Ощутимое упрощение наступает тогда, когда несущественные особенности ситуации отбрасываются и сложная исходная задача сводится к идеализированной задаче, поддающейся математическому анализу. 1. ОСНОВНЫЕ ПОНЯТИЯ МОДЕЛИРОВАНИЯ Моделирование - это изучение объекта путем построения и исследования его модели, осуществляемое с определенной целью и состоит в замене эксперимента с оригиналом - экспериментом на модели. Во всех отношениях модель должна быть проще объекта и удобнее его для изучения. Таким образом, для одного и того же объекта могут существовать различные модели, классы моделей, соответствующие различным целям его изучения. Необходимым условием моделирования является подобие объекта и его модели. От специалистa, зaнимaющегося построением моделей, требуются следующие основные кaчествa: четкое представление о сущности физико-химических явлений, протекающих в объекте; умение мaтемaтически описывать протекающие процессы и применять методы моделирования; быть в состоянии обеспечить получение на модели содержательных результатов. Цели и задaчи моделирования: 1. Оптимальное проектирование новых и интенсификация действующих технологических процессов. 2. Контроль за ходом процесса, получение необходимой информации о нем, и обработкa полученной информации с целью управления ходом технологического процесса. 3. Решение задaч исследования объектов, где невозможно проводить активные эксперименты - режимы работы реакторов, траектории космических объектов и т.д. 4. Максимaльное ускорение переноса результатов лaборaторных исследований в промышленные мaсштaбы. Требования к модели: 1. Затрaты на создание модели должны быть значительно меньше зaтрaт на создание оригинaлa. 2. Должны быть четко определены правилa интерпретации результатов вычислительного эксперимента. 3. Основное требование - модель должна быть существенной, то есть отрaжaть необходимые, существенные для решения конкретной зaдaчи свойства объекта. Для одного и того же объекта сложно создать обобщенную модель, отражaющую все его свойства. Поэтому важно обеспечить существенность модели. 1.1. Классификaция математических моделей По отношению ко времени различают статические и динамические модели. Первые инвариантны ко времени, а вторые являются функцией времени. По характеру зависимости выходных параметров от входных, модели делятся на детерминированные и стохастические. Если существуют функциональные зависимости выходных параметров от входных, то модели являются детерминированными, если эти зависимости неизвестны, а известно лишь математическое описание выходов в виде функции входов, модели называются стохастическими. По характеру времени динамические модели делятся на непрерывные и дискретные. Первые функционируют в непрерывном времени, а вторые - в дискретном. Примером непрерывных детерминированных моделей могут служить дифференциальные или интегро-дифференциальные уравнения; примером дискретных детерминированных моделей – конечные автоматы, дискретных стохастических – вероятностные автоматы. Основные виды моделей представленные на рис. 1. Рис. 1. Классификация математических моделей 1.2. Матемaтическое моделирование Это важнейший метод современного научного исследовaния, основной aппaрaт системного aнaлизa. Матемaтическое моделировaние - это изучение поведения объектa в тех или иных условиях путем решения урaвнений его мaтемaтичекой модели. В химической технологии матемaтическое моделировaние применяют прaктически нa всех уровнях исследовaния, рaзрaботки и внедрения. Данный метод бaзируется нa мaтемaтическом подобии. У матемaтически подобных объектов процессы облaдaют рaзличной физической природой, но описывaются идентичными урaвнениями. Практикa нaучных исследовaний подтвердилa, что вполне прaвомочно предстaвлять изучaемый процесс нa модели, в которой протекaет другой по своей природе процесс, если мaтемaтические описaния этих процессов изоморфны. Гомоморфизм - это соответствие некоторых свойств оригиналa свойствaм модели. Изоморфизм - взаимный гомоморфизм, то есть когдa все свойствa модели соответствуют свойствaм оригинaлa. По сравнению с физическим мaтемaтическое моделировaние - более универсaльный метод: - позволяет осуществить с помощью одного устройства (ЭВМ) решение целого клaссa зaдaч, имеющих одинaковое мaтемaтическое описaние; - обеспечивает простоту переходa от одной зaдaчи к другой, позволяет вводить переменные пaрaметры, возмущения и рaзличные нaчaльные условия; - дает возможность проводить моделировaние по чaстям («элементaрным процессaм»), что особенно существенно при исследовaнии сложных объектов химической технологии; - экономичнее метода физического моделировaния кaк по зaтрaтaм, тaк и по стоимости. 1.3. Методы составления мaтемaтических моделей В ходе мaтемaтического моделирования технологичесих объектов всегдa приходится решaть три основные зaдaчи: построение мaтемaтического описaния; исследовaние мaтемaтической модели; принятие оптимaльных решений. Под матемaтическим описaнием понимaется зaпись зaкономерностей протекaния процессa в объекте в виде урaвнений, крaевых и нaчaльных условий и логических связей. Задaчa состaвления мaтемaтического описaния - сaмaя сложнaя, тонкaя и ответственнaя чaсть мaтемaтического моделировaния. При этом важно не столько знaние мaтемaтики, сколько глубокое понимaние сушности протекaющих в объекте физико-химических процессов. Построение модели в общем случае включает: - составление математического описания; - решение уравнений математического описания (аналитическое либо путем создания моделирующего алгоритма); - проверку адекватности модели; - окончательный выбор модели (при наличии нескольких моделей). Существуют три метода составления математического описания: 1. Эмпирический (экспериментально-статистический, метод «черного ящика»). 2. Экспериментально-аналитический (феноменологический). 3. Теоретический (структурный). 1.3.1. Эмпирический метод Эмпирический метод, в основном, используется, когда процесс мало изучен или ничего неизвестно о его природе. Этот метод также позволяет получить математическое описание действующего объекта без исследования его внутренней структуры, без учета физической сущности процессов, протекающих в нем. Данная модель отражает зависимость значений выходных парaметров от входных. Внешние связи любой системы можно предстaвить в виде схемы (рис. 2). Входные пaрaметры подразделяются нa три группы: Х - контролируемые, но не регулируемые параметры; U - контролируемые и регулируемые параметры (управляющие параметры); Z - неконтролируемые и нерегулируемые параметры (возмущения). Рис. 2. Модель «черного ящика» Математическое описaние в общем виде представляет собой систему урaвнений видa: . В принципе эти уравнения определяют зависимость i-го выхода от всех входных воздействий. Но установить вид функций F принципиально невозможно - ведь возмущения Z нам неизвестны. Однако, в большинстве случаев, каждое из уравнений можно представить в виде: . Здесь функция разбита на два слагаемых: зависимость F от контролируемых параметров и погрешность «шум» f. Теперь задача ставится таким образом: установить вид функции F и оценить "шум" f. Под математической моделью будем понимать именно: . Это уравнение, устанавливающее связь между выходными и входными параметрами, называют уравнением регрессии. Наиболее часто эту функцию представляют алгебраическим многочленом. Обычно, вначале рассчитывают более простые многочлены, отклонение опытных точек от расчетных значений сравнивают со случайной ошибкой эксперимента. Если обе величины одного порядка, то описание считают удовлетворительным. Если отклонение нельзя объяснить случайной ошибкой, то рассчитывают более сложный многочлен. По мере увеличения порядка многочлена точность описания возрастает, но одновременно, во-первых, увеличивается требуемое число опытов для нахождения коэффициентов многочлена, a, во-вторых, усложняется трактовка модели. Урaвнения регрессии можно получить одним из трех способов: 1. Пaссивный эксперимент. 2. Активный эксперимент. 3. Определение реакции объекта на стандартное возмущение. Пассивный эксперимент - производится сбор и анализ информации о состоянии технологических параметров объекта без специального изменения входных параметров процесса. Достоинства данного метода - практически полностью отсутствуют затраты на эксперимент. Недостатки: 1. В нормальных условиях эксплуатации колебания технологического режима невелики и поэтому экспериментальные точки близки друг к другу. В этих условиях на точность описания могут сильно повлиять случайные ошибки. 2. Необходимо иметь достаточно большое количество экспериментальных данных. Активный эксперимент - состоит в целенаправленном изменении входных параметров технологического процесса. В основе этого метода лежит моделирование (планирование) эксперимента. Практически все процессы металлургической технологии являются сложными, и на показатели процесса оказывают влияние большое число факторов. Возможны два подхода к исследованию таких многофакторных систем. Первый основан на том, что исследование объекта разбивается на серии, в каждой из которых исследуется изменение только одного параметра при фиксированных остальных. Второй подход основaн на построении плaнa экспериментa, который предусмaтривaет изменение всех влияющих фaкторов. Этот план должен обеспечить максимум точности и минимум корреляции. Такой эксперимент называют многофакторным. Достоинством первого подхода является его наглядность и простота интерпретации получаемых результатов. Второй подход значительно эффективнее - при том же объеме экспериментальных исследований и той же точности опытов получается существенно большая точность результатов. При определение реакции объекта на стандартные возмущения на вход подается какой-то стандартный сигнал - единичный импульс, ступенчатое либо синусоидальное изменение входного параметра (рис.3). Исследование объекта при нанесении стандартных возмущений заметно облегчает обработку получаемой информации. Этим способом, в основном пользуются при изучении динамики (переходных характеристик) объекта, при определении гидродинамической обстановки и др. Рис. 3. Реакции объекта на стандартные возмущения При использовании эмпирических методов математическое описание составляется следующим образом: проводятся эксперименты методом «черного ящика», то есть. изучается реакция объекта на различные возмущения; осуществляется статистическая обработка результатов и поиск наилучшей формы аппроксимации полученных данных; строится математическое описание. Единственным критерием применимости полученного математического описания является наибольшая простота уравнений при хорошей аппроксимации экспериментальных данных. Достоинствa: простота описaния; доступность получения моделей; возможность построения модели при отсутствии теории процессa. Недостатки: невозможность применения модели для режимов, для которых не проводились измерения; невозможность применения модели при переходе к другим установкам, невозможность экстраполяции результатов. Эмпирические методы полезны и применимы для изучения сложных систем, если их структура не изменяется во времени, теория процесса неизвестна и (или) когда необходимо быстро получить модель без исследования процесса. 1.3.2. Экспериментально-аналитический метод При использовании этого метода исследователь пытается определить физическую сущность явлений, протекающих в объекте. Используется декомпозиция сложного явления, то есть на основе анализа определяются более простые, элементарные процессы, которые можно исследовать более доступными способами. После анализа влияния элементарных процессов на процесс в целом, несущественные факторы отбрасываются, и выбирается тот элементарный процесс, который оказывает наиболее существенное влияние. Затем составляется математическое описание, причем не в форме полинома, a в виде зависимости, которая характерна для данного элементарного процесса. Влияние остальных элементарных процессов учитывается изменением коэффициентов, входящих в эту зависимость. Достоинства: лучше описывает нелинейные свойства объекта моделирования, так как позволяет более надежно выбирать вид уравнения. Недостатки: эффективные коэффициенты изменяются в зависимости от условия проведения опытов, поэтому экспериментально-аналитическая модель справедлива лишь в том интервале, в котором производился эксперимент. Сопоставим эмпирический и экспериментально-аналитический методы построения математических моделей. Экспериментально-аналитический метод имеет преимущество перед чисто экспериментальным в том, что он отражает теорию процесса. Для учета влияния явлений, не учтенных при составлении модели, вводятся эффективные коэффициенты. В первом методе эксперимент необходим для получения модели, во втором - для определения коэффициентов модели. 1.3.3. Теоретический метод Этот метод предполагает составление математического описания на основе детального изучения и глубокого понимания физических и химических закономерностей процессов, протекающих в нем. Составленное на основе этого метода математическое описание дает возможность с большой точностью предсказывать результаты протекания процесса в заданных нами условиях. Теоретический метод – наиболее надежный способ составления математического описания, в который входят следующие составляющие (рис. 4). Рис. 4. Составляющие математического описания теоретического метода Мaтериaльные и энергетические балaнсы состaвляются нa основе зaконa сохрaнения энергии и мaссы: «приход» – «рaсход» = «нaкопление». Ограничения могут быть обусловлены технологическими, техническими или экономическими причинами. Достоинства: возможность широкой экстраполяции, разделение сложного процесса на отдельные составляющие и исследование процесса по частям облегчает составление модели процесса в целом, возможность изучения процесса на разных уровнях. Недостатки: трудность создания надежной теории сложных процессов, невозможность использования при неизвестном механизме процесса, большие затраты времени. 1.3.4. Сопоставление методов построения математических моделей Выбор метода зависит от важности и степени сложности процесса. Для крупных многотоннажных производств необходимы хорошие модели, здесь применяют теоретический метод. Этим же методом пользуются при создании принципиально новых технологических процессов. Для мелких производств со сложным характером процесса используют экспериментальный метод. На практике, как правило, используется разумное сочетание всех методов. Построенная одним из рассмотренных выше методов математическая модель одновременно должна удовлетворять требованиям достоверности и простоты. Достоверная модель, правильно описывающая поведение объекта, может оказаться весьма сложной. Сложность модели определяется, как правило, сложностью исследуемого объекта и степенью точности, предъявляемой практикой к результатам расчета. Необходимо, чтобы эта сложность не превосходила некоторого предела, определяемого возможностями существующего математического аппарата. Следовательно, модель должна быть достаточно простой в математическом отношении, чтобы ее можно было решить имеющимися методами и средствами. При решении уравнений математического описания с использованием ЭВМ необходимо создание моделирующего алгоритма («машинной» модели). При рaзрaботке такого aлгоритмa, прежде всего, необходимо выбрaть метод решения урaвнений мaтемaтического описaния - aнaлитический или численный. Следует помнить о необходимости проверки точности выбранного метода расчета. Проверка адекватности осуществляется на тестовых экспериментах путем сравнения результатов расчета по модели с результатами эксперимента на изучаемом объекте при одинаковых условиях. Это позволяет установить границы применимости построенной модели. Основным этaпом в построении адеквaтной модели является идентификaция мaтемaтического описaния объектa. Задачей идентификации является определение вида модели и нахождения неизвестных ее параметров - отдельных констант или их комплексов, характеризующих свойства объекта. Идентификация возможна при наличии необходимой экспериментальной информации об изучаемом объекте. Зaдaчa выбора модели возникaет при нaличии для одного и того же объектa клaссa моделей. Выбор модели является одним из важнейших этапов моделировaния. В конечном счете преимущество той или иной модели определяет критерий практики, понимаемый в широком смысле. При выборе модели следует исходить из разумного компромиса между сложностью модели, полнотой получаемых с ее помощью характеристик объекта и точностью этих характеристик. Так, если модель недостаточно точна, то ее нужно дополнить, уточнить введением новых факторов, может также оказаться, что предложенная модель слишком сложна и те же результаты можно получить с помощью более простой модели. 2. ПЛАНИРОВАНИЕ НАУЧНОГО ЭКСПЕРИМЕНТА 2.1. Типы величин Предметом исследования в науке являются самые разные объекты. Для определения абсолютного значения некоторой физической величины ее сравнивают с эталоном, который считается единицей величины. При этом нужно понимать, что в процессе эксперимента экспериментатор сравнивает измеряемую величину не с самим эталоном, а с показаниями некоторого прибора, то есть понятие эталона является абстрактным. Различают прямое и косвенное измерения. Наиболее простым является прямое измерение, при котором искомое значение величины находят непосредственно с помощью измерительного прибора. Если прямые измерения невозможны, используют косвенные измерения. В них искомое значение величины находят на основании известной зависимости этой величины от других, допускающих прямое измерение. Измерения могут быть выполнены как однократные, так и многократные. Однократное измерение дает единственный результат, который принимают за окончательный результат измерения значения искомой величины. Многократное измерение проводят путем повторения однократных измерений одной и той же постоянной физической величины, оно приводит к получению набора данных. Окончательный результат многократного измерения, как правило, находят из набора данных в виде среднего арифметического результатов всех отдельных измерений. Физические величины, встречающиеся в эксперименте, относят к следующим основным типам: Случайная величина. Такая физическая величина связана со случайными процессами, поэтому результат отдельного измерения не может быть однозначно предсказан заранее. Вместе с тем, проведение достаточно большого количества измерений случайной величины позволяет установить, что результаты измерений отвечают определенным статистическим закономерностям. Их выявление, изучение и учет составляют неотъемлемую часть любого эксперимента. Постоянная величина. К таким величинам должны быть отнесены физические постоянные, например, скорость света в вакууме, заряд электрона, постоянная Больцмана и т.п. Можно считать постоянными величинами также некоторые характеристики конкретного объекта, находящегося при фиксированных условиях. Этот тип физических величин чаще всего встречается в экспериментах. Однако многократные измерения постоянной величины могут дать неодинаковые результаты. Дело в том, что результаты измерений подвержены неконтролируемым, а значит, неучтенным, влияниям многочисленных воздействий внешней среды, включая неконтролируемые процессы в исследуемых объектах и используемых измерительных приборах. Вследствие этого постоянная величина зачастую проявляет себя как случайная величина, а результаты ее измерений отражают случайную природу воздействий и отвечают определенным статистическим закономерностям. Именно поэтому для обработки результатов измерения постоянной величины естественно использовать методы, характерные для обработки результатов измерения случайной величины. Изменяющаяся (переменная) величина. Такая величина закономерно меняется с течением времени вследствие процессов, проходящих в исследуемом объекте. Измерения, проводимые в различные моменты времени, фиксируют величину в новых условиях. Набор результатов однократных измерений представляет собой результаты принципиально неповторимых измерений, так как время нельзя повернуть вспять, а измерение в целом не может расцениваться как многократное. Особого внимания заслуживает нестабильная величина. Она меняется с течением времени без каких бы то ни было статистических закономерностей. К основной характеристике нестабильной величины следует отнести отсутствие у экспериментатора информации о ее зависимости от времени. Измерения такой величины дают набор данных, не несущих сколько-нибудь полезных сведений. Вместе с тем, нестабильная величина может быть переведена в разряд изменяющихся величин, если экспериментально или теоретически установлена закономерность в зависимости ее от времени. 2.2. Типы погрешностей измерений Погрешность – количественная характеристика неоднозначности результата измерения. Ее оценивают исходя из всей информации, накопленной при подготовке и выполнении измерений. Эту информацию обрабатывают для совместного определения окончательного результата измерения и его погрешности. Окончательный результат нельзя расценивать как «истинное значение» измеряемой физической величины, так как в этом нет смысла из-за наличия погрешности. Погрешность может быть выражена в единицах измеряемой величины x, – в таком случае она обозначается Δx и носит название абсолютной погрешности. Однако абсолютная погрешность не отражает качества измерений: например, абсолютная погрешность 1 мм при измерении размеров помещения свидетельствует о высоком качестве измерения, та же погрешность совершенно неприемлема при измерении диаметра тонкой проволоки. Критерием качества измерения является отношение абсолютной погрешности к окончательному результату измерения: . Это отношение безразмерно. Величину δx называют относительной погрешностью и используют как в абсолютном, так и в процентном выражении. Высокой точности измерения соответствует малое значение относительной погрешности. Основные типы погрешностей: 1 1. Промахи или грубые погрешности – возникают вследствие неисправности измерительных приборов или ошибок в эксперименте, сделанных по невнимательности. Естественно стремление избегать промахи, но если стало понятно, что они все-таки допущены, соответствующие им результаты измерений необходимо отбросить, и при возможности повторить эксперимент в этой области значений. 2 2. Приборная погрешность – систематическая погрешность, присутствующая в результатах измерений, выполненных с помощью любого измерительного прибора. Приборная погрешность, как правило, неизвестна и не может быть учтена. Ее можно оценить только путем сравнения показаний прибора с показаниями другого, более точного. Иногда результаты специально проведенного сравнения приводят в паспорте прибора, однако чаще указывают максимально возможную погрешность для приборов данного типа. 1 3. Модельная погрешность. В основу любого экспериментального исследования, сопряженного с измерениями, заложена модель. Модель содержит физическое описание исследуемого объекта или процесса, которое позволяет составить его математическое описание, а именно, набор функциональных соотношений, включающих в себя физические величины. Неверно построенная модель, в которой не нашли отражения какие-то важные процессы или факторы, влияющие на результат измерений, также приводит к несоответствиям. Как следствие, измеряемые в эксперименте величины, вычисляемые по полученным из модели рабочим формулам, содержат погрешности, которые носят название модельных погрешностей. 2 4. Случайные погрешности – при повторных измерениях погрешности этого типа показывают свою случайную природу. Возникают они вследствие множества причин, совместное воздействие которых на каждое отдельное измерение невозможно учесть или заранее установить. Такими причинами могут оказаться, к примеру, незначительные колебания температуры различных деталей и узлов установки, скачки напряжения, вибрации, турбулентные движения воздуха, трение в механизмах, ошибки считывания показаний приборов и т.п. Единственно возможный способ объективного учета случайных погрешностей состоит в определении их статистических закономерностей, проявляющихся в результатах многократных измерений. Рассчитанные статистические оценки вносят в окончательный результат измерения. Одной из грубейших ошибок, которые допускают студенты, является нахождение погрешности измерения как , где хэксперимент – полученное в процессе эксперимента среднее значение величины; хтаблица – значение, взятое из справочника или рассчитанное исходя из теоретических представлений. Целью эксперимента является именно проверка существующих теорий и уточнение табличных значений. С другой стороны, при выполнении учебных лабораторных работ полезно сравнить полученные результаты со справочными табличными величинами и, в случае значительного их расхождения, проанализировать, какие экспериментальные факторы и модельные погрешности могли привести к этому. 2.3. Случайные величины и их характеристики Исследование и анализ вещества - процесс многофакторный, действие многих факторов на результат анализа трудно контролируется, поэтому постановка одной серии измерений обычно не позволяет выявить наблюдаемые закономерности. Приходится ставить большую серию экспериментов в различных условиях с разными объектами. При использовании математического планирования эксперимента эти условия изменяются одновременно по заданной программе. В результате набирается большой цифровой материал, сравнение которого становится возможным только в том случае, если данные измерений представлены в компактной форме, удобной для хранения и дальнейшей обработки. Свертывание информации и ее объективное оценивание может быть осуществлено только с помощью аппарата математической статистики – первая задача математической статистики. Свертка информации, в частности, заключается в том, чтобы с помощью аппарата математической статистики всю информацию о точности аналитического метода представить в виде функции (закона) распределения результатов измерения, характеризующейся параметрами распределения: математическим ожиданием μ и дисперсией σ2. Закон распределения случайных величин является понятием математическим, справедливым только в том случае, если число n измерений величины х стремится к бесконечности (n→∞). Если n→∞, то такая совокупность измерений называется генеральной, а характеризующие ее параметры μ и σ2 называются генеральными параметрами: генеральная дисперсия σ2 и математическое ожидание μ. В экспериментальной работе часто ограничиваются небольшим числом (n) измерений. Это небольшое количество измеряемых величин можно рассматривать как случайную выборку, характеризующую абстрактно существующую генеральную совокупность. Генеральная совокупность является математической моделью реально существующей совокупности — выборочной совокупности или выборки, характеризующейся выборочными параметрами (выборочное среднее и выборочную дисперсию S2), которые являются оценками неизвестных генеральных параметров. При этом естественно, чем меньше число n измерений в выборочной совокупности, тем менее надежно будут определены генеральные параметры по выборочным. Поэтому вторая задача математической статистики состоит в оценке элемента неопределенности, который мы вносили в результаты исследований вследствие определения генеральных параметров с помощью выборочной совокупности. Основным типом погрешностей являются случайные погрешности. Они поддаются строгому математическому описанию, что позволяет делать выводы о качестве измерений, в которых они присутствуют. Случайная величина xi полностью задается плотностью вероятности (другие названия – распределение вероятности, распределение величины x). Среднее значение измеряемой величины указывает центр распределения, около которого группируются результаты отдельных измерений: , где n – количество определений. Иногда используется среднее геометрическое , медиана (срединное значение). Для упрощения расчетов каждый результат анализа можно представить суммой: , где а — постоянная величина для данной серии измерений; υi — переменная величина или варьируемый остаток. Дисперсию (оценкой генеральной дисперсии σ2 служит выборочная дисперсия) вводят как средний квадрат отклонения отдельных результатов от среднего значения случайной величины: , где х- среднее значение, найденное иэ х1, х2, х3, … хn измерений; n — число членов в выборке; величину f = n - 1 называют числом степеней свободы выборочной характеристики и определяют как число измерений, используемое для расчета данной выборочной характеристики, за вычетом числа связей, которые мы наложили на данную выборку при вычислении данной характеристики. При вычислении дисперсии S2 наложили одну связь на используемую выборку. Если известно математическое ожидание μ данной совокупности измерений, то дисперсия S2 вычисляется по формуле . Положительное значение корня квадратного из дисперсии называют стандартным отклонением (среднее квадратичное отклонение): . Относительное стандартное отклонение равно . Эта величина характеризует разброс результатов отдельных измерений вокруг среднего значения, получаемого после обработки всех данных многократного измерения. Конечно, точные значения σ и μ являются предельными величинами, так как могут быть получены лишь тогда, когда полное количество проведенных измерений достаточно велико, в пределе при n→∞. При конечных n правильнее использовать термин экспериментальная оценка, который в равной мере относится и к среднему значению, и к дисперсии. 2.4. Нормальное распределение и его свойства При обработке данных измерений в науке и технике обычно предполагают нормальный закон распределения случайных погрешностей измерений. Оно проявляется тогда, когда суммарная погрешность есть результат неучтенного совместного воздействия множества причин, каждая из которых дает малый вклад в погрешность. Причем совершенно неважно, по какому закону распределен каждый из вкладов в отдельности (рис 5). Свойства нормально распределенной случайной величины x: 1 1) ; 2 2) является непрерывной функцией; 3 3) центр распределения случайной величины одновременно является центром симметрии; 4 4) малые отклонения встречаются чаще больших, то есть реализуются с большей вероятностью. Соответствующее функциональное выражение для распределения (плотности вероятности) задает формула Гаусса: Вероятность того, что результат измерения попадет в интервал [х1;х2], равна: В скобках после P указано событие, для которого вычислена вероятность. При увеличении границ промежутка в обе стороны до бесконечности интеграл от функции распределения то есть попадание результата измерения в диапазон является достоверным событием. Рис. 5. Нормальное распределение Гаусса: соответствует стандартному нормальному распределению Пусть – произвольное отклонение от средней величины . Введем ε – величину отношения полуширины интервала Δx к среднему квадратичному отклонению σ В рис. 6 приведена зависимость ε от среднего квадратичного отклонения (σ) при вероятности α: . Видно, что результат измерения с вероятностью около 68% попадет в интервал , то есть примерно каждое третье измерение даст результат за пределами этого интервала. За пределами интервала окажется 5% результатов, а для интервала – только один из трехсот. Значит, интервал является почти достоверным, так как подавляющее большинство отдельных результатов многократного измерения случайной величины окажется сосредоточенным именно в нем. При обработке результатов эксперимента часто используется «правило 3σ», или правило «трех стандартов», которое основано на указанном свойстве нормального распределения. С учетом проведенного выше анализа, можно установить наличие промаха в результате отдельного измерения, а значит, отбросить его, если результат измерения более чем на 3σ отличается от измеренного среднего значения случайной величины. В то же время стоит более тщательно повторить измерения в этой области параметров – возможно, данный результат измерения не является промахом, а свидетельствует о наличии необычного поведения изучаемой системы, которое не укладывается в рамки существующей модели, то есть речь идет об открытии нового качественного состояния (например, линии резонансного поглощения в спектре). Доверительная вероятность α (доли ε) 0,999 0,997 0,990 0,95 0,90 0,68 1 2 3 ε Рис. 6. Зависимость ε от среднего квадратичного отклонения (σ). Нормальное распределение: доверительные интервалы для доверительной вероятности α (доли ε) Метод исключения промахов при неизвестном σ. Пусть n измерений х1, х2, х3. …, хi, …, хn и среди них значение хi вызывает сомнение, так как оно существенно отличается от остальных значений. Наличие грубой ошибки при получении результата хi оцениваем с помощью r-критерия , где и S — соответственно среднее значение и стандартное отклонение, подсчитанные по всем n измерениям, включая и сомнительный результат. Полученное значение ri подчиняется r-распределению с числом степеней свободы f = n - 2. Для оценки промаха воспользуемся таблицами справочных данных rmax(rmin). Если рассчитанное значение ri < rmax (0,05, f = n – 2), то делаем вывод, что результат принадлежит данной совокупности. Если ri > rmax (0,01, f = n – 2), то сомнительный результат классифицируем как промах и исключаем его из совокупности измерений. Можно дать следующие рекомендации для выявления промахов. 1. Если среди n -измерений имеются два результата, из которых один вызывает сомнение в силу того, что он значительно больше остальных, а другой из-за того, что он значительно меньше, то следует по всем n результатам подсчитать и S и сначала проверить гипотезу о том, можно ли отбросить, как грубое, то измерение, которое больше отличается от среднего. Если окажется, что это измерение не является промахом, то все n измерения принадлежат одной совокупности. Если окажется, что измерение с максимальным отклонением от среднего содержит грубую ошибку, то его отбрасывают, по оставшимся (n-1) результатам подсчитывают и S и проверяют гипотезу о наличии промаха во втором сомнительном результате. 2. Если среди измерений имеются два результата, которые вызывают сомнение, потому что они значительно меньше (или больше) остальных, то сначала произвольно отбрасывают худшее из сомнительных измерений. По оставшимся (n - I) измерениям подсчитывают и S и проверяют гипотезу о наличии грубой ошибки в лучшем из сомнительных результатов. Если окажется, что это измерение можно классифицировать как промах, то, естественно, нужно отбросить оба сомнительных измерения. Если окажется, что второе измерение не содержит грубой ошибки, то проверяют гипотезу о наличии грубой ошибки в худшем из сомнительных результатов. При этом и S подсчитывают по всей серии из n измерений. 2.4.1. Коэффициент Стьюдента Случайные погрешности, как уже отмечено, проявляются в разбросе результатов отдельных измерений постоянной величины. С увеличением количества измерений n оценка значения величины σ практически перестает зависеть от n, то есть уменьшается неточность при оценивании погрешности отдельного измерения. С ростом n также стабилизируется оценка . Следовательно, должна уменьшаться погрешность окончательного результата многократного измерения, за который принимают среднее значение . Связь среднего квадратичного отклонения окончательного результата (другими словами, погрешности определения среднего значения) и среднего квадратичного отклонения σ отдельного измерения задает соотношение: Видно, что с увеличением числа измерений погрешность окончательного результата уменьшается. Однако повышение точности никогда не дается бесплатно. Так, чтобы узнать дополнительную цифру в , то есть повысить точность в 10 раз, количество измерений необходимо увеличить в 100 раз! Следует также учесть, что в конечную погрешность вносит свой вклад приборная (систематическая) погрешность, и с какого-то момента увеличение числа измерений становится неэффективным. Пусть, как результаты отдельных измерений хi, так и среднее значение распределены нормально. По аналогии с отдельным измерением для оценки погрешности окончательного результата многократного измерения примем величину Δx, задающую симметричный относительно интервал значений от – Δx до + Δx, называемый доверительным интервалом. Вероятность найти значение измеряемой величины в указанном интервале носит название доверительной вероятности α: . Если понятие доверительного интервала использовать применительно к отдельному измерению, то под σтабл следует понимать среднее квадратичное отклонение σ результата этого отдельного измерения. Если же отнести доверительный интервал к многократному измерению, то под σтабл необходимо подразумевать среднее квадратичное отклонение окончательного результата многократного измерения, то есть σ{x}. В эксперименте значение σ{x} оценивают исходя из конечного числа результатов отдельных измерений, количество которых обычно не превышает 5 – 10. Поэтому точность оценивания σ{x} невелика. Это вносит дополнительную неопределенность в окончательный результат многократного измерения. Чтобы ее учесть, следует расширить границы доверительного интервала, заданного выше для точно известной величины σ{x}. Понятно, что меньшему количеству отдельных измерений должен сопоставляться более широкий доверительный интервал. Доверительный интервал (Δх) указывает, в каких пределах при выбранной статистической надежности Р должно лежать истинное значение результата измерения: . Величина доверительного интервала среднего результата рассчитывается с использованием t-критерия или критерия Стьюдента. Функция плотности вероятностей t-распределения симметрична, поэтому левая Δх1 и правая Δх2 доверительные границы результата анализа равны , где S — стандартное отклонение, характеризующее воспроизводимость результатов анализа; n — число результатов анализа, по которым рассчитывали х; t(α, f)- табличное значение t - критерия, найденное для уровня значимости α = 1 - Р и числа степеней свободы f, по которым рассчитывали величину S. При расчете доверительного интервала среднего результата обычно используют уровень значимости α, равный 0,05 (то есть доверительную вероятность 0,95). При нахождении значения t(α, f) следует учитывать, что таблицы составлены обычно для двусторонних критериев. Если доверительный интервал используют как меру отклонения для среднего результата анализа, то естественно, интересны левая и правая доверительные границы, поэтому табличное значение t(α, f) находят для α = 0,05. Если исследователя интересует только одна доверительная граница (например, правая — содержание примеси в продукте не должно превышать некоторое заданное значение — или левая — содержание полезного компонента в концентрате не должно быть меньше некоторого значения), то для расчета Δх используют значение α, соответствующее односторонней границе, которое в 2 раза меньше двусторонней. В этой ситуации при использовании таблиц двустороннего t -критерия значение t(α, f) находят для уровня значимости α = 0,10. При расчете доверительного интервала необходимо учитывать ту дополнительную информацию о точности методики исследования, которая была известна до получения оцениваемого результата измерения х. Такой информацией является оценка S погрешности анализа, установленная по большому числу f. Использование этого значения S позволит не только существенно уменьшить значение Δх, но и рассчитать его величину для единичного результата исследования. Кроме того, доверительный интервал позволит определить число значащих цифр в результате анализа. Если обработке подвергается небольшое число измерений, то вместо дисперсии σ2, характеризующей рассеяние генеральной совокупности, мы вынуждены пользоваться выборочной дисперсией S2, близость значения которой к генеральной σ2 зависит от числа степеней свободы f, по которой рассчитывали S2. В этом случае переменную ui = (хi – μ)/σ заменяют на новую переменную t = (хi – μ)/S, не содержащую неизвестной величины σ. Плотность вероятностей Ψ(t) t-распределения симметрична относительно μ, то есть максимумы t-распределения и нормального распределения соответствуют одному значению абсциссы. Однако в отличие от нормального распределения высота и ширина кривых t-распределения зависит не только от S, но и от f, по которым рассчитывали S: при одном и том же значении S с уменьшением f кривая Ψ(t) выполаживается. При f→∞ t-распределение совпадает с нормальным распределением. Практически уже при f > 20 можно считать, что распределение Стьюдента хорошо аппроксимируется распределением Гаусса. 2.4.2. Другие виды распределения Распределение Фишера. Отношение двух выборочных дисперсий , принадлежащих различным совокупностям, подчиняется распределению Фишера или F - распределению. Функция плотности вероятностей определяется сложным выражением, по которому подсчитывали выборочные дисперсии. Величина F изменяется в пределах 0 ≤ F ≤ ∞. Кривые плотности вероятностей асимметричны, асимметрия уменьшается с увеличением f1 и f2. Х2 –распределение. Пусть имеем выборочную совокупность х1, х2, х3, … хn, которая подчиняется нормальному закону распределения с генеральными параметрами μ и σ2. Если в нормированном нормальном законе переменную ui = (хi – μ)/σ возвести в квадрат и просуммировать , то величина Х2 подчиняется Х2-распределению с числом степеней свободы f = n - 1. Величина Х2 изменяется в пределах 0 ≤ Х2 ≤ ∞. Функция плотности вероятностей асимметрична: асимметрия уменьшается с приростом f. r –распределение. Если в нормированном нормальном законе в переменной ui = (хi – μ)/σ заменить генеральные параметры на их выборочные оценки , то получим распределение относительного отклонения или r - распределение. Функция плотности вероятностей Ψ(r) зависит от значения ri и числа степеней свободы f = n - 2 . При больших значениях n r-распределение переходит в нормальное распределение. В зависимости от характера проверяемой гипотезы применяют односторонние или двусторонние статистические критерии. Использование различных типов статистических критериев зависит от вида критической области закона распределения случайной величины. Если критическая область, в которую можно ожидать попадания случайной величины, целиком расположена в одной части графика, то для оценки гипотезы используется односторонний статистический критерий. Аналогичное имеет место, если случайная величина может попасть в другую критическую область, но это не интересует исследователя. 1 2.5. Суммарная погрешность измерений 2 Помимо случайной, при использовании в эксперименте каких-либо измерительных приборов, необходимо учитывать приборную (систематическую) погрешность. В паспорте прибора принято указывать предел допустимой погрешности θ, означающий максимально возможную погрешность при рекомендованных условиях работы прибора. Если бы приборная погрешность была распределена по нормальному закону, то из такого определения θ следовало бы, что распределение характеризуется средним квадратичным отклонением σприб= θ/3. Для электроизмерительных стрелочных приборов принято указывать класс точности, записываемый в виде числа, например, 0,05 или 4,0. Это число дает максимально возможную погрешность прибора, выраженную в процентах от наибольшего значения величины, измеряемой в данном диапазоне работы прибора. Так, для вольтметра, работающего в диапазоне измерений 0-30 В, класс точности 1,0 определяет, что указанная погрешность при положении стрелки в любом месте шкалы не превышает 0,3 В. Соответственно, среднее квадратичное отклонение σприб составляет 0,1 В. Реальная погрешность прибора существенно зависит от условий окружающей среды, где установлен прибор. Например, погрешность электроизмерительных приборов зависит от температуры помещения, и отличается от паспортной погрешности, которая обычно приводится для 20 0С. Другой причиной погрешностей может быть электромагнитное излучение другого лабораторного оборудования, вибрация установки и т.д. При планировании эксперимента для повышения точности измерений может возникнуть необходимость в учете этих факторов. Обычно цена наименьшего деления шкалы стрелочного прибора согласована с погрешностью самого прибора. Если класс точности используемого прибора неизвестен, за погрешность σприб всегда принимают половину цены его наименьшего деления. Понятно, что при считывании показаний со шкалы нецелесообразно стараться определить доли деления, так как результат измерения от этого не станет точнее. Окончательный результат многократного измерения содержит в себе как случайную, так и приборную (систематическую) погрешности. Поскольку случайная погрешность уменьшается с увеличением количества измерений, целесообразно сделать такое количество измерений, чтобы то есть случайной погрешностью можно было пренебречь по сравнению с приборной погрешностью. На практике достаточно, чтобы случайная погрешность была в 2-3 раза меньше систематической. В любом случае надо сделать 2-3 измерения, чтобы убедиться в том, что случайная погрешность действительно мала. Если приборная и случайная погрешности близки по значению, то суммарная погрешность При выполнении однократного измерения оценкой погрешности результата служит погрешность, учитывающая только предельно допустимую приборную. 2.5.1. Погрешности косвенных измерений Пусть исследуемую величину s определяют по результатам прямых измерений других независимых физических величин, например, x, y, z, с которыми она связана заранее установленным функциональным математическим соотношением: . Также известны окончательные результаты прямых измерений , , . Предполагается, что для величины x, y, z являются случайными и к ним применимо нормальное распределение. Тогда для среднего значения погрешность , где – частные производные в точке . Следует помнить, что при непосредственных расчетах в формулу необходимо подставлять погрешности Δx, Δy, Δz, найденные для одного и того же значения доверительной вероятности. Погрешность косвенного измерения также будет соответствовать этому значению доверительной вероятности. Сравнение между собой величин дает возможность выделить «критический» фактор, процесс измерения которого дает наибольший вклад в погрешность Δs. Если, например, величина больше остальных более чем в 2 – 3 раза, то их вкладом в погрешность Δs можно пренебречь. Для повышения точности измерения величины s в первую очередь надо повышать точность измерения «критического» фактора. Для наиболее распространенных зависимостей в табл. 1 приведены формулы для расчета погрешности. Таблица 1 Связь погрешностей прямых и косвенных измерений Рабочая зависимость Формула погрешности Примечание: в таблице приняты следующие обозначения: Δ – для абсолютной погрешности, δ – для относительной погрешности, A, B, C, α, β, γ – постоянные, x, y, z, ϕ – результаты прямых измерений, s – результат косвенного измерения. Одной из типичных ошибок планирования эксперимента является косвенное измерение величины s через разность измеряемых напрямую величин A и B, если их абсолютные значения много больше значения величины s (например, поиск толщины стенки трубы через измерение ее внешнего и внутреннего радиусов). При этом погрешность будет того же порядка или может даже превосходить значение искомой величины s. Аналогично – деление друг на друга больших величин или степень с маленьким основанием и большим показателем. Во всех этих случаях необходимо искать альтернативные пути. 2.5.2. Учет погрешности в записи окончательного результата измерения 1 Завершением обработки данных многократного прямого измерения при заданной доверительной вероятности являются два числа: среднее значение измеренной величины и его погрешность (полуширина доверительного интервала). Оба числа есть окончательный результат многократного измерения и должны быть совместно записаны в стандартной форме , которая содержит только достоверные, то есть надежно измеренные цифры этих чисел. Порядок выполнения округления 1 1. Выполнить предварительную запись окончательного результата измерения в виде и вынести за общую скобку одинаковые порядки среднего и погрешности, т.е. множитель вида 10k, где k – целое число. Числа в скобках переписать в десятичном виде с использованием запятой, убрав тем самым оставшиеся порядковые множители. 2 2. Округлить в скобках число, соответствующее погрешности: до одной значащей (ненулевой) цифры слева, если эта цифра больше 2, или до двух первых цифр в противном случае. При округлении используют правило: если цифра, расположенная за оставляемой, меньше 5, то ее просто отбрасывают, иначе оставляемую цифру увеличивают на единицу. Если же отбрасываемая цифра равна 5, то наименьшая ошибка достигается при округлении по правилу Гаусса до ближайшего четного числа. К примеру, 4,5 округляют до 4, в то время как 3,5 также округляют до 4. 3 3. Округлить в скобках число, соответствующее среднему значению: последними справа оставляют цифры тех разрядов, которые сохранились в погрешности после ее округления. Окончательно записать с учетом выполненных округлений. Общий порядок и единицы измерения величины приводят за скобками – получена стандартная форма записи. Значащие цифры при проведении расчетов и представлении результатов. Под значащими цифрами числа понимают последовательность цифр без учета места запятой, а для чисел меньших единицы - без учета нуля перед запятой и всех последующих за ним нулей. Например, установленное содержание золота в сплаве 92,8±0,3 %. Результат записан с тремя значащими цифрами, а погрешность анализа с одной. Если результат представлен в виде 92,85±0,03 %, то говорим: результат записан с 4 значащими цифрами, погрешность с одной. Погрешность Δx анализа рекомендует записывать с одной значащей цифрой, редко с двумя, но не более. Две цифры записывают в том случае, если первая из них есть 1 или 2. Например, при расчете Δx получили значение, равное 0,14. Округление до одной значащей цифры (Δx = 0,1) снижает погрешность анализа на 40 %, поэтому правильнее будет сохранить две значащие цифры. Этот же аргумент, вероятно, можно распространить и на погрешность, у которой первая значащая цифра 2, но уже определенно нецелесообразно, если первая значащая цифра 3 и более. После расчета погрешности результата анализа необходимо определить, какие цифры в установленном результате являются значащими. В этом случае рекомендуется пользоваться таким правилом: последняя значащая цифра в любом приводимом результате обычно должна быть того же порядка величины, что и погрешность. Линеаризация данных. Физические величины, определяющие результаты эксперимента, выступают в роли переменных и параметров некоторой функциональной зависимости, теоретически получаемой в рамках модели. После экспериментальной регистрации зависимости ее сравнивают с теоретической. Путем сравнения можно не только численно определить, т.е. измерить, значения физических величин, не измеряемых другим способом, но и вывести заключение об адекватности применения модели к эксперименту. Проще всего проверить линейную зависимость: y = ax + b где x, y – измеряемые величины; a, b – параметры зависимости. Если зависимость нелинейная, в некоторых случаях ее можно преобразовать в линейную (табл. 2). Обращаем внимание на то, что после вычисления погрешностей величин a и b переход к погрешностям реальных физических величин k и z осуществляется по формулам для погрешностей косвенных измерений. Таблица 2 Примеры линеаризации зависимостей Вид нелинейной зависимости Получаемая линейная зависимость y x a b Для определения и оценки наличие линейной зависимости между двумя случайными величинами необходимо провести корреляционный анализ. 2.6. Статистика линейных связей 2.6.1. Корреляционный анализ При решении некоторых аналитических задач возникает необходимость оценить наличие линейной зависимости между двумя случайными величинами х и у. Например, при изучении влияния химического состава пробы на результаты определения элемента А требуется установить существует ли зависимость между ΔС = СА - μ (С, μ — соответственно содержание элемента А в пробе, установленное с помощью данной методики, и действительное) от содержания СВ в пробе элемента В. Для этого рассматриваем две группы значений случайных величин х и у: х1, х2, х3, …, хm и у1, у2, у3, …, уm. Принимаем, что обе группы наблюдений подчиняются нормальному закону распределения. Для оценки наличия линейной зависимости между х и у рассчитываем коэффициенты корреляции rxy где и — средние значения для выборки случайных величин соответственно х и у. Данное выражение можно представить в другой записи: Коэффициент корреляции изменяется в пределах –1< < + 1. При = 1 наблюдается строгая прямая линейная связь между переменными величинами х и у, а при = –1 — строгая обратная линейная связь. При = 0 между переменными х и у не существует линейной связи. Если коэффициент корреляции принимает значение 0< ||<1, то необходимо оценить его значимость. Для этого абсолютное значение , рассчитанное по формуле, сравнивают с табличным значением, найденным для уровня значимости α и числа степеней свободы f = m - 2. Если >(α, f), то принимаем гипотезу: между х и у существует линейная связь. Если <(α, f), то принимаем, что между х и у линейная связь отсутствует, но криволинейная может существовать. В этом случае коэффициент корреляции служит только мерой точности аппроксимации криволинейной зависимости линейной у = а + вх. 2.6.2. Определение параметров прямой линии Установив наличие линейной связи между экспериментальными величинами х и у, естественное стремление исследователя заключается в аналитическом представлении этой зависимости, т.е. в определении численных значений параметров а и в уравнения прямой у = а + bх. В аналитической практике с этой задачей встречаемся и при определении градуировочной характеристики, так как зависимость аналитического сигнала от содержания определяемого компонента в образце нередко бывает линейной. Особенность определения параметров а и b состоит в том, что наличие случайных погрешностей измерения (или, как говорят, наличие «шума» в эксперименте) делает неразумным подбор такой формулы, которая бы точно описывала бы все опытные данные. Другими словами, график искомой функции не должен проходить через все экспериментальные точки, а должен по возможности сглаживать «шум». Конечно сглаживание «шума» будет тем точнее, чем больше экспериментальных результатов, т.е. чем больше мы имеем избыточной информации. Если все измерения функции у1, у2, у3, …, уm выполнены с одинаковой точностью, то оценки параметров а и b определяются из условия, что сумма квадратов отклонений экспериментальных значений уj от рассчитанных принимает наименьшее значение. Отсюда и название метода расчета — метод наименьших квадратов. Параметры а и b называют коэффициентами регрессии. Значения параметров а и b . Дисперсия характеризующая рассеяние экспериментальных результатов уj относительно прямой, определяется из выражения: , где — значение, рассчитанное по формуле у = а + bх для аргумента хj. В зависимости от того, какими формулами пользоваться при расчете а и b, дисперсию удобнее вычислять по формулам: или Эти формулы эквивалентны. При известном значении мокко рассчитать дисперсии и , характеризующие погрешность определения соответственно параметров а и b: ; Доверительные интервалы значений коэффициентов а и b рассчитывают по формулам: и , которые позволяют установить число значащих цифр в найденных значениях и b и оценить значимость параметров. Если |a| < Δa, то коэффициент незначим: уравнение у = а + bх имеет вид у = вх, то есть график проходит через начало координат. Если |b| < Δb, то между случайными величинами х и у линейная связь отсутствует. Из формул Δa и Δb следует, что точность определения параметров а и b увеличивается с увеличением размаха варьирования используемых значений хj. Этот факт нужно учитывать при разработке методик анализа продуктов стабильно протекающих технологических процессов. Несмотря на узкие пределы изменения контролируемых значений содержания хj, градуировочные характеристики лучше определять по образцам, в которых величина хj изменялась бы по возможности в более широких пределах. При этом следует помнить, что интервал концентраций должен быть ограничен областью, для которой сохраняется линейная зависимость. 2.6.3. Проверка гипотезы линейности При разработке новых методик анализа целесообразно проверить линейность градуировочной характеристики. Корреляционный анализ не позволяет корректно решить эту задачу. Лучшие результаты получаются при использовании регрессионного анализа. Если между величинами х и у существует строгая линейная связь, то дисперсия , характеризующая рассеяние экспериментальных точек вокруг теоретической прямой, будет определяться только погрешностями измерения у. Поэтому при проверке гипотезы линейности опыты планируются так, чтобы для каждого образца сравнения было выполнено n независимых измерений у. Тогда, сравнивая дисперсию с дисперсией воспроизводимости измерения у, можно решить вопрос о линейности зависимости у = f(х). Усредняем результаты измерения аналитического сигнала для каждого образца сравнения и рассчитываем отклонения от среднего значения. Если у исследователя есть какие-то основания сомневаться в однородности дисперсий, полученных при измерении уj от различных образцов сравнения, то по критерию Кохрена или Бартлета проверяют однородность дисперсий . Если дисперсии однородны, то по формуле рассчитывают среднюю дисперсию измерения уj. Если проверка по критерию Кохрена или Бартлета показала неоднородность дисперсий , то следует преобразовать переменные уji или уменьшить интервал варьирования концентраций. Если у исследователя нет основания сомневаться в однородности дисперсий , значение рассчитывают сразу по формулам: или . Гипотеза линейности проверяется с помощью F -критерия: В знаменатель отношения ставим значение , так как при определении остаточной дисперсии использовали значения , усредненные по n независимым измерениям. Значение F сравнивается с табличным значением F(α, f1=(m-2), f2=(n-1)). Если F < F(α, f1, f2), то зависимость у =f(х) строго линейна; в противном случае нелинейна. Нарушение линейности может быть обусловлено различными факторами. В некоторых случаях характер расположения точек на графике указывает на то, что градуировочная функция апроксимируется зависимостью у = а + bx + сx2. 2.7. Статистическая проверка гипотез Анализ результатов эксперимента с помощью математической статистики часто сводится к проверке справедливости предположений, или гипотез, относительно изучаемого физического явления и полученных в эксперименте данных. Насколько результат эксперимента соответствует известному табличному значению? Совпадают ли результаты на двух разных установках? Является ли данная модельная зависимость соответствующей изучаемому явлению? 2.7.1. Сравнение двух дисперсий В практике исследования часто стоит задача сравнения точности результатов. В частности, заменили старый изношенный измерительный прибор на новый современный. Возникает вопрос: изменилась ли воспроизводимость результатов измерения. Другая задача: нужно сравнить воспроизводимость двух методик анализа. Решение подобных задач сводится к сравнению дисперсий. Имеем две серии измерений (две выборки): х1, х2, х3, …, хn и у1, у2, у3, …, уn. По результатам измерений рассчитаны выборочные дисперсии при числе степеней свободы f1 = n1 - 1 и при числе степеней свободы f2 = n2 - 1 . Значения > . Величина служит оценкой генеральной дисперсии , а — генеральной дисперсии . Нужно сравнить генеральные дисперсии по известным выборочным. Выдвигается нуль-гипотеза, которая состоит в том, что генеральные дисперсии равны ==. Выборочные дисперсии , , характеризующие одну и ту же генеральную дисперсию , называются однородными. Следовательно, нужно проверить однородность выборочных дисперсий и . Для принятия или опровержения выдвинутой нуль-гипотезы пользуются F –критерием (критерий Фишера). Для этого находим значение . При этом в числитель отношения обязательно ставится большая по величине выборочная дисперсия. При проверке гипотезы о равенстве σ1 = σ2 следует различать два случая. Случай 1. Заранее известно, что σ1 не может быть меньше σ2, поэтому проверяем справедливость одного из двух положений: σ1 = σ2 или σ1 > σ2. При этом пользуемся односторонним F -критерием. Обычно таблицы для F -критерия составлены для односторонних доверительных границ, поэтому для принятия нуль-гипотезы находим табличное значение F для уровня значимости α = 0,05 и числа степеней свободы f1 и f2. Если справедливо неравенство < F(0,05, f1, f2), то принимаем нуль-гипотезу: выборочные дисперсии иоднородны. Если > F(0,05, f1, f2), то принять нуль-гипотезу не можем, но и недостаточно оснований для ее отбрасывания. Для принятия решения необходимо рассчитанное значение сравнить с табличным значением F, найденным для α = 0,01 и числа степеней свободы f1 и f2. Если > F(0,0I, f1, f2 ), то нуль-гипотезу отбрасываем: дисперсии и неоднородны. Случай 2. Сравниваем дисперсии и, когда из условий постановки эксперимента нельзя сказать, какая генеральная дисперсия больше, поэтому справедливым может быть любое из трех положений: σ1 > σ2, или σ1 = σ2, или σ1 < σ2. В этом случае для проверки нуль-гипотезы следует пользоваться двусторонним F-критерием. Критическая область в функции плотности вероятностей Ψ(F) cocтoит из двух частей, то есть α = 2α1, где α1 и α — уровень значимости соответственно для односторонних и двусторонних доверительных границ. Чтобы найти значение двустороннего F-критерия для уровня значимости α = 0,05 по таблицам, составленным для одностороннего F-критерия, следует использовать α1 = 0,025. Если нужно найти значение двустороннего F -критерия для α = 0,01, то в таблицах одностороннего критерия следует пользоваться α1 = 0,005. В остальном нуль-гипотезу проверяют по тем же правилам, что и в первом случае. 2.7.2. Сравнение нескольких дисперсий При создании стандартных образцов или проверке качества работы нескольких однотипных приборов, установленных в лаборатории, возникает задача оценки однородности нескольких дисперсий , , , …, , каждая из которых определена с числом степеней свободы f1, f2, f3, …. fm. Для решения можно использовать критерий Бартлета или критерий Кохрена. Первый из них является более приближенным по сравнению со вторым, но зато применим для случая, когда сравниваемые дисперсии характеризуются различным числом степеней свободы . При сравнении дисперсий с помощью критерия Бартлета рассчитываем величину В: , где ; . Бартлет показал, что величина В распределена приближенно как, Х2 с числом степеней свободы f = m - 1 при ycловии, что для fi справедливо fi > 2. Если найденное значение В превосходит значение Х2(α = 0,01, f = m - 1), то отбрасываем гипотезу об однородности дисперсий, т.е. одна или несколько выборочных дисперсий из рассматриваемой совокупности характеризуют другие генеральные дисперсии. Если В<Х2 (α = 0,05, f = m - 1), то сравниваемые дисперсии однородны. Если число степеней свободы fi для всех выборок одинаково fi = , то для сравнения дисперсий вместо приближенного критерия Бартлета лучше пользоваться критерием Кохрена. Этот критерий основан на законе распределения отношения максимальной выборочной дисперсии к сумме сравниваемых дисперсий . Если значение Ψmax, найденное по формуле, окажется меньше табличного значения Ψmax(α = 0,05, m, f), то сравниваемые дисперсии считаем однородными. Если Ψmax>Ψmax(α = 0,05, m, f), то дисперсия характеризует другую генеральную дисперсию. 2.7.3. Оценка доверительных интервалов выборочных характеристик Оценка допустимого расхождения между параллельными результатами исследования. В практике исследовательской работы часто требуется определить величину допустимого расхождения d между измерениями содержания компонентов в пробе. Аналитики ведут анализ из двух и более навесок, поэтому необходимо знать, в каком случае можно усреднять полученные измерения, а в каком случае браковать их. Значение допустимого расхождения d рассчитывают с помощью критерия Пирсона Q(α, n), величина которого зависит от уровня значимости α и числа n измерений в выборке, для которой рассчитывается значение d: , где S — стандартное отклонение, характеризующее воспроизводимость (сходимость) методики анализа, установленное по большому числу измерений (f≥50). Оценка доверительного интервала дисперсии и стандартного отклонения. Доверительный интервал указывает, в каких пределах при выбранной доверительной вероятности Р лежит значение генеральной дисперсии σ2 соответственно установленного выборочного значения S2. Для оценки доверительных границ σ2 используется Х2 -распределение, функция плотности вероятностей которого асимметрична, поэтому левая и правая границы S2 рассчитываются раздельно. Для оценки доверительных границ с вероятностью Р необходимо учитывать, что Р = Р1 - Р2. Вероятности Р1 и Р2 показаны на рис. 7 (Р1 — заштрихована (сверху вниз) справа налево, а Р2 –- слева направо). Доверительные границы рассчитывают из выражения: или , где и — значения Х2 -критерия, найденные для числа степеней свободы f и вероятности, равной соответственно Р1 и Р2. Рис. 7. Графическое изображение доверительной вероятности Р Для расчета доверительного интервала дисперсии обычно используют вероятность Р = 0,90. В этом случае α = 1 -Р = 0,10, а критические области (на рис. 7 одна из них не заштрихована, а другая отмечена двойной штриховкой) раны α/2 = 0,05. Следовательно, вероятности Р1 и Р2 равны 0,95 и 0,05 соответственно. Оценка доверительного интервала дисперсии нам праще всего нужна, чтобы определить число значащих цифр в найденных выборочных оценках и сознательно установить f, по которым следует оценивать S2. 2.7.4. Сравнение двух средних результатов анализа В исследовательской практике часто возникает ситуация, когда требуется сравнить между собой два результата: сопоставляются результаты анализа одной пробы, полученные разными методами, или наоборот, одним методом, но разными исследователями; сравниваются между собой результаты анализа двух проб, отобранных в разных технологических условиях и т.д. С позиции статистического анализа эти задачи решаются одинаково. Рассмотрим приемы их решения. Пусть двумя способами проанализирована проба и результаты представлены двумя выборками измерений: х1, х2, х3, …, хn1 (проведено n1 измерений); у1, у2, у3, …, уn2 (проведено n2 измерений). Для каждой выборки находим среднее значение х и у дисперсии и , характеризующие воспроизводимость измерения. Можно сравнить средние значения х и у с помощью t-критерия, если у исследователя есть основания полагать, что имеем дело с нормально распределенными наблюдениями. Однако прежде чем оценивать значимость различий между х и у, следует проверить однородность дисперсий и . Однородность дисперсий проверяем с помощью F- критерия. Рассчитанное значение сравниваем с табличным значением F, найденные для уровня значимости α и числа степеней свободы f = n2 – 1. При этом возникает два случая: 1. Сравнение равноточных средних результатов. < F(α, f1, f2) (дисперсии и однородны), то находим средние для обеих выборок дисперсию: , а затем оцениваем значимость расхождения средних результатов по формуле . Рассчитанное значение t сравниваем с табличным значением t-критерия, найденным для уровня значимости α и числа степеней свободы . Если t > t (0,01, f), то различие между х и у носит систематический характер. Если t < t(0,05, f ), то принимаем нуль-гипотезу: различие между х и у случайно. Оба результата характеризуют одно и то же математическое ожидание, оценка которого равна: . 2. Сравнение неравноточных результатов. Если при оценке однородности дисперсий получим, что > F(α, f1, f2) — дисперсии неоднородны, то рассчитать по формуле среднюю дисперсию не представляется возможным. В такой ситуации значимость отличия х и у можно оценивать только при условии, если n1 = n2 = n: . Данное выражение - частный случай выражения . Отличие в оценках состоит только в том, что из-за неоднородности дисперсий происходит потеря информации, которая выражается в уменьшении числа степеней свободы f. Величину f теперь рассчитывают из соотношения: , где . В зависимости от различия между и значение f изменяется в пределах ( n - 1) ≤ f ≤ 2 ( n - 1). После определения величины f принимают или опровергают гипотезу о различии между х и у так же, как это уже делали ранее. Сравнение среднего результата с истинным. Задачи оценки значимости расхождения результата измерения х и истинным значением μ решается так же с помощью t-критерия , где n - число измерений, по которым рассчитывался контролируемый результат х; S - стандартное отклонение, характеризующее воспроизводимость измерения контролируемой величины х. Значение t, рассчитанное по формуле, сравнивается с табличным для уровня значимости α и числа степеней свободы f, по которым определяли S. Если t < t(0,05, f), то расхождение между х и μ случайно; если t > t(0,01, f), то отличие х от μ носит систематический характер. Наличие систематической погрешности будет выявлено более надежно, если при расчете t применять S, определенное по большому числу f. Под истинным значением понимается значение, которое установлено со случайной погрешностью много меньшей, чем контролируемая величина х. При стандартных образцов с истинным (в данном случае правильнее сказать «действительным») значением служит аттестованное содержание определяемого компонента; при использовании способа добавок под значением μ подразумевается величина добавки определяемого компонента. Как это ни парадоксально, но при сопоставлении теории и эксперимента истинным служит теоретическое значение, хотя правильность теории контролируется экспериментом. 2.8. Основы планирования и проведения эксперимента Под планированием эксперимента понимается определение цели каждого эксперимента, число серий и измерений в каждой серии, достижение оптимума соотношения экономии материалов и адекватности проведенных измерений. Однако мало спланировать – необходимо еще так провести эксперимент и оформить его результаты, чтобы они могли быть адекватно восприняты другими исследователями и могли в случае необходимости подтвердить приоритет данного исследователя или лаборатории. 2.8.1. Определение необходимого числа измерений При планировании эксперимента необходимо помнить, что каждое измерение – это затраты времени и ресурсов (трудовых, материальных, финансовых). В определении числа измерений надо учитывать следующие аспекты: 1 • возможность пренебрежения коэффициентом Стьюдента в вычислении погрешностей измерений. Это можно сделать при более чем 7–10 измерениях при уровне доверительной вероятности α = 0,68 (который используется по умолчанию), и при более чем 15–20 измерениях при уровне доверительной вероятности α = 0,95; 2 • окончательный результат многократного измерения содержит в себе как случайную, так и приборную погрешности. Поскольку случайная погрешность уменьшается с увеличением количества измерений как , а приборная остается постоянной, целесообразно сделать столько измерений, чтобы <<, то есть случайной погрешностью можно было пренебречь по сравнению с приборной погрешностью θ. Поскольку, можно установить, что мы можем пренебречь первым слагаемым, если < (часто полагают k=2), для чего необходимо провести N измерений. Пусть уже проведено n измерений и получена погрешность измерений(число измерений таково, что мы пренебрегли коэффициентом Стьюдента). Погрешность отдельного измерения можно оценить как . Поскольку , то . • для минимизации числа измерений используется последовательный анализ, то есть такой способ статистической проверки гипотез, при котором необходимое число наблюдений не фиксируется заранее, а определяется в процессе самой проверки. Во многих случаях для получения столь же обоснованных выводов применение надлежащим образом подобранного способа последовательного анализа позволяет ограничиться значительно меньшим числом наблюдений (в среднем, так как число наблюдений при последовательном анализе есть величина случайная), чем при способах, в которых число наблюдений фиксировано заранее. Пусть задача состоит в выборе между гипотезами H1 и H2 по результатам независимых наблюдений. Гипотеза H1 заключается в том, что случайная величина х имеет распределение вероятностей с плотностью f1(x), гипотеза H2 — в том, что х имеет плотность f2(x). Для решения этой задачи поступают следующим образом. Выбирают два числа А и В (0<А<В). После первого наблюдения вычисляют отношение λ1 = f2(x1)/f1(x1), где x1 — результат первого наблюдения. Если λ1 < A, принимают гипотезу H1; если λ1 > B, принимают H2; если A ≤ λ1 ≤ B, производят второе наблюдение и так же исследуют величину λ2 = f2(x1) f2(x2)/f1(x1) f1(x2), где x2 - результат второго наблюдения, и т.д. С вероятностью, равной единице, процесс оканчивается либо выбором H1, либо выбором H2. Величины А и В определяются из условия, чтобы вероятности ошибок первого и второго рода (то есть вероятность отвергнуть гипотезу H1, когда она верна, и вероятность принять H1, когда верна H2) имели заданные значения α1 и α2. 2.8.2. Ведение лабораторного журнала Лабораторный журнал – официальный документ, имеющий юридическую силу, в котором в последовательном хронологическом порядке указываются условия проведения экспериментов и результаты измерений. Аккуратное ведение лабораторного журнала позволяет исследователю создать адекватный и поддающийся проверке отчет, защитить свой приоритет относительно сделанного им открытия. Лабораторный журнал представляет собой тетрадь (журнал) с пронумерованными страницами, прошитыми страницами толстой ниткой, концы которой скреплены на последней странице сургучом с оттиском официальной печати учреждения. Данные следует вписывать ручкой, но не карандашом. Если в процессе занесения в журнал результатов эксперимента были позже обнаружены описки или фактические ошибки, они вносятся ручкой другого (красного) цвета, ставится дата и фамилия исправляющего. Конечно, эти требования несколько чрезмерны для выполнения студентами лабораторных работ, но и здесь желательны точность и аккуратность. Каждый рабочий день в лабораторном журнале выделяется отдельно: дата в начале рабочего дня и заполнение (Z) до начала следующего (чтобы нельзя было в дальнейшем сделать записи этой датой). Если журнал общий для всей лаборатории, для каждого эксперимента указывают фамилии его участников. Так же для эксперимента необходимо указывать цель, используемые материалы, условия проведения (температура, давление, напряженность магнитного поля, частота вращения и т.д.), продолжительность, описание трудноформализуемых параметров. Это делается как для того, чтобы опыт мог воспроизвести любой другой исследователь, так и для самого экспериментатора – впоследствии можно проанализировать ход эксперимента, наметить пути повышения точности измерений, продумать следующие эксперименты, учесть все факторы при оформлении научных отчетов и статей. Перед проведением эксперимента исследователь должен заранее продумать роль различных факторов, стоимость используемых в эксперименте ресурсов, учесть возможные риски для экспериментатора и окружающих, принять необходимые меры безопасности. Все это надо заранее записать в лабораторный журнал, подготовить таблицы для записи однотипных данных. 2.8.3. Требования к оформлению научного отчета Научный отчет о проведенных исследованиях является не менее важным, чем лабораторный журнал – по нему другие исследователи смогут ознакомиться с вашими результатами. Цель отчета – изложить цель, ход и результаты эксперимента в виде, в котором их наиболее удобно понять и проверить другим людям. В частности, это касается и отчетов о выполнении студентами лабораторных работ – их будут проверять преподаватели и использовать другие студенты. Важным свойством научного (и любого) отчета является доверие к нему со стороны читателей. Это значит, что в отчете обязательно следует привести те экспериментальные или статистические данные, на которых основываются ваши выводы – при желании исследователь может повторить расчеты и проверить их достоверность и адекватность полученных вами результатов. Естественно, что они должны быть полностью перепроверены перед представлением отчета научной общественности (или преподавателю). В отчете нет необходимости рассказывать всю историю получения результатов, а так же приводить данные экспериментов, которые соответствуют тупиковым ветвям исследований, или не важны для анонсируемых результатов. Однако все актуальные данные должны быть приведены, независимо от того, свидетельствуют они за или против представленной теории. При оформлении отчета стоит выделять те экспериментальные данные, результаты и идеи, которые получены другими исследователями и лабораториями. Заниматься плагиатом, то есть присваивать себе авторство, небезопасно – в случае уличения исследователь может считать свою научную карьеру завершенной, а студент – не ждать хорошей оценки. В отчете должны быть четко выделены разделы: 1 •Название отчета – как правило, приводится на титульной странице. 2 •Данные о группе исследователей, выполнивших эксперимент, и лаборатория (предприятие), в котором он проводился. 3 •Цель исследований – кратко формулируются основные задачи или необходимость достижения определенных результатов. 4 •Экспериментальные данные – по аналогии с лабораторным журналом, необходимо указывать используемые материалы, условия проведения (температура, давление, напряженность магнитного поля, частота вращения и т.д.), продолжительность и другие параметры эксперимента, важные для его воспроизведения. 5 •Теоретические выкладки, позволяющие читателям понять те модельные функциональные зависимости, в рамках которых происходит интерпретация экспериментальных данных. 6 •Обработка экспериментальных данных – представление данных в графическом (более наглядном для понимания виде), оценка параметров функциональных зависимостей, их погрешностей, статистическая проверка гипотез об адекватности используемых моделей. При использовании программных пакетов указывайте их название, версию и значения численных параметров, используемых при обработке данных. 7 •Результаты исследования – приводятся выводы о подтверждении или опровержении рассматриваемых гипотез. Следует использовать глаголы «исследованы», «проверены», «измерены» и т.п. 8 •Список литературы – библиографические ссылки на те книги и статьи, из которых были использованы экспериментальные данные, результаты или идеи. Для записи результатов большого количества однотипных измерений удобно использовать таблицы. С их помощью удается избежать ненужной многократной записи обозначения измеряемой величины, единиц измерения, используемых масштабных коэффициентов и т.п. В таблицы, помимо экспериментальных данных, могут быть сведены промежуточные результаты обработки этих данных. В заголовок таблицы заносятся размерности величин, характерные степени. Таблицы чертятся с помощью линейки и карандаша (если отчет рукописный). В таблице указывается порядковый номер каждого измерения. Более наглядными, чем таблицы, являются графики зависимостей исследуемых физических величин. Графики дают визуальное представление о связи между величинами, что крайне важно при интерпретации полученных данных, так как графическая информация легко воспринимается, вызывает больше доверия, обладает значительной емкостью. На основе графика легче сделать вывод о соответствии теоретических представлений данным эксперимента. При построении графика следует учитывать следующие характеристики: 0 •Оси – графики, за редким исключением, строят в прямоугольной системе координат, где по горизонтальной оси (оси абсцисс) откладывают аргумент, независимую величину, а по вертикальной оси (оси ординат) – функцию, зависимую величину. 1 •Масштаб по осям – численное значение физической величины, соответствующее единичному отрезку. Оси необязательно должны содержать начало координат – обычно учитывают минимальное и максимальное значение. При необходимости выбирают логарифмический или двойной логарифмический масштаб. 2 •Подписи осей – название откладываемой величины, масштабный коэффициент. 3 •Шкала – подписи к осям в виде числового масштаба, с учетом масштабного коэффициента. Обычно выбираются некие «круглые» числа, с минимумом знаков после запятой. 4 •Масштабная сетка – для удобства определения величин конкретных точек делают тонкие вертикальные и горизонтальные линии, которые являются продолжениями отметок шкалы. 5 •Экспериментальные точки – должны быть отчетливо видны. Если на одном графике показаны несколько зависимостей, их надо выделить точками разного вида (кружочки, ромбики, квадратики и т.д.). 6 •Проведение кривых – экспериментальные точки соединяют плавной кривой, чтобы они в среднем были одинаково расположены по обе стороны от проведенной кривой. Если известно математическое описание наблюдаемой зависимости, то теоретическая кривая проводится точно так же. Правильно построенная кривая должна заполнять все поле графика, что будет свидетельством правильного выбора масштабов по каждой из осей. Если же значительная часть поля оказывается незаполненной, то необходимо заново выбрать масштабы и перестроить зависимость. 7 •Погрешности измерений - вокруг проставленной экспериментальной точки строят два отрезка, параллельные осям абсцисс и ординат. В выбранном масштабе длина каждого отрезка должна равняться удвоенной погрешности величины, откладываемой по параллельной оси. Центр отрезка должен приходиться на экспериментальную точку. 8 •Название – под графиком должно быть приведено его название, поясняющее, к чему относится изображенная зависимость. 2 Все страницы, таблицы, формулы, схемы и графики должны быть пронумерованы (в порядке использования). В начале отчета обычно приводят содержание отчета. Если таблицы или графики имеют значительный размер и мешают связанному восприятию текста, их стоит вынести в приложение и дать на них ссылку в тексте. 1 3. ИСПОЛЬЗОВАНИЕ ДИСПЕРСИОННОГО АНАЛИЗА В МЕТОДИЧЕСКИХ ИССЛЕДОВАНИЯХ 2 Оценивая разброс результатов исследований вокруг среднего значения, определяем дисперсию воспроизводимости методики исследования (анализа), характеризующую сумму погрешностей, вносимых на различных этапах исследования (анализа). Экспериментатору, когда он проводит исследования с целью повышения точности исследования или анализа, необходимо знать, на каких этапах вносится наибольший вклад в суммарную дисперсию. Например, при рентгеноспектральном анализе образца погрешности могут быть внесены при отборе анализируемой навески (погрешности неоднородности материала), при изготовлении излучателя, измерении интенсивности аналитической линии, расчете содержания. В зависимости от выбранного способа пробоподготовки второй этап можно разбить на ряд подэтапов. При получении излучателей в виде стеклянных дисков можно выделить погрешности, вносимые при взвешивании и перемешивании пробы и флюса, сплавлении, отливке излучателя. При химическом анализе можно выделить этапы: отбор анализируемой навески; вскрытие или разложение ее, отделение мешающих компонентов; измерение аналитического сигнала. Для повышения воспроизводимости методики исследования прежде всего следует совершенствовать тот этап, на котором вносится наибольшая погрешность. Это положение наглядно подтверждает закон сложения погрешностей. Если имеем две независимых случайных величины х и у, точность измерения которых характеризуется дисперсией соответственно и , то дисперсия суммы или разности этих величин z = х + у равна: . Геометрически выражение можно интерпретировать как сложение двух векторов (рис. 8, а). Рис. 8. Геометрическая интерпретация закона сложения погрешностей Обозначим через х и у этапы, на которых вносится в суммарную дисперсию значения и . При совершенствовании методики исследования выполнение этапа улучшили в 2 раза, то есть уменьшили в 2 раза, но значение результатов исследования практически не изменилось (рис. 8, б). Иное наблюдается при уменьшении в 2 раза вектора (рис. 8 в). Данные, приведенные на рис. 8, наглядно демонстрируют необходимость знания погрешностей, вносимых на различных этапах анализа. Обозначим через х и у этапы, на которых вносятся в суммарную дисперсию значения и . При совершенствовании методики исследования выполнение этапа улучшили в 2 раза, т.е. уменьшили в 2 раза, но значение результатов исследования почти не изменилось (рис. 8, б). Иное наблюдается при уменьшении в 2 раза вектора (см. рис. 8, в). Данные, приведенные на рис. 8, наглядно демонстрируют необходимость знания погрешностей, вносимых на различных этапах анализа. С помощью эксперимента, специально спланированного по схеме дисперсионного анализа, можно разложить суммарную дисперсию на составляющие, обусловленные действием различных факторов. Под факторами понимают условия проведения процесса, которым может управлять методист-исследователь. При исследовании вещества варьирование полученных результатов вокруг среднего значения происходит не только за счет случайных помех, действие которых не может контролировать исследователь, но и в результате закономерного изменения одного или нескольких постоянно действующих факторов, например, размер частиц анализируемого материала, стабильность поддержания температуры сплавления навески пробы, pН растворителя и т.д. В зависимости от числа факторов, действие которых на результаты анализа собираемся оценивать, дисперсионный анализ может быть однофакторным, двухфакторным и многофакторным. Простейшая схема однофакторного дисперсионного анализа дает возможность суммарную дисперсию разложить на две величины: дисперсию , обусловленную техникой эксперимента, то есть воспроизводимость результатов эксперимента; и дисперсию , обусловленную действием изучаемого фактора. При двухфакторном эксперименте суммарная дисперсия разлагается на дисперсию воспроизводимости результатов эксперимента и две дисперсии и , характеризующие влияние каждого фактора на аналитический сигнал или содержание компонента. Проведение дисперсионного анализа подразумевает выполнение трех этапов: 1) специальное планирование эксперимента, в соответствии с которым исследователь управляет по заданной программе воздействием факторов на изучаемый параметр; 2) проведение эксперимента в соответствии с составленным планом; 3) специальная обработка результатов эксперимента. Из перечисленных этапов только выполнение третьего можно формализовать. Ниже будут приведены формулы для расчетов, показывающие расположение цифрового материала для упрощения расчетов. Наиболее сложной частью дисперсионного анализа является планирование эксперимента. Эту часть работы каждый исследователь должен выполнять сам, так как для планирования эксперимента нужно знать тонкости исследуемого процесса, чтобы корректно отделить действие изучаемого фактора на выбранный параметр от других факторов. О планировании одно-, двух- и трехфакторных экспериментов будут даны только общие понятия. 3.1. Однофакторный дисперсионный анализ Рассмотрим схему однофакторного дисперсионного анализа на примере проверки химической однородности анализируемого материала. По каким-либо причинам возникло подозрение, что материал, поступающий на анализ, плохо перемешан. Для проверки гипотезы планируем следующий эксперимент: весь материал, поступающий на анализ, делим на m частей и из каждой части однократным зачерпыванием шпателя отбираем пробу, то есть получили m проб. Отобранные пробы лучше дополнительно перемешать (усреднить), чтобы гарантировать однородность материала в каждой пробе. Материал каждой отобранной пробы делим на n частей и помещаем а пакеты; имеем mn пакетов (проб). Чтобы исключить какую-либо корреляцию между результатами, все пакеты произвольно шифруют, а затем передают на анализ. Полученные mn результатов анализов для удобства лучше представить в виде табл. 3. Таблица 3 Результаты однофакторного дисперсионного анализа Проба Результат анализа 1 2 3 … n 1 Х11 Х12 Х13 … Х1n 2 Х21 Х22 Х23 … Х2n 3 Х31 Х32 Х33 … Х3n … … … … … … m Хm1 Хm2 Хm3 … Хmn Обозначим текущий индекс по строкам через j, а по столбцам — через i. В каждой строке таблицы расположены результаты анализа, полученные для одной пробы, материал которой хорошо усреднен, поэтому рассеяние их вокруг среднего значения результатов, помещенных в строке, характеризует воспроизводимость измерения. Рассеяние между средними результатами хj по строкам зависит от неоднородности исследуемого материала. Чтобы разложить суммарную дисперсию на составляющие, нужно найти воспроизводимость определений и . Значение можно определить, рассчитывая дисперсию результатов для каждой строки и усредняя найденные значения , или следует найти дисперсию средних значений по всем строкам по отношению к общему среднему : , где — дисперсия неоднородности материала. Деление второго слагаемого выражения на n обусловлено тем, что рассчитывается по средним значениям хj, найденным из n измерений. Обычно для упрощения вычислений находят следующие вспомогательные суммы квадратов: сумм квадратов всех результатов, помещенных в табл. 3: ; сумму квадратов итогов по строкам, деленное на число результатов в строке: ; квадрат общего итога, деленный на число результатов, помещенных в табл. 3: . Результаты расчетов лучше представить так, как это показано в табл. 4. Прежде чем приступить к определению компонентов дисперсии, необходимо убедиться в значимости различия между дисперсиями и . Для проверки нуль-гипотезы используют F-критерий: . При этом в числитель обязательно ставят величину независимо от ее конкретного значения и пользуются односторонним F-критерием, так как проверяем гипотезу σ2 ≥ σ1. В некоторых редких случаях сталкиваемся с тем, что оказывается значимо меньше . В принципе это может быть следствием появления того редкого события, вероятность которого задается значением α, но чаще это является результатом неправильного планирования эксперимента, или нарушения условий его проведения или допущенной погрешностью расчета. Рассчитанное значение F сравниваем с табличным значением F(α, f1=m-1, f2=m(n-1)). Если F>F(α, f1, f2). то σ2 > σ1: такое имеет место только, если σ2 > 0. В этом случае можно определить компоненты дисперсии, пользуясь соотношениями: и . Таблица 4 Представление результатов дисперсионного анализа Рассеяние между Сумма квадратов Число степеней свободы f Дисперсия Компоненты генеральной дисперсии Строками m - 1 Столбцами m(n – 1) Решая их, получим: ; . Если F> А, рассчитываем значение: . Значение t(α, f) в формуле определяют для числа степеней свободы f, по которым оценивали Sв. Если значение μ попадет в доверительный интервал Z ± ΔZ, то значимые систематические погрешности в результатах анализа отсутствуют, в противном случае можно считать, что методика содержит систематические погрешности. На второй из поставленных выше вопросов можно ответить, если определить, какой систематической погрешностью можно пренебречь. В метрологии существует правило: вкладом в суммарную погрешность (S∑ ) можно пренебречь, если его величина в 2-3 раза меньше значения Sв. Опираясь на это правило, записываем условие: Sс ≤ К Sв, где К изменяется в пределах 0,3-0,5. Чтобы выявить величину Sс при данной оценке воспроизводимости измерения, необходимо, по крайней мере, выполнения равенства Sс = Sz. Из данного выражения, положив в нем n1 = n2 = n, можно определить необходимое число независимых анализов проб в добавкой и без нее: . Принимая во внимание условие, получим: . Если положить К = 0,5, то число результатов анализа должно быть n = 8; при К=0,33 значение n=I8. Вследствие резкого возрастания трудоемкости эксперимента при использовании условия Sс = 0,3 SВ, считаем целесообразным ограничиться условием Sс = 0,3 SВ. Таким образом, при проверке правильности методики анализа способом добавок рекомендуется для естественной пробы и пробы с добавкой проводить по 8 независимых анализов. При определении величины добавки накладывают ограничение сверху и снизу на значение μ. Ограничение сверху: величина добавки должна быть такой, чтобы не выйти за область линейности градуировочной характеристики при сохранении однозначности условий получения результатов и . При принятии этого решения формализованный подход отсутствует. Ограничение снизу должно зависеть от воспроизводимости результатов анализа исследуемой методикой: значение μ должно быть, по крайней мере, больше доверительного интервала ΔZ (значение SВ определено по большому числу измерений, по крайней мере f > 20), то есть . Чтобы уверенно фиксировать значение μ, необходимо, чтобы оно, по крайней мере в 3 раза превосходило значение SВ, то есть величина добавки должна быть μ > 3 SВ. Сравнение результатов анализа по исследуемой и контрольной методикам. Правильность методики можно оценивать сопоставлением полученных с ее помощью результатов с данными другой методики, желательно принципиально отличной от первой. Кроме того, желательно, чтобы правильность результатов контрольной методики оценивалась с помощью стандартных образцов. Для этого партию проб анализируют сравниваемыми методиками (табл. 9) Таблица 9 Результаты анализа проб сравниваемыми методиками Проба Методика 1 Методика 2 Разность 1 Х1 У1 d1 2 Х2 У2 d2 3 Х3 У3 d3 … … … … … m Хm Уm dm Сумма - - С помощью t -критерия следует оценить отличие от нуля средней разности результатов анализа для выбранной группы проб: ; ; . Отметим, что значения dj в формулах суммируются с учетом знаков. Оценку значимости расхождения между результатами двух методик анализа изложенным способом можно проводить лишь в том случае, если концентрация определяемого компонента в используемых при этом пробах изменяется в сравнительно узких пределах: не более чем в три раза. Эти пределы можно существенно расширить, если при расчетах по приведенным формулам вместо значения dj использовать относительное расхождение δ = dj / уj, где уj — кон- центрация определяемого компонента в j-й пробе, установленная с помощью контрольной методики. Рассчитанное значение t сравнивается с табличным значением t(α, f), найденным для f = m - 1. Если t > t(α, f), то делаем вывод, что между результатами анализа сравниваемыми методиками наблюдаются систематические расхождения. Полагаем, что контрольная методика дает правильные результаты анализа, поэтому систематические погрешности содержатся в результатах анализа исследуемой методики. При t < t(α, f), можно сделать два вывода: во-первых, систематические погрешности в результатах анализа, выполненного по исследуемой методике, отсутствуют; во-вторых, систематические погрешности в результатах анализа, выполненного по исследуемой методике, содержатся, но в зависимости от каких-либо химических или физических свойств рассматриваемой группы проб (например, неполный учет межэлементных взаимодействий или крупности частиц образца) результаты анализа могут либо завышены, а других — занижены. Чтобы определить, какое из указанных положений справедливо, нужен дополнительный статистический анализ результатов. Отметим, что в ситуации, когда t < t(α, f), систематическую (методическую) погрешность анализа для группы проб имеем право характеризовать дисперсией σми2. Оценкой расхождения между результатами, полученными с помощью контрольной и исследуемой методик, служит дисперсия: . Значение σми2 представляет собой сумму следующих компонент: , где дисперсии, характеризующие воспроизводимость результатов измерений соответственно контрольной и исследуемой методиками. При известных значениях , решая совместно уравнения можно найти величину σми2. Однако прежде, чем приступить к вычислению σми2, необходимо оценить по F-критерию значимость отличия дисперсии и . Если сравниваемые дисперсии и однородны, то исследуемая методика не содержит значимых систематических погрешностей. Если сравниваемые дисперсии неоднородны, то исследуемая методика анализа содержит методические погрешности, которые характеризуются стандартным отклонением: . Сравнение результатов анализа проб, полученными исследуемой и контрольной методиками при планировании эксперимента по схеме дисперсионного анализа. При использовании специального планирования эксперимента по схеме однофакторного дисперсионного анализа можно одновременно оценить воспроизводимость и правильность результатов анализа. Для этого следует отобрать m проб, каждую из которых независимо проанализировать К раз контрольной методикой. Затем материал каждой пробы разделить на n частей, поместить в пакеты и зашифровать. Полученные mn подпробы необходимо проанализировать исследуемой методикой. Результаты анализа проб исследуемой х1, х2, хjn и контрольной (средний) методиками лучше свести в табл. 10, где . Таблица 10 Результаты анализа Проба … … 1 … … 2 … … … … … … … … … … … … m … … Для оценки дисперсии σки2, характеризующей расхождение значений , и , следует ввести новую переменную , что позволит сделать однородной выборку, состоящую из результатов анализа проб с различной концентрацией определяемого компонента. В каждой строке таблицы имеются значения , полученные для материала одной пробы, поэтому расхождение между ними характеризует воспроизводимость (σви2) результатов анализа исследуемой методики. Рассеяние между средними результатами по строкам таблицы определяет методическую погрешность исследуемой, методики. Дальнейшая обработка значений случайной величины проводится так же, как было показано ранее. Находим две выборочные дисперсии и , которые являются оценками следующих генеральных дисперсий: ; . Прежде чем решать систему уравнений, проверяют значимость отличия дисперсий и . Если <, то исследуемая методика значимых методических погрешностей не содержит. Если , то определяем оценку значений σви2: . Принимаем, что контрольная методика значимых систематических погрешностей не содержит, поэтому найденное значение σви2 состоит из двух компонент: . где - дисперсия воспроизводимости контрольной методики; к — число измерений, по которым рассчитывали среднее значение . Чтобы найти значение , следует сравнить по F-критерию значения и /к. Если <, то исследуемая методика систематических погрешностей не содержит, в противном случае — содержит, и значение ее равно . Более полную информацию о точности исследуемой методики анализа можно получить, если планировать эксперимент по многоступенчатой схеме дисперсионного анализа. Такой эксперимент позволит не только оценить правильность и суммарную воспроизводимость методики, но и определить погрешности, возникающие на отдельных этапах исследования. Дать обобщенный план такого эксперимента не представляется возможным, так как его реализация определяется конкретными этапами выполнения анализа. 4.4. Оценка чувствительности методики В аналитической практике для характеристики чувствительности методики используют такие три понятия: коэффициент чувствительности, предел обнаружения, определяемый минимум. Коэффициент чувствительности Д характеризует изменение аналитического сигнала ΔI на единицу концентрации ΔС: Д = ΔI / ΔС. Коэффициент чувствительности Д характеризует вид градуировочного графика и равен тангенсу угла наклона этого графика. Предел обнаружения Спр — это минимальное содержание элемента в пробе, которое может быть обнаружено рассматриваемой методикой с заданной вероятностью. Определяемый минимум (или предел определения) — это минимальное содержание элемента в пробе, которое может быть определено рассматриваемой методикой с заданной воспроизводимостью. Две последние характеристики являются наиболее важными, так как они в большей степени характеризуют возможности методики при определении малых содержаний элемента. Предел обнаружения. Впервые основы статистической интерпретации предела обнаружения элемента введены Г. Кайзером. Согласно его интерпретации за предел обнаружения Спр принимается такое содержание элемента в пробе, при котором среднее значение разности между сигналом х от пробы и сигналом ххол для холостой пробы в К раз превышает стандартное отклонение σхол, характеризующее разброс результатов измерения сигнала ххол от холостой пробы, то есть . Значение Спр определяют по формуле , где (Д)С→0 — коэффициент чувствительности для содержаний, близких к значению Спр. Если градуировочный график проходит через начало координат то: где I0 — значения аналитического сигнала образца сравнений с содержанием С0. Значение коэффициента К определяется выбранной вероятностью Р утверждения, что элемент в пробе присутствует. Г. Кайзер предлагает, использовать К=3, что при нормальном распределении значений сигнала «холостого» опыта соответствует Р = 0,997. При оценке чувствительности методики с помощью приведенных соотношений необходимо знать σхол. От способа определения σхол существенно зависит достоверность оценки предела обнаружения. Предлагается определять σхол, учитывая только статистическую ошибку счета импульсов: . где N — число импульсов, сосчитанных при измерении интенсивности фона. Этот способ определения σхол применим при определении Спр химическими методами и многими физическими. Определяемый минимум. При использовании методики количественного анализа важно знать, с какой точностью мы определяем конкретное содержание элемента в пробе, поэтому более полную информацию о возможности определения данной методикой малых концентраций элементов в пробе может дать значение определяемого минимума Сопр. Сравнительно редкое использование этой характеристики для оценки чувствительности методик анализа можно объяснить только более высокой трудоемкостью установления Сопр по сравнению с пределом обнаружения Спр и тем, что значения Сопр и Спр существенно связаны между собой. Определяемый минимум находят, используя график зависимости оценки воспроизводимости (SВ или Sr,В ) измерения концентрации СА, элемента А в пробе от СА. Для его построения используют группу проб, имеющих разное содержание элемента А: С1, C2, С3, …, Сm. Каждую пробу следует независимо проанализировать n раз и оценить стандартное отклонение SВj (или относительное стандартное отклонение Srj), характеризующее воспроизводимость измерения значения Сij. Далее строят график: по оси ординат откладывают значения Sj (или Srj), а по оси абсцисс соответствующее среднее значение концентрации Сj для элемента А в j-й пробе (рис. 9 и 10). Рис. 9. Градуировочный график для определения SiO2 в глиноземе Рис. 10. График зависимости (1) и 4.5. Экспрессность, производительность и информативность методик Экспрессность методики определяется временем, затрачиваемым на получение одного результата анализа или исследования при последовательном выполнении всех его операций. Производительность методики определяется числом независимых результатов анализа, полученных одним исследователем за единицу времени. Информативность, например, для рентгено-флуаресцентного метода анализа, Ринф это возможность методики давать информацию о химическом составе (или каким-либо другим фактором) объекта анализа. Величина Ринф будет тем больше, во-первых, чем меньше необходимые затраты времени t на получение одного результата анализа по сравнению с имеющимся в распоряжении временем tА, во-вторых, чем больше различных сигналов можно выделить и зарегистрировать используемой аппаратурой, в-третьих, чем меньше оценка случайной погрешности σх по сравнению с интервалом определяемых содержаний (СВ, СН), анализируемых данной методикой: где ν0-ν — область длин волн, в которой работает данный прибор; Δν — разрешающая способность прибора. Данное выражение показывает, что информативность методики определяется в основном затрачиваемым временем и разрешающей способностью аппаратуры. Влияние точности анализа сказывается на величину Ринф менее заметно, так как σх входит под знаком логарифма. Если интервал определяемых содержаний (СВ, СН) данной методики большой, то значение Ринф практически не зависит от предела обнаружения элементов данной методикой. Такое заключение является неверным, ибо с уменьшением значения Спр существенно повышаются аналитические возможности методики, поэтому должна расти ее информативность. Это указывает на несовершенство выражения. При расчете Ринф методик, использующих спектрометры с фиксированными каналами (квантометры), величина определяется числом каналов, установленных на приборе. Следует отметить, что информативностью можно характеризовать не только возможности анализа, но и аппаратуры. Метрологические характеристики методик анализа могут изменяться со временем под действием внутренних (связанных физическим или химическим состоянием пробы) и внешних (смена реактивов, неисправность прибора, недостаточная квалификация лаборантов и другие) условий анализа. Причины изменений можно классифицировать на объективные и субъективные. Объективными изменениями метрологических характеристик методик анализа считают такие, которые в равной мере отражаются на качестве результатов анализа, проводимого всеми аналитиками лаборатории. Они обычно связаны с изменением режима работы аппаратуры, физических и химических свойств анализируемых проб или используемых реактивов и т.д. Субъективные изменения метрологических характеристик связаны с нарушениями каких-либо условий анализа отдельными исследователями. Поэтому организация контроля аналитической службы лаборатории идет в двух направлениях: контроль объективных и субъективных изменений, метрологических характеристик методик анализа. Контроль за объективными причинами изменения воспроизводимости и правильности анализа можно осуществлять, составляя контрольные карты. Для этого необходимо иметь стандартный образец (СО) любой категории, который требуется периодически анализировать вместе с текущими пробами. При этом целесообразно каждый раз повторять все этапы анализа. Результаты анализа стандартного образца наносят на карту. Контрольная карта представляет собой лист миллиметровой бумаги, на которой по оси ординат нанесены аттестованное содержание определяемого компонента и границы +Δх, —Δх доверительного интервала, в который с оговоренной вероятностью (Р,%) должен попасть результат анализа СО контролируемой методикой. Значение Δх рассчитывают с помощью выражения: . На оси абсцисс указывают время проведения анализа. Если результат анализа СО оказался за границами, установленными на контрольной карте, следует тут же дважды повторить анализ СО, чтобы убедиться, что этот результат является неслучайным. На карту наносятся все три результата. Если Р, % или более результатов анализа попадают в установленные доверительные границы, то можно делать вывод, что метрологические характеристики методики анализа не изменились. Если менее чем Р, % результатов анализа попали в доверительные границы, то следует обратный вывод — метрологические характеристики изменились. После этого необходимо выяснить причины наблюдаемого изменения точности анализа и устранить их. 5. МОДЕЛИРОВАНИЕ ЭКСПЕРИМЕНТА В МЕТОДИЧЕСКИХ ИССЛЕДОВАНИЯХ Сущность математического планирования состоит в том, что по заданной программе одновременно варьируют всеми величинами (факторами), действие которых на изучаемый объект исследуется. В классическом эксперименте последовательно изучается действие одного фактора, в то время как другие строго стабилизированы. Использование математического планирования эксперимента позволяет не только сократить число опытов, но и целый ряд этапов эксперимента провести формализовано, что упрощает проведение исследований. К настоящему времени можно выделить два основных направления в математическом планировании эксперимента: планирование экстремальных экспериментов и планирование экспериментов по выявлению механизма явлений. Эксперименты первого типа планируют в тех случаях, когда исследователя интересуют условия, при которых изучаемый процесс удовлетворяет некоторому критерию оптимальности. Во втором случае исследователю необходимо выяснить поведение изучаемого объекта, то есть выяснить механизм явления. При выяснении механизма явления с помощью математического планирования в отличие от обычного использования данного термина подразумевается не прямое исследование взаимодействий, опирающееся на физические законы взаимодействия, а формализация этого явления. На этом этапе исследователь получает математическую модель изучаемого процесса, на основе которой он, специалист данной отрасли науки, привлекая теоретический аппарат, может сделать вывод о конкретном виде элементарных взаимодействий. 5.1. Общие понятия и термины Воспользуемся кибернетической моделью «черного ящика» для рассмотрения некоторых терминов, используемых при математическом планировании эксперимента. «Черный ящик» — это выбранные нами объекты исследования. Входы в «черный ящик» (х1, х2, х3, …, хк) — это способы воздействия на объект исследования — называются факторами. Факторы - это независимые переменные, которые подчиняются воле экспериментатора. Совокупность всех значений, что может принять данный фактор, — его область определения. Значения, которые принимает фактор при проведении эксперимента, называются уровнями фактора. Выходы из «черного ящика» называются откликом, параметром оптимизации (уj). Решение задачи сводится к тому, чтобы выразить математически связь между параметром оптимизации и факторами: . Данное выражение называется функцией отклика, задают ее часто в виде степенного ряда или многомерного полинома: , где — эмпирические коэффициенты; — значения уровней соответственно i-го и j-го факторов. При математическом планировании эксперимента опыты проводятся для того, чтобы определить коэффициенты модели. Фиксированный набор уровней факторов — есть условие проведения одного из возможных опытов. Если перебрать все возможные сочетания выбранных уровней факторов, то определим возможное число N различных опытов, которое можно поставить при проведении данного эксперимента: , где к — число факторов, принятых в рассмотрение при изучении данного процесса; Р — число уровней для каждого фактора. Моделирование эксперимента предполагает активное вмешательство в процесс и возможность выбора в каждом опыте тех уровней факторов, которые представляют интерес, поэтому такой эксперимент называется активным, а исследуемый объект называется управляемым. На практике нет абсолютно управляемых объектов: на реальный объект обычно действуют как управляемые, так и неуправляемые факторы. Последние влияют на воспроизводимость эксперимента и являются причиной его нарушения. Необходимо, чтобы действие управляемых факторов было заметно на фоне неуправляемых. Поэтому одним из требований, предъявляемых к объекту, является выполнение условия: разброс значений параметра оптимизации при повторных опытах не превышал некоторой заранее заданной величины. Если требования воспроизводимости не выполняются, приходится обращаться к другим методам моделирования эксперимента (например, дисперсионному анализу), чтобы повысить точность измерения параметра оптимизации. 5.2. Требования к параметру оптимизации и факторам При моделировании оптимальных экспериментов параметром оптимизации служит признак, по которому оптимизируется процесс. Параметр оптимизации (у) — это отклик изучаемого процесса (объекта) на воздействие факторов. В исследованиях в качестве параметра оптимизации используется величина аналитического сигнала, стандартное отклонение, характеризующее точность определения, при повышении чувствительности анализа (в аналитической химии) — предел обнаружения, и т.д. Для успешного достижения цели исследования необходимо, чтобы параметр оптимизации действительно оценивал эффективность функционирования системы в заранее выбранном смысле. Это определяет корректность поставленной задачи. Представление об эффективности не остается постоянным в ходе исследований; оно может меняться по мере накопления информации об изучаемом процессе и в зависимости от достигнутой цели. Основное требование к параметру (у): он должен быть количественным (задаваться числом) и измеряться при любой комбинации уровней фактов, планируемых в эксперименте. Множество значений, которые может принять параметр (у), называется областью его определения. При выборе параметра (у) следует учитывать, чтобы он был эффективным в статистическом смысле, то есть определяться по возможности с большей точностью. Желательно, чтобы параметр оптимизации имел физический смысл и легко измерялся и вычислялся. Требование физического смысла обусловлено последующей интерпретацией математической модели. После выбора объекта исследования и параметра оптимизации нужно рассмотреть все факторы, которые, воздействуя на объект, могут изменить значение (у). Неучет того или иного фактора может ухудшить воспроизводимость измерения (у). С другой стороны, выбор большого числа факторов существенно увеличивает число опытов. Поэтому, после перечисления факторов, их следует критически рассмотреть на основе той информации, которая известна исследователю до постановки моделируемого (планируемого) эксперимента (априорная информация), мало влияющие факторы отсечь и по возможности строго застабилизировать, чтобы они не влияли на поведение объекта исследования. Фактор считается заданным, если вместе с его названием указана область его определения. Совокупность значений фактора, которая используется в эксперименте, является подмножеством из множества значений, образующих область определения. Факторы разделяются на количественные и качественные. К факторам предъявляются следующие требования: 1) управляемость: планировать эксперимент можно только в том случае, если уровни факторов подчиняются воле экспериментатора; 2) факторы должны непосредственно воздействовать на объект исследования, так как трудно управлять фактором, если он является функцией других переменных; 3) совместимость факторов и отсутствие корреляции между ними; если факторы, характеризуемые заданными уровнями, несовместимы, то опыт в этих условиях не поставить; если уровни факторов изменяются коррелированно, то управление факторами не подчиняется воле экспериментатора; 4) точность фиксирования уровней факторов должна быть по возможности высокой; чем уже диапазон изменения фактора, тем точнее должно фиксироваться значение его уровня. 5.3. Установление области определения факторов и выделение подобласти проведения эксперимента Моделирование эксперимента обычно выполняется, когда объект уже подвергался некоторым исследованиям. Эту априорную информацию используют для выбора параметра оптимизации, факторов и нахождения их области определения, а также для выбора подобласти, в которой целесообразно планировать эксперимент. Последнее особенно корректно должно быть выполнено при планировании экстремальных экспериментов. Рассмотрим на конкретном примере, как используется априорная информация для установления области определения факторов. При поиске условий рентгеноспектрального определения ниобия, обеспечивающих наилучшую чувствительность, в качестве параметра оптимизации использовали предел обнаружения этого элемента; факторами служили напряжение (x1) и сила тока (х2), подаваемые на рентгеновскую трубку, время набора импульсов (x3). Для питания рентгеновской трубки используется ВИП-50-I00, максимальное напряжение и сила тока, генерируемые этим аппаратом, составляют 50 кВ и I00 мA. Эти значения могут служить верхними границами области определения факторов х1 и х2 при условии совместимости уровней факторов. Однако мощность, которую способна выдержать рентгеновская трубка, составляет 3,5 кВт, а если задать верхние значения уровней факторов 50 кВ и 100 мА, то мощность будет равна 5 кВт. Следовательно, уровни факторов несовместимы, поэтому ограничим верхние пределы значениями 45 кВ и 75 мA. Чтобы установить нижнюю границу области определения первого фактора, обратимся к условиям возбуждения рентгеновских спектров. Известно, что потенциал возбуждения К-серии Nb равен I9,0 кВ. Следовательно, область определения 20 ≤ x1 ≤ 45 кВ. Для нижней границы второго фактора принципиальных ограничений нет: известно, чем меньше значение х2, тем меньше, интенсивность флуоресценции I2j, но меньше и интенсивность фона Ib. Примем нижнюю границу области определения фактора х2, равной 1 мА. Таким образом, I ≤ x2 ≤ 75 (мA). Значение для нижней границы х3 обусловлено статистической природой распределения рентгеновских квантов во времени и пространстве. Возникающие вследствие этого погрешности σст счета импульсов оцениваются , где — число импульсов, набранных при измерении интенсивности фона Ib. Значение Ib определяется конструкцией прибора, используемого в эксперименте, поэтому область определения фактора х3 устанавливается, опираясь на данные однофакторных экспериментов, которые необходимо выполнить до выбора условий математического планирования эксперимента. Примем, что 10≤ х3 ≤600 с. При изучении объекта с помощью полного факторного эксперимента число N опытов можно сократить минимизацией числа Р уровней факторов (Р = 2) или уменьшением числа К факторов. Первый путь лучше, так как позволяет изучить влияние наибольшего числа факторов при минимальном количестве опытов. Чтобы установить подобласть для постановки эксперимента при Р = 2, обычно выбирают точку в области определения фактора и вокруг нее варьируют. Эта точка называется основным или нулевым уровнем (), а величина (), на которую изменяют ее значение, называется интервалом варьирования. Таким образом, выбор подобласти в факторном пространстве для постановки эксперимента сводится к выбору для каждого фактора значений и. При планировании экстремального эксперимента за нулевой уровень принимают точку в факторном пространстве, где в соответствии с априорной. информацией изучаемый процесс идет лучше, чем в других точках, но не настолько хорошо, чтобы удовлетворить исследователя. Если эксперимент планируется с целью определения механизма изучаемого явления, то за нулевую точку целесообразно принять центр области факторного пространства, которая представляет интерес для исследователя. Интервалом варьирования факторов называется некоторое число (свое для каждого фактора), прибавление которого к основному уровню дает верхний, а вычитание — нижний уровень фактора. Таким образом, если —интервал варьирования i-го фактора, а — основной уровень этого фактора, выраженный натуральным числом, то натуральные значения нижнего и верхнего уровней i--го фактора соответственно выразится: ; . Для упрощения записей условий эксперимента и обработки опытных данных значения нижнего () и верхнего () уровней задаются некоторым кодированным числом ; . Тогда для любых факторов, независимо от величины основного уровня и интервала варьирования, кодированное значение верхнего уровня фактора принимает значение +1, а нижнего -1, а основной уровень равен нулю. Прежде всего на значение накладываются естественные ограничения сверху и снизу. Интервал варьирования не может быть меньше той погрешности, с которой экспериментатор фиксирует значение уровня фактора. Иначе верхний и нижний пределы окажутся неразличимыми. С другой стороны интервал не может быть настолько большим, чтобы значения верхнего или нижнего уровня оказались за пределами области определения фактора. Внутри этих двух ограничений остается еще большая неопределенность в выборе интервала варьирования, которая устраняется на основе информации о точности, с которой экспериментатор фиксирует значения факторов, о кривизне поверхности отклика и о диапазоне изменения параметра оптимизации. Обычно эта информация является ориентировочной, но это единственная разумная основа, на которую следует опираться при выборе интервала варьирования. В ходе эксперимента значения интервалов варьирования часто приходится корректировать. Точность фиксирования уровней факторов определяется точностью приборов и стабильностью поддержания значения уровня в ходе опыта. Для упрощения примем такую классификацию: точность низкая, средняя и высокая. Источником сведений о кривизне поверхности отклика служат графики однофакторного эксперимента, а также теоретические соображения. Здесь выделим три случая: функция отклика линейна, существенно нелинейна, информация о кривизне отсутствует. Диапазон изменения параметра (Δy) оптимизации условимся считать узким и широким. Диапазон Δy называется узким, если он несущественно отличается от разброса значений параметра оптимизации, полученных при повторных независимо поставленных опытах; в противном случае будем считать его широким. Для интервала варьирования факторов тоже введем свою градацию: широкий, средний и узкий, а также случай, когда трудно принять однозначное решение. Критерием для разбиения интервала варьирования на классы условимся считать следующее: если значение составляет не более 10 % от области определения i-го фактора, то будем считать его узким; если ≤30 % — средним, в остальных случаях широким. Классифицируя априорную информацию об объекте исследования в соответствии с указанной выше градацией, будем устанавливать интервалы варьирования факторов. Если точность фиксирования уровней факторов низка, то при линейной поверхности отклика выбирается широкий интервал варьирования. Если поверхность отклика существенно нелинейна, то при этом условии однозначное решение об интервале варьирования принять трудно. Если характеристика поверхности отклика неизвестна, то средний интервал варьирования принимается в том случае, если диапазон изменения параметра оптимизации является широким. Если диапазон изменения параметра оптимизации является узким, то лучше принять широкий интервал варьирования. Если имеем среднюю точность фиксирования уровней факторов, то широкий интервал варьирования принимается только при линейной функции отклика и узком диапазоне изменения параметра оптимизации. В остальных случаях принимается средний интервал варьирования факторов. Узкий принимается только в том случае, если функция отклика нелинейна, а диапазон изменения параметра оптимизации широкий. При высокой точности фиксирования уровней факторов широкий интервал варьирования принимается при линейной функции отклика и узком диапазоне изменения параметра оптимизации. В этом случае чаще принимается средний и узкий интервал варьирования, особенно если функция отклика нелинейна или неизвестна. 5.4. Матрица планирования полного факторного эксперимента Построение матрицы. При математическом моделировании эксперимента условия проведения опытов лучше записывать в форме таблицы, в которой строчками будут даны условия проведения различных опытов, а столбцами — значения уровней различных факторов. Такая таблица называется матрицей планирования. При полном факторном эксперименте обычно число различных уровней фактора равно двум, поэтому число строк (число опытов) в матрице планирования равно: N = 2К, и значения уровней факторов записываются в кодированной форме. При этом обычно единицу не пишут и остается только - или + соответственно для нижнего и верхнего уровней фактора. В этих условиях матрица планирования для двухфакторного эксперимента имеет вид, представленный в табл. 11. Каждый столбец в матрице называется вектор-столбцом, а каждая строка – вектор-строкой. Таблица 11 Матрица планирования для двухфакторного эксперимента Опыт Х1 Х2 У 1 - - У1 2 + - У2 3 - + У3 4 + + У4 Для двухфакторного эксперимента матрицу планирования записать нетрудно, но с ростом числа факторов составление такой таблицы усложняется. Поэтому при построении матрицы лучше пользоваться существующим правилом: при добавлении нового фактора матрица исходного плана встречается дважды — в сочетании с нижним и верхним уровнями нового фактора. Отсюда, естественно, появляется прием: записать исходный план для одного уровня нового фактора, а затем повторить все для другого (табл. 12). Этот прием распространяется для построения матрицы любой размерности. Таблица 12 Матрица планирования для трехфакторного эксперимента Опыт Х1 Х2 Х3 У 1 - - - У1 2 + - - У2 3 - + - У3 4 + + - У4 5 - - + У5 6 + - + У6 7 - + + У7 8 + + + У8 Свойства матрицы. Независимо от числа факторов матрица планирования обладает следующими свойствами: 1) симметричность матрицы относительно центра эксперимента: алгебраическая сумма элементов вектор-столбца каждого фактора равна нулю, т.е. , где j — текущий индекс фактора, а i — номер опыта; 2) условие нормирования: сумм квадратов элементов каждого столбца равна числу опытов, т.е. ; 3) ортогональность матрицы: сумма почленных произведений любых двух факторов-столбцов матрицы равна нулю, т.е. ; 4) рототабельность матрицы: точки в матрице планирования подбираются так, что точность предсказания значений параметра оптимизации одинакова на равных расстояниях от центра эксперимента и не зависит от направления. 5.5. Коэффициенты математической модели После построения матрицы планирования проводятся опыты для определения значений параметров оптимизации (откликов) уi, которые затем используются для нахождения коэффициентов математической модели, представленной многомерным полиномом: Коэффициенты рассчитывают по формуле , где хji — значение уровня j-го фактора в i-м опыте матрицы планирования; уi — значение параметра оптимизации в i-м опыте; N — число опытов в матрице планирования. Чтобы определить коэффициенты при линейных членах, достаточно воспользоваться матрицей, которую используем для постановки эксперимента. Например, для двухфакторного эксперимента коэффициенты а1 и а2 найдем по формулам (см. табл. 11): и . Благодаря кодированным значениям уровней факторов, расчет коэффициентов очень прост. Значения коэффициентов двойного, тройного и т.д. взаимодействия, а также свободного члена, рассчитываются по-прежнему по формуле, но для этого в матрице планирования создаются специальные столбцы, используемые исключительно для оценки коэффициентов. Знаки вновь созданных столбцов устанавливаются алгебраическим перемножением знаков соответствующих основных вектор-столбцов матрицы, с помощью которой задавали условия проведения опытов при постановке эксперимента. В табл. 13 представлена матрица планирования трехфакторного эксперимента, созданная для определения коэффициентов а0, а12, а13, а23, а123. Таблица 13 Матрица планирования для расчета коэффициентов модели Опыт Х0 Х1 Х2 Х3 Х12 Х23 Х13 Х123 1 + - - - + + + - 2 + + - - - + + + 3 + - + - - - + + 4 + + + - + - - - 5 + - - + + - - + 6 + + - + - - + - 7 + - + + - + - - 8 + + + + + + + + Их рассчитывают по формулам: ; ; ………………………………………………… ; . Независимо от того, планируется ли экстремальный эксперимент или эксперимент для изучения механизма явления, после определения численных значений коэффициентов математическая модель должна быть интерпретирована. При этом нужно помнить, что численные значения коэффициентов при линейных членах указывают на силу влияния факторов: чем больше коэффициент, тем больше влияние. Если коэффициент имеет знак плюс, то с увеличением натурального значения фактора параметр оптимизации увеличивается; если знак минус, то параметр оптимизации уменьшается с увеличением значений уровня фактора. Численное значение коэффициента соответствует вкладу данного фактора в величину параметра оптимизации при переходе фактора с нулевого уровня на верхний или нижний. Иногда удобно оценивать вклад фактора при переходе от верхнего к нижнему, что соответствует удвоенному значению коэффициента, называется этот вклад основным или главным эффектом или просто эффект фактора. Для качественных факторов, у которых основной уровень не имеет физического смысла, понятие «эффект фактора» является естественным. Существенно сложнее интерпретировать значимые коэффициенты при членах двойного, тем более тройного и т.д. взаимодействия. Например, коэффициент а12 характеризует, как изменяется действие фактора х1 на параметр у при изменении значения уровня фактора х2. В дальнейшем на конкретных математических моделях поясним интерпретацию коэффициентов при членах взаимодействия. Ортогональность матрицы планирования позволяет получить независимые друг от друга оценки коэффициентов только для модели, включающей линейные эффекты и эффекты взаимодействия. Между тем могут иметь место модели, содержащие квадратичные члены. Попытка построения вектор-столбцов для х12 и х22 приводит к получению единичных столбцов, совпадающих со столбцом х0. Так как эти столбцы неразличимы, то коэффициент аjj не разделим от коэффициента а0. Поэтому последний включает в себя значения свободного члена и вклады квадратичных членов. В этом случае говорят, что имеет место смешанная оценка, которая символически записывается: , где а0 — вычисленный нами коэффициент, а греческими буквами, как принято в статистике, обозначаются неизвестные истинные коэффициенты, выборочные оценки которых мы находим. 5.6. Статистическая обработка опытных данных Оценка воспроизводимости параметра оптимизации. Каждый эксперимент содержит элементы неопределенности вследствие существования случайных погрешностей. Чтобы оценить воспроизводимость измерения параметра оптимизации, необходимо ставить повторные опыты. Если поставлено N различных опытов, притом каждый из них повторен ni раз, то значение дисперсии SВ2 воспроизводимости параметра у рассчитывают по формуле , в которой m = N, хji = уji. По данной формуле дисперсию можно рассчитывать в том случае, если исследователь уверен, что значения всех опытов однородны. Обычно такое можно допустить в том случае, если значения , полученные для различных опытов матрицы планирования (j - текущий индекс по опытам матрицы планирования, j = 1, 2, ..., N) изменяются в сравнительно узких пределах (обычно не более, чем в 5 раз). Если по тем или иным причинам сомневаемся в однородности дисперсий, то по формуле , рассчитываем величину для каждого из N опытов, а затем по критериям Бартлета или Кохрена проверяем однородность . Если проверка показала, что дисперсии однородны, то рассчитываем суммарную дисперсию воспроизводимости по формуле . Если дисперсии неоднородны, то следует преобразовать полученные данные уji, например, извлечь из всех значений корень квадратный или взять логарифм. В крайнем случае, поставить новый план, сузив интервалы варьирования факторов. Оценка значимости коэффициентов. После определения коэффициентов математической модели следует рассчитать доверительный интервал Δаj для полученных значений. При полном факторном эксперименте доверительные интервалы для всех коэффициентов как при линейных членах, так и при членах взаимодействия равны, и рассчитываются по формуле , где t(α, f) — табличное значение критерия Стьюдента для уровня значимости α и числа степеней свободы f, по которым рассчитывали стандартное отклонение SВ воспроизводимости измерения у; N — число опытов в матрице планирования. Значение Δаj позволяет установить число значащих цифр в найденных коэффициентах аj математической модели. Кроме того, с помощью Δаj оценивают значимость коэффициентов: коэффициент считается значимым, если соблюдается неравенство >. В противном случае принимаем, что действие фактора не проявляется на фоне воспроизводимости измерения.. Оценка адекватности математической модели. Модель называется адекватной, если она с заданной точностью предсказывает значения параметра оптимизации. Поэтому оценка адекватности модели сводится к проверке однородности дисперсии и дисперсии , характеризующей отклонение экспериментальных значений параметра оптимизации от его теоретического значения , рассчитанного с помощью исследуемой модели. Значение определяется по формуле , где — число значимых коэффициентов в исследуемой модели. Для оценки однородности воспользуемся F–критерием . Если < F(α, f1 = N - l, f2 = ∞), то модель адекватно описывает процесс; при > F(α, f1 , f2 ), — модель неадекватна. Адекватность модели допустимо оценивать только при условии, что > ( — дисперсия воспроиэводимости измерения ), поэтому чаще опираются на принцип: модель адекватна в случае, если разность определяется воспроизводимостью измерения . При этом рассчитываем значение дисперсии: , которая учитывает, что коэффициенты модели рассчитывали по средним из nj измеренных значений параметра оптимизации. Далее проверяем по F-критерию однородность дисперсий . Если < (α, f1 = N - l, f2 = ), то модель адекватна, в противном случае - неадекватна. Отметим, что если N = l, то при оценке однородности дисперсий принимаем f1 = 1. 5.7. Дробный факторный эксперимент Нередко количество опытов в полном факторном эксперименте значительно превосходит число значимых коэффициентов математической модели. Например, при постановке четырехфакторного эксперимента число N опытов в полной матрице планирования равно N = 24 = I6. Если при этом постулируем линейную модель, то число определяемых коэффициентов равно пяти: имеем одиннадцать степеней свободы (f = N - l), которые можно использовать для определения других линейных коэффициентов. В таких условиях заманчиво сократить число опытов, сохранив оптимальные свойства матрицы планирования. Этого можно достичь, если вектор-столбцы х1, х2, х3 будем использовать для нового фактора х4 (табл. 15): х4 = х1х2х3 . Матрица из восьми опытов будет полурепликой от матрицы с числом опытов 24 и обозначается 24-1. Полуреплику, представленную в табл. 14, применяют для определения условий проведения опытов, значения уровней фактора х4 изменяются в соответствии с данными последнего столбца. Вследствие сокращения числа опытов теряется часть информации, получаемой при полном факторном эксперименте. В этом случае уже не будет тех раздельных оценок коэффициентов, которые имели в полном факторном эксперименте, коэффициенты математической модели будут смешаны с другими эффектами. Эффекты смешения устанавливают с помощью определяющего контраста и генерирующих соотношений. Таблица 14 Матрица планирования дробного факторного эксперимента (полуреплика) Опыт Х 1 Х2 Х3 Х=Х1Х2Х3 1 - - - - 2 + - - + 3 - + - + 4 + + - - 5 - - 6 + - + - 7 - + + - 8 + + + + Величина 1 = х1х2х3х4 называется определяющим контрастом. Чтобы установить эффект, который смешан с данным, например, с эффектом х1, помножим обе части определяющего контраста на х1 и получим: х1 = х12 х2х3х4 = х2х3х4. Это выражение называется генерирующим соотношением: оно показывает, что коэффициент а1, характеризует не только коэффициент α1, но и коэффициент α234, то есть а1 → α1 + α234. Аналогично можно найти генерирующие соотношения и для других эффектов полуреплики: х2 = х1х3х4 а2 → α2 + α134 х3 = х1х2х4 а3 → α3 + α124 х4 = х1х2х3 а4 → α4 + α123 х1х2 = х3х4 а12 → α12 + α34 х1х3 = х2х4 а13 → α13 + α34. Приведенные выше оценки коэффициентов показывают, что сокращать число опытов мы имеем право только при условии, что эффекты взаимодействия, с которыми смешаны исследуемые эффекты, незначимы — это главное условие, допускающее постановку дробных экспериментов. Полуреплики, в которых основные эффекты смешаны с трехфакторным взаимодействием, носят название планов с разрешающей способностью 1V (по наибольшему числу факторов в определяющем контрасте). Такие планы принято обозначать . Разрешающая способность будет максимальной, если линейные эффекты смешаны с эффектами взаимодействия наиболее высокого из возможных порядков. При отсутствии априорной информации об эффектах взаимодействия экспериментатор стремится выбрать реплику с наибольшей разрешающей способностью, так как тройные взаимодействия обычно менее важны, чем парные. Если же существует информация об эффектах взаимодействия, то она должна быть использована при выборе реплик. Если рассмотреть 25-1 полуреплику 25, то при ее выборе у экспериментатора имеется множество вариантов присвоений фактору х5 (22 решения). Однако наибольшей разрешающей способностью будет обладать реплика для которой x5 = х1х2х3х4 или x5 = —х1х2х3х4. Определяющим контрастом в этом случае будет 1 = х1х2х3х4х5 или 1 = —х1х2х3х4х5. Уже для пятифакторного эксперимента ставить полуреплику нецелесообразно, так как число опытов (I6 опытов) велико. Тем более это справедливо для полуреплик 26-1 и 27-1 , так как эти планы требуют соответственно 32 и 64 опыта, в этом случае выгоднее ставить планы 26-2 или 26-3, для которых требуется ставить I6 и 8 опытов. Это возможно, если двум или трем главным факторам присвоить вектор-столбцы эффектов взаимодействия. Рассмотрим пятифакторный эксперимент. При постановке полного факторного эксперимента число опытов N = 32, при использовании четвертьреплики — N = 8. С точки зрения сокращения экспериментов эти реплики имеют огромные преимущества. Однако в этом случае теряем часть информации, поэтому до постановки опытов необходимо знать, какую информацию теряем и как это отразится на наших апосториорных выводах. При выборе присвоений факторам х4 и х5 возможно принятие I2 различных решений. Допустим, выбрали вариант: х4 = х1х3 и х5 = х1х2х3. Тогда определяющие контрасты 1 = х1х3х4 и 1 = х1х2х3х5. Если перемножить левые и правые части этих определяющих контрастов, то получится третье соотношение: 1 = х2х4х5. Чтобы полностью охарактеризовать разрешающую способность реплики, необходимо записать обобщающий определяющий контраст: 1 = х1х3х4 = х2х4х5 = х1х2х3х5. Система смешивания определяется умножением обобщающего определяющего контраста последовательно на x1, x2, х3 и так далее: Получается довольно сложная система смешивания линейных эффектов с эффектами взаимодействия первого, второго, третьего и четвертого порядков, Если, например, при построении модели коэффициенты а12 → α12 + α234 + α145 + + α35 и а15 → α15 + α345 + α124 + α23 оказались значимыми, то возникают сомнения, можно ли пренебрегать другими парными взаимодействиями, с которыми смешаны линейные эффекты. Тогда следует поставить вторую серию опытов, выбрав нужным образом четвертьреплику. При ее выборе пользуются «методом перевала», который заключается в том, что вторая четвертьреплика получается из первой путем изменения всех знаков матрицы на обратные. Тогда в обобщающем определяющем контрасте тройные произведения имеют знак, противоположный их знаку в первой четвертьреплике. Тройные произведения определяют парные взаимодействия в совместных оценках коэффициентов при линейных членах модели. Усредняя результаты обеих четвертьреплик, можно получить линейные эффекты, не смешанные с парными взаимодействиями. С ростом числа факторов можно увеличивать дробность реплик. Например, для полного семифакторного эксперимента нужно поставить 128 опытов, в то время как использование I/8 реплики 27-3 позволяет ограничиться I6 опытами. В этом случае для трех факторов следует воспользоваться вектор-столбцами взаимодействий, что существенно усложняет систему смешивания эффектов. Эффективность применения дробных реплик зависит от удачного выбора системы смешивания линейных эффектов с эффектами взаимодействия, а также от умелой стратегии экспериментирования, если окажется, что часть эффектов взаимодействия значима. Априорные сведения о взаимодействии изучаемых факторов могут оказать большую услугу исследователю. Здесь следует руководствоваться правилом: нужно помещать новый фактор в вектор-столбец матрицы, принадлежащий взаимодействию, которым можно пренебречь. 5.8. Движение по градиенту При математическом моделировании эксперимента с целью оптимизации условий исследования полученную адекватную математическую модель используют для поиска оптимума. Наикратчайший путь движения к оптимуму — это направление градиента функции отклика, т.е. математической модели изучаемого процесса. Градиент ΔΨ непрерывной однозначной функции Ψ есть вектор: где — частная производная функции Ψ по i-му фактору (хi); i, j, …, l, …, k — единичные векторы в направлении координатных осей. При дифференцировании полиномиальной многомерной линейной функции получим, что частные производные по факторам равны коэффициентам аi при линейных членах. Единичные векторы — это интервалы варьирования ji факторов. Таким образом, если будем изменять одновременно значения всех значимых факторов на величины аiji, то будем двигаться наикратчайшим путем к оптимуму (крутое восхождение). Крутое восхождение сохранится, если значения аiji для всех значимых факторов одновременно будут умножены на одно и то же положительное число m. Величина Li = m·аiji называется шагом движения по градиенту. Выбор шага движения Li еще один этап в планировании эксперимента, для которого не существует формализованного решения. Небольшой шаг потребует значительного числа опытов при движении к оптимуму, большой шаг увеличивает вероятность пропуска области оптимума. Поэтому здесь требуется опять опыт исследователя, основанный на использовании априорной информации. Во всяком случае, аналогично выбору интервала варьирования факторов, при выборе значения m руководствуются правилом: нижняя граница Li, задается возможностью независимого фиксирования уровней факторов для двух соседних опытов, а верхняя — областью определения факторов. Для облегчения работы при умножении на m шаги Li обычно округляют. Качественные факторы при крутом восхождении либо фиксируют на лучшем уровне, либо восхождение совершают дважды для каждого уровня в отдельности. Незначимые факторы стабилизируют на любом уровне в интервале ±1. Если нет специальных соображений, то выбирают нулевой уровень. В движении по градиенту эти факторы не участвуют. Условия проведения опытов получают добавлением значений Li выбранных шагов к натуральным значениям нулевых уровней факторов. Для определения коэффициентов математической модели нами уже поставлено N опытов, поэтому опыты крутого восхождения будем нумеровать, начиная с N+1. Для i-го фактора получим следующие значения уровней для проведения опытов: …………………….. Однако прежде чем перейти к постановке опытов, целесообразно с помощью математической модели рассчитать ожидаемые значения параметра оптимизации, то есть провести мысленные опыты. При этом следует помнить, что модель составлена для кодированных значений уровней факторов, поэтому с помощью формул , натуральные значения нужно пересчитать в кодированные и их использовать при оценки значений . 6. ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА НА ДИАГРАММАХ СОСТАВ-СВОЙСТВО В настоящей главе рассмотрим планирование эксперимента для систем, являющихся смесями q различных компонентов. Переменные xi (i = 1, 2, . . ., q) таких систем являются пропорциями (относительным содержанием) i-x компонентов смеси и удовлетворяют условию: (>0) . Геометрическое место точек, удовлетворяющих условию нормированности суммы переменных, представляет собой (q—1)- мерный правильный симплекс (треугольник для q = 3, тетраэдр, для q = 4 и т. д.). Каждой точке такого симплекса соответствует смесь определенного состава, и, наоборот, любой комбинации относительных содержаний q компонентов соответствует определенная точка симплекса. Так как в дальнейшем при моделировании эксперимента и построении диаграмм состав — свойство придется оперировать факторным пространством в виде симплексов, целесообразно определить координаты компонентов не в обычной системе координат, а в специальной — симплексной, в которой относительные содержания каждого компонента откладываются вдоль соответствующих сторон (граней) симплекса. Связь между двумя координатными системами — обычной декартовой и симплексной — для трехкомпонентных смесей показана на рис. 11, а. Здесь изменению относительного содержания первого компонента х1 от 0 до 1 вдоль оси х1 (в долях от длины отрезка, равного единице) соответствует пропорциональное изменение координаты вдоль стороны AB (длины от точки A, где компонент х1 присутствует в пропорции 0, до точки B, где содержание первого компонента равно 1, то есть смесь состоит лишь из первого компонента. Легко заметить, что х1 долей (частей) отрезка AB, длиной 1, равно долям отрезка AB, длиной , то есть относительное содержание (пропорция) . Поэтому в дальнейшем, при рассмотрении симплексов штрих будем опускать, обозначая относительное содержание компонентов на его сторонах просто через xi. Аналогично, перемещению точки вдоль оси х2 от центра координат к точке с координатой х2 = 1 будет соответствовать пропорциональное перемещение точки вдоль стороны ВС от точки В, где второй компонент отсутствует, к точке С, где имеется лишь второй компонент. Третий компонент на треугольной диаграмме (рис. 11, б) откладывается вдоль стороны СФ, начиная от точки с с нулевым содержанием данного компонента до точки а, где х3 = 1. 3 Если в декартовой системе координат для определения уровня первого компонента, соответствующего какой-нибудь точке М смеси, достаточно взять отсекаемый на оси х3 отрезок 0m, то в симплексной (треугольной) системе координат это аналогично проведению через точку М прямой, параллельной стороне х3 (СА), и взятию отрезка х1 = am' (рис. 11, в и 11, г). 4 Для определения второй координаты точки М, проведем через эту точку прямую, параллельную стороне х1, и возьмем отсекаемый на стороне ВС отрезок х2. Аналогично, пропорция третьего компонента определяется путем проведения через точку М прямой, параллельной стороне х2 (рис. 11, г). 5 В четырехкомпонентном случае для определения координаты х1 какой-нибудь точки трехмерного симплекса — правильного тетраэдра (рис. 11, д) — необходимо провести через нее плоскость, параллельную двухмерной грани тетраэдра с ребром пропорций третьего компонента х3, и взять отсекаемый этой плоскостью на оси х1 отрезок х1(М). 6 Рис. 11. Переход к симплексной системе координат 7 8 Ввиду того, что переменные смеси согласно не являются независимыми, оценка коэффициентов полиномиальной модели невозможна, так как матрица (ХТХ)-1 оказывается вырождена. Исключение одной из смесевых переменных (обычно переменной, соответствующей основе смеси) и применение относительно q—1 оставшихся независимых компонентов смеси является одним из возможных вариантов решения задачи. Однако в тех случаях, когда выходной параметр системы зависит от всех q исследуемых смесевых переменных, следует пользоваться иными моделями. 9 Впервые задача построения математической модели состав—свойство, включающей все компоненты системы, была решена Шеффе, который ввел каноническую (приведенную) форму полинома степени n: где Полиномы такого вида (так называемые приведенные полиномы) получаются из обычных полиномов соответствующей степени для q переменных введением соотношения и содержат коэффициентов. 10 Так, например, полином второй степени в общем случае имеющий вид: , в приведенной форме с учетом условия запишется следующим образом: При переходе к приведенной форме постоянный член bо был исключен из уравнения умножением обеих сторон на bо: и подстановкой полученных результатов в уравнение. Исключения квадратичных членов можно достичь подстановкой в уравнение вместо величин значений: образованных путем умножения соотношения соответственно на х1, х2 и х3: В q-мерном случае приведение полинома первой степени (n = 1): к канонической форме: осуществляется замещением свободного члена bо на Для приведения полинома второй степени (n = 2) к виду , кроме вышеприведенной подстановки производится также замещение в членах величины на А для приведения полинома третьей степени (n = 3) к виду необходимо, кроме подстановки проведенной ранее, замещение на и (в членах и для i n1. Рис. 12. Примеры некоторы {q, n }-решеток Однако не все симплекс-решетчатые планы композиционны, например при переходе от неполно-кубической решетки к кубической приходится исключить все точки, входящие в первоначальный план, кроме вершин и центральной точки, а при переходе от кубической к решетке четвертой степени — все точки, кроме вершин. Такие симплекс-решетчатые планы являются частично композиционными. Точки решетки степени n1 полностью входят лишь в состав решеток степени n2-l, l = 2, 3, .... Так, например, точки линейной решетки входят в состав решеток всех более высоких степеней, точки квадратичной решетки — в состав решеток 4-й, 6-й, 8-й и т. д. степеней. Для оценки коэффициентов аппроксимирующего полинома степени n во всех точках плана, соответствующих узлам {q, n}-рететки, реализуются опыты и определяются отклики системы у. Под у могут подразумеваться как результаты единичного определения, так и средние значения нескольких определений. Удобно ввести специальные обозначения для этих откликов (рис. 13). Отклик для смесей, содержащих только один ненулевой компонент (вершины симплекса, то есть точки с координатами: обозначим через уш, отклик для 1:1 бинарной смеси компонентов i и j — через уij (i < j), отклик для 1:1:1 тройной смеси компонентов i, j, к — через yijk (i < j < k), отклик для 2:1 и 1:2 бинарных смесей компонентов i и j соответственно — через уiij и уijj (i < j) и т. д. В общем случае индексы у откликов у вводятся с тем расчетом, чтобы их общее число было бы равно n; число различных индексов указывало бы количество компонентов, применяемых в соответствующей данной точке смеси; число одинаковых индексов показывало бы относительное содержание компонентов. Рис. 13. Примеры обозначения откликов в точках симплексных решеток Поскольку симплекс-решетчатые планы являются насыщенными, то есть число экспериментальных точек в плане равно числу коэффициентов искомого полинома, для получения расчетных формул коэффициентов полинома удобно воспользоваться методом подстановки. Для получения расчетных формул в полином последовательно подставляются координаты всех точек плана, а вместо выходов — соответствующие данным точкам значения у. Рассмотрим последовательность расчетов на примере полинома третьей степени: При подстановке в полином координат i-й вершины симплекса получим то есть коэффициенты βi оказываются равными откликам, полученным для i-го чистого компонента. При подстановке вначале xi = 2/3 и хj = 1/3, а затем xi = 1/3 и xj = 2/3 получим соответственно: В каждом уравнении два неизвестных коэффициента βi и yij. При совместном решении этих уравнений с учетом βj = уj получим: При подстановке в полином координат точки, соответствующей тройной смеси с равным относительным содержанием компонентов i, j и к (xi = 1/3, xj = 1/3, xk = 1/3, xl = 0, l = = 1, 2, . . ., q; 1 ≠ i ≠ j ≠ k),с учетом предыдущих формул получим: . Аналогично могут быть получены расчетные формулы коэффициентов приведенных полиномов любой степени n. В настоящий момент существует SOM - программа, предназначенная для симплексной оптимизации смесей. В данной версии поддерживаются трехкомпонентные смеси и полиномы второй, неполной третьей, третьей и четвертой степеней. ЗАКЛЮЧЕНИЕ Приведенное в курсе лекций элементарное изложение методов обработки экспериментальных данных далеко от полноты и предназначено для первоначального знакомства с теорией ошибок. Тем не менее автор надеется, что с помощью предложенного материала Вы сможете обработать данные, полученные в лаборатории и на производстве, правильно представить результаты и оценить их точность. Возможно полученный опыт позволит Вам более осознанно воспринять теорию математической статистики и правильно спланировать эксперимент. БИБЛИОГРАФИЧЕСКИЙ СПИСОК 11 Агапьев Б.Д. Обработка экспериментальных данных: учеб. пособие / Б.Д. Агапьев и др. –СПб. 2001. Адлер Ю.П., Планирование эксперимента при поиске оптимальных условий / Ю.П. Адлер, Е.В. Маркова, Ю.А. Грановский. - М.: Наука, 1971. Арнольд В. И. Жёсткие и мягкие математические модели / В. И. Арнольд. - М.: МЦНМО, 2004. Введение в математическое моделирование: учеб. пособие. Под ред. П. В. Трусова. - М.: Логос, 2004. ISBN 5-94010-272-7. Гмурман В.Е. Теория вероятностей и математическая статистика / В.Е. Гмурман. – М.: Высш. школа, 1998. Гнеденко Б.В. Курс теории вероятностей / Б.В. Гнеденко. ─ М.: Физматгиз, 1961. Горелова Г.В. Теория вероятностей и математическая статистика в примерах и задачах с применением Excel / Г.В. Горелова. – М: Феникс, 2005. Горский В.Г. Планирование промышленных экспериментов / В.Г. Горский, Ю.П. Адлер. - М.: Металлургия, 1974. Джонсон Н. Статистика и планирование эксперимента в технике и науке: Методы планирования эксперимента / Н. Джонсон, Ф. Лион. – М.: Мир, 1981. Дэниел К. Применение статистики в промышленном эксперименте / К. Дэниел. - М.: Мир, 1979. Калинина В.Н. Математическая статистика / В.Н. Калинина, В.Ф. Панкин. – М.: Высш. школа, 1994. Kpaмep Г. Математические методы статистики / Г. Kpaмep; пер. с англ. М.: Мир, 1975. Налимов В.В. Применение математической статистики при анализе вещества / В.В. Налимов. ─ М.: Физматгиз, 1960. Самарский А. А. Математическое моделирование. Идеи. Методы. Примеры / А. А. Самарский, А. П. Михайлов. - М.: Физматлит, 2001. Смирнов Н.В. Курс теориии вероятностей и математической статистики / Н.В. Смирнов, И.В. Дунин-Барковский. – М.: Наука, 1969. Тимошенко Е.И. Теория вероятностей: учеб. пособие / Е.И. Тимошенко, Ю.Е. Воскобойников. – Новосибирск: НГАСУ, 1999. Тутубалин В.Н. Теория вероятностей и случайных процессов. Основы математического аппарата и прикладные аспекты / В.Н. Тутубалин. - М.: МГУ, 1992. Тюрин Ю.Н. Анализ данных на компьютере / Ю.Н. Тюрин, А.А. Макаров. -М.: Финансы и статистика, 1995. 12 Зедгинидзе И. Г. Планирование эксперимента для исследования многокомпонентных систем / И. Г. Зедгинидзе. - М.: Наука, 1976. ПРИЛОЖЕНИЕ Таблица П1 Математические символы Символ (UTF8) Название Значение Пример Произношение Раздел математики 1 2 3 4 ⇒ Импликация, следование означает «если A верно, то B также верно». Иногда вместо него используют верно, но неверно (так как x=−2 также является решением). «влечёт» или «если..., то» везде ⇔ Равносильность означает «A верно тогда и только тогда, когда B верно» «если и только если» или «равносильно» везде ∧ Конъюнкция истинно тогда и только тогда, когда A и B оба истинны , если n — натуральное число. «и» Математическая логика ∨ Дизъюнкция истинно, когда хотя бы одно из условий A и B истинно , если n — натуральное число. «или» Математическая логика ¬ Отрицание истинно тогда и только тогда, когда ложно A «не» Математическая логика Продолжение табл. П1 1 2 3 4 ∀ Квантор всеобщности обозначает «P(x) верно для всех x» «Для любых», «Для всех» Математическая логика ∃ Квантор существования означает «существует хотя бы один x такой, что верно P(x)» (подходит число 5) «существует» Математическая логика = Равенство x = y обозначает «x и y обозначают один и тот же объект» 1 + 2 = 6 − 3 «равно» везде := :⇔ Определение x: = y означает «x по определению равен y» означает «P по определению равносильно Q» (Гиперболический косинус) (Исключающее или) «равно/равносильно по определению» везде { , } Множество элементов {a,b,c} означает множество, элементами которого являются a, b и c (множество натуральных чисел) «Множество...» Теория множеств { | } { : } Множество элементов, удовлетворяющих условию {x | P(x)} означает множество всех x таких, что верно P(x) «Множество всех... таких, что верно...» Продолжение табл. П1 1 2 3 4 Теория множеств ∅ {} Пустое множество {} и означают множество, не содержащее ни одного элемента «Пустое множество» Теория множеств ∈ ∉ Принадлежность/непринадлежность к множеству означает «a является элементом множества S » означает «a не является элементом S» «принадлежит», «из» «не принадлежит» Теория множеств ⊆ ⊂ Подмножество означает «каждый элемент из A также являестя элементом из B» обычно означает то же, что и . Однако некоторые авторы используют , чтобы показать строгое включение (т.е. ) «является подмножеством», «включено в» Теория множеств ⫋ Собственное подмножество означает и «является собственным подмножеством», «строго включается в» Теория множеств Продолжение табл. П1 1 2 3 4 ∪ Объединение означает множество элементов, принадлежащих A или B (или обоим сразу) «Объединение ... и ...», «..., объединённое с ...» Теория множеств ⋂ Пересечение означает множество элементов, принадлежащих и A, и B «Пересечение ... и ... », «..., пересечённое с ...» Теория множеств \ Разность множеств означает множество элементов, принадлежащих A, но не принадлежащих B «разность ... и ... », «минус», «... без ...» Теория множеств → Функция означает функцию f с областью определения X и областью прибытия Y Функция , определённая как f(x) = x2 «из ... в», везде ↦ Отображение означает, что образом x после применения функции f будет f(x). Функцию, определённую как f(x) = x2, можно записать так: «отображается в» везде N или ℕ Натуральные числа означает множество или (в зависимости от ситуации) «Эн» Числа Продолжение табл. П1 1 2 3 4 Z или ℤ Целые числа означает множество «Зед» Числа Q или ℚ Рациональные числа означает «Ку» Числа R или ℝ Вещественные числа, или действительные числа означает множество всех пределов последовательностей из (i — комплексное число: i2 = − 1) «Эр» Числа C или ℂ Комплексные числа означает множество «Це» Числа < > Сравнение x < y обозначает, что x строго меньше y. x > y означает, что x строго больше y «меньше чем», «больше чем» Отношение порядка ≤ или ⩽ ≥ или ⩾ Comparaison означает, что x меньше или равен y. означает, что x больше или равен y «меньше или равно»; «больше или равно» Отношение порядка Продолжение табл. П1 1 2 3 4 ≈ Приблизительное равенство с точностью до 10-3 означает, что 2,718 отличается от e не больше чем на 10-3 с точностью до 10-7. «приблизительно равно» Числа √ Арифметический квадратный корень означает положительное действительное число, которое в квадрате даёт x «Корень квадратный из ...» Числа ∞ Бесконечность и суть элементы расширенного множества действительных чисел. Эти символы обозначают числа, меньшее/большее всех действительных чисел «Плюс/минус бесконечность» Числа | | Модуль числа (абсолютное значение), модуль комплексного числа или мощность множества обозначает абсолютную величину x | A | обозначает мощность множества A и равняется, если A конечно, числу элементов A «Модуль»; «Мощность» Числа и Теория множеств Окончание таблицы П1 1 2 3 4 ∑ Сумма, сумма ряда означает «сумма ak, где k принимает значения от 1 до n», т.е. a1 + a2 + ... + an означает сумму ряда, состоящего из a_k = 12 + 22 + 32 + 42= 30 «Сумма ... по ... от ... до ...» Арифметика, Математический анализ ∏ Произведение означает «произведение ak для всех k от 1 до n», т.е. a1·a2·...·an «Произведение ... по .. от .. до .. » Арифметика ∫ Интеграл означает «интеграл от a до b функции f от x по переменной x» «Интеграл (от .. до ..) функции .. по (или d)...» Математический анализ df/dx f'(x) Производная или означает «(первая) производная функции f от x по переменной x» «Производная ... по ...» Математический анализ Таблица П2 Значение критерия Стьюдента (t*) *f - количество независимых значений результатов опытов, уменьшенное на единицу (f = n-1). Таблица П3 Значение критерия Фишера F* для различных уровней значимости (односторонний критерий) Окончание табл. П3 ОГЛАВЛЕНИЕ ВВЕДЕНИЕ …………………………………………………………...………...….. 3 1. ОСНОВНЫЕ ПОНЯТИЯ МОДЕЛИРОВАНИЯ ………………...………... 5 1.1. Классификация моделей …………………………………………...… ……. 5 1.2. Математическое моделирование ………………………...………...…….… 6 1.3. Методы составления математических моделей ……………………...….... 7 1.3.1. Эмпирический метод ………………………………………………….…….. 8 1.3.2. Экспериментально-аналитический метод ………………….…….……..... 10 1.3.3. Теоретический метод …………………………………………….…...…… 11 1.3.4. Сопоставление методов построения математических моделей ………... 12 2. ПЛАНИРОВАНИЕ НАУЧНОГО ЭКСПЕРИМЕНТА ....………………….… 13 2.1. Типы величин ……………………………………………………………..….. 13 2.2. Типы погрешностей измерений ………………………………………...…... 14 2.3. Случайные величины и их характеристики ………………………………... 16 2.4. Нормальное распределение и его свойства ……………………………..….. 18 2.4.1. Коэффициент Стьюдента ………………………………………………….. 21 2.4.2. Другие виды распределения ……………………………………….…...…. 23 3 2.5. Суммарная погрешность измерений …………………………………….….. 24 2.5.1. Погрешности косвенных измерений ……………………………...……… 25 2.5.2. Учет погрешности в записи окончательного результата измерения ...…. 27 2.6. Статистика линейных связей …………………………………………….….. 28 2.6.1. Корреляционный анализ …………………………………………………... 28 2.6.2. Определение параметров прямой линии …………………………………. 30 2.6.3. Проверка гипотезы линейности …………………………………………... 32 2.7. Статистическая проверка гипотез …………………………………………... 33 2.7.1. Сравнение двух дисперсий …………………………...…………………… 33 2.7.2. Сравнение нескольких дисперсий ………………………...……………… 35 2.7.3. Оценка доверительных интервалов выборочных характеристик ………. 36 2.7.4. Сравнение двух средних результатов анализа …………………………… 37 2.8. Основы планирования и проведения эксперимента ……………...…….…. 40 2.8.1. Определение необходимого числа измерений …………………………… 40 2.8.2. Ведение лабораторного журнала …………………………………………. 41 2.8.3. Требования к оформлению научного отчета ……………………...….….. 42 3. ИСПОЛЬЗОВАНИЕ ДИСПЕРСИОННОГО АНАЛИЗА В МЕТОДИЧЕСКИХ ИССЛЕДОВАНИЯХ ...………………................................................................… 45 3.1. Однофакторный дисперсионный анализ …………………………………… 47 3.2. Двухфакторный дисперсионный анализ …………………………………… 50 3.3. Многофакторный дисперсионный анализ …………………………………. 53 4. МЕТРОЛОГИЧЕСКИЕ ХАРАКТЕРИСТИКИ МЕТОДИК ИССЛЕДОВАНИЯ, АНАЛИЗА И ИХ СТАТИСТИЧЕСКАЯ ОЦЕНКА И КОНТРОЛЬ ………..……………………………………………………………… 55 4.I. Метрологические характеристики методик анализа ……………...….……. 55 4.2. Оценка воспроизводимости методики анализа …………….……….…..…. 57 4.3. Оценка правильности методик ……………………………...……….……… 60 4.4. Оценка чувствительности методики …………………...………………....… 67 4.5. Экспрессность, производительность и информативность методик .......…. 69 5. МОДЕЛИРОВАНИЕ ЭКСПЕРИМЕНТА В МЕТОДИЧЕСКИХ ИССЛЕДОВАНИЯХ ………………………………………………………..….… 71 5.1. Общие понятия и термины ………………………………………………….. 72 5.2. Требования к параметру оптимизации и факторам ……………...………... 73 5.3. Установление области определения факторов и выделение подобласти проведения эксперимента …………………………………….………………….. 74 5.4. Матрица планирования полного факторного эксперимента ……………… 77 5.5. Коэффициенты математической модели …………………………………… 79 5.6. Статистическая обработка опытных данных ………………………………. 81 5. 7. Дробный факторный эксперимент ……………………………...………….. 84 5.8. Движение по градиенту ……………………………………...…….……...… 87 6. ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА НА ДИАГРАММАХ СОСТАВ-СВОЙСТВО ………………………………………………………………………. 88 Заключение …………………………………………………………………….….. 95 Библиографический список ……………………………………...…………….... 96 Приложение ……...……………………………………………………………..…. 97
«Математическое моделирование эксперимента» 👇
Готовые курсовые работы и рефераты
Купить от 250 ₽
Решение задач от ИИ за 2 минуты
Решить задачу
Помощь с рефератом от нейросети
Написать ИИ

Тебе могут подойти лекции

Смотреть все 91 лекция
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot