Математическая статистика и планирование промышленного эксперимента
Выбери формат для чтения
Загружаем конспект в формате docx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Министерство транспорта Российской Федерации
Федеральное агентство железнодорожного транспорта
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
Омский государственный университет путей сообщения
ОмГУПС (ОмИИТ)
Кафедра «Технология транспортного машиностроения и
ремонта подвижного состава»
Конспект лекций по дисциплине:
«Математическая статистика
и планирование промышленного эксперимента»
специальность – 151001 «Технология машиностроения»
Омск 2011
Содержание
1. Понятие о моделировании сложных процессов ……………………………….……….
1.1. Основные определения. Функция отклика …...............................................................
1.2. Параметр оптимизации. Виды параметров оптимизации …………………………...
5
5
7
2. Обобщенный параметр оптимизации ……………………………………………………
2.1. Требования к параметру оптимизации ……………………………………………….
2.2. Решение задач с несколькими выходными параметрами оптимизации ……………
2.3. Обобщенный параметр оптимизации. Простейшие способы построения обобщенного отклика …………………………………………………………………..........
10
10
12
13
3. Факторы. Свойства факторов …………………………………………………………
3.1. Факторы. Свойства факторов и совокупности факторов ……………………………
3.2. Кодирование фактора …………………………………………….................................
3.3. Требования, предъявляемые к факторам при планировании эксперимента ……….
15
15
15
16
4. Выбор математической модели. Оптимизация исследуемых процессов ……………...
4.1. Выбор вида математической модели …………………………………………………
4.2. Шаговый принцип поиска экстремума функции ………………………………........
4.3. Полиномиальные модели исследуемых процессов ………………………………….
17
17
18
20
5. Полный факторный эксперимент ………………………………......................................
5.1. Принятие решений перед планированием эксперимента …………………………...
5.2. Сущность полного факторного эксперимента ………………………………………
5.3. Полный факторный эксперимент типа 2к ……………………………………………
5.4. Приёмы составления матриц планирования …………………………………………
5.5. Свойства полного факторного эксперимента ………………………………………..
22
22
23
24
25
26
6. Проведение эксперимента. Ошибки опытов ……………………………………………
6.1. Составление матрицы планирования полного факторного эксперимента …………
6.2. Полный факторный эксперимент и математическая модель ……………………….
6.3. Проверка воспроизводимости опытов (однородности дисперсий)…………………
28
28
28
30
7. Обработка результатов эксперимента. Регрессионный анализ ………………………..
7.1. Регрессионный анализ …………………………………………………………………
7.2. Проверка значимости коэффициентов регрессии …………………………………..
7.3. Проверка адекватности полученной математической модели …………………….
31
31
32
33
8. Интерпретация результатов эксперимента ……………………………………………..
8.1. Принятие решений после построения модели процесса …………………...............
8.2. Движение по градиенту ……………………………………………………………….
8.3. Этапы расчёта крутого восхождения ………………………………………………..
8.4. Свойства крутого восхождения ………………………………………………………
8.5. Реализация мысленных опытов ………………………………………………………
8.6. Принятие решений после крутого восхождения ……………………………………
34
34
35
35
37
37
38
9. Дробный факторный эксперимент ………………………………………………………
9.1. Минимизация числа опытов ………………………………………………………….
9.2. Дробная реплика ………………………………………………………………………
9.3. Выбор полуреплик. Генерирующие соотношения и определяющие контрасты….
40
40
41
42
10. Центральное композиционное планирование второго порядка ………………......
47
11. Ортогональное центральное композиционное планирование второго порядка …..
11.1. Ортогональный центральный композиционный план ………………………………
11.2. Составление матрицы планирования ОЦКП для трех факторов …………………..
11.3. Расчет оценок коэффициентов уравнения регрессии ……………………………….
11.4. Проверка значимости коэффициентов регрессии …………………………………..
11.5. Проверка адекватности полученной математической модели ……………………..
50
50
51
53
54
54
12. Рототабельное центральное композиционное планирование второго порядка …...
12.1. Рототабельный центральный композиционный план ………………………………
12.2. Составление матрицы планирования РЦКП для трех факторов ……………………
12.3. Порядок проведения эксперимента …………………………………………………..
12.4. Расчет оценок коэффициентов уравнения регрессии ………………………………
12.5. Определение оценки дисперсии воспроизводимости эксперимента ……………….
12.6. Проверка значимости коэффициентов регрессии …………………………………..
12.7. Проверка адекватности полученной математической модели ……………….........
56
56
57
57
58
58
59
59
13. Некомпозиционное планирование второго порядка ……………………………….
13.1. Некомпозиционный рототабельный план второго порядка (НРП)…………………
13.2. Составление матрицы планирования НРП второго порядка для двух факторов …
13.3. Некомпозиционный план второго порядка Бокса-Бенкина для исследования трехкомпонентной системы …………………………………………………………………
13.4. Проверка значимости коэффициентов уравнения регрессии ………………………
13.5. Проверка адекватности полученной математической модели …………………….
61
61
62
64
66
67
14. Планирование эксперимента на диаграммах «состав-свойство» …………………
14.1. Сущность симплексного планирования эксперимента на диаграммах «состав-свойство» …………………………………………………………………………………….
14.2. Симплекс-решетчатые планы …………………………………………………………
68
68
69
15. Симплекс-решетчатые планы третьего порядка ……………………………………..
15.1. Составление матрицы планирования симплекс-решетчатого плана третьего порядка ………………………………………………………………………………………..
15.2. Расчет оценок коэффициентов уравнения регрессии ……………………………….
15.3. Статистическая обработка результатов эксперимента ……………………………...
15.4. Проверка адекватности полученной математической модели ……………………..
71
71
72
73
74
Список литературы …………………………………………………………………………..
75
ЛЕКЦИЯ №1
ПОНЯТИЕ О МОДЕЛИРОВАНИИ СЛОЖНЫХ ПРОЦЕССОВ.
1.1. Основные определения. Функция отклика.
Большинство научных исследований связано с экспериментом, который проводится в лабораториях, на производстве, на опытных полях и участках, в клиниках и т. д. Эксперимент может быть физическим, психологическим или модельным. Он может непосредственно проводиться на объекте или на его модели. Модель отличается от объекта масштабом или природой. Если модель достаточно точно описывает объект, то эксперимент на объекте может быть заменен экспериментом на модели.
Эксперимент – общенаучный метод исследования процесса, явления или объекта, при котором планомерно изменяют один или несколько факторов, оказывающих влияние на объект, и регистрируют связанные с этим изменения в состоянии изучаемого объекта.
Эксперимент занимает центральное место в науке. Одним из возможных путей повышения эффективности исследований является применение математических методов, построение математической теории планирования эксперимента.
Планирование эксперимента — это процедура выбора числа и условий проведения опытов, необходимых и достаточных для решения поставленной задачи с требуемой точностью. При этом существенными являются следующие условия:
– стремление к минимизации общего числа опытов;
– одновременное варьирование всеми переменными, определяющими процесс, по специальным правилам — алгоритмам;
– использование математического аппарата, формализующего многие действия экспериментатора;
– выбор четкой стратегии, позволяющей принимать обоснованные решения после каждой серии экспериментов.
К основным задачам, при решении которых применяется планирование эксперимента, относятся: поиск оптимальных условий, построение интерполяционных формул, выбор существенных факторов, оценка и уточнение констант теоретических моделей (например, кинетических), выбор наиболее приемлемых из некоторого множества гипотез о механизме явлений, исследование диаграмм «состав — свойство».
Поиск оптимальных условий процесса является одной из наиболее распространенных научно-технических задач, при которой установлена возможность проведения данного процесса и необходимо найти наилучшие условия его реализации.
Задачи выбора оптимальных условий какого-либо процесса или явления называются задачами оптимизации. Процесс их решения называется оптимизацией. Примеры задач оптимизации: выбор оптимального состава многокомпонентных смесей или сплавов, повышение производительности действующих установок, повышение качества продукции, снижение затрат на ее получение, выбор оптимальных параметров режимов обработки и т. д.
Эксперимент, который ставится для решения задач оптимизации, т. е. для нахождения экстремума исследуемой функции, называется экстремальным. Эксперимент, который ставится для определения связи и степени влияния отдельных факторов на исследуемую функцию, называется интерполяционным. Рассмотрим две задачи.
1. Прочность бетона в значительной степени определяется маркой цемента, количеством наполнителя и количеством воды. Требуется установить связь между прочностью бетона и названными факторами.
2. Надежность некоторого полупроводникового прибора зависит от ряда технологических факторов. Требуется так подобрать значения этих факторов, чтобы надежность прибора повысилась.
Задача является экстремальной, если цель ее состоит в поиске экстремума некоторой функции. В задаче 1 требуется установить связь между прочностью бетона и тремя факторами. Здесь не определено, какая прочность является оптимальной, и не требуется ее оптимизировать. В задаче 2 необходимо повысить надежность прибора. Сама постановка задачи указывает на то, что существующая надежность не удовлетворяет экспериментатора и требуется поиск таких условий, при которых надежность повысится. Соответственно, задача типа 1 является интерполяционной, а типа 2 — экстремальной.
Для описания понятия — «объект исследования» пользуются кибернетическим понятием, которое называется «черным ящиком», критерием оптимизации, целевой функция, выходом «черного ящика» и т. д. Стрелки справа изображают численные характеристики целей исследования, которые обозначаются Y и называются параметрами оптимизации (количественные характеристики целей эксперимента). При проведении эксперимента все способы воздействия на поведение «черного ящика» (входы «черного ящика») обозначаются X и называются факторами или входами «черного ящика» (рис. 1.1).
При решении задачи поиска оптимальных условий используют математические модели объекта исследования. Под математической моделью понимается уравнение, связывающее параметр оптимизации с факторами. Это уравнение в общем виде можно записать так:
y=φ(x1,x2,…,xk),
Функция φ (… ) называется функцией отклика.
Каждый фактор может принимать в опыте одно из нескольких значений, которые называются уровнями. Теоретически фактор способен принимать бесконечно много значений (непрерывный ряд), однако практически – точность, с которой устанавливается значение параметра оптимизации, ограничена, поэтому вводится условие, при котором фактор имеет определенное число дискретных уровней, что облегчает построение «черного ящика» и эксперимента и упрощает оценку их сложности.
Фиксированный набор уровней факторов (т. е. установление каждого фактора на некоторый уровень) определяет одно из возможных состояний «черного ящика» и, соответственно, условия проведения одного из возможных опытов. Все возможные наборы состояний факторов соответствуют полному множеству различных состояний данного «ящика». Одновременно это будет число возможных различных опытов.
Число различных состояний процесса определяется возведением числа уровней факторов (если оно для всех факторов одинаково) в степень числа факторов к: рк, где р — число уровней. Пример: Так, на первый взгляд простая система с пятью факторами на пяти уровнях имеет 3125 состояний, а для десяти факторов на четырех уровнях их уже свыше миллиона!
Таким образом, с целью сокращения времени и затрат на проведение эксперимента необходимо отказаться от таких экспериментов, которые включают все возможные опыты. В данном случае для определения вида и числа опытов, которые необходимо включить в эксперимент, чтобы решить поставленную задачу, применяется планирование эксперимента.
При планировании эксперимента необходимо учитывать, какими свойствами обладает объект исследования. Существует два основных требования к свойствам объекта исследования:
1) Возможность воспроизведения на объекте результатов эксперимента. Выбираются некоторые уровни для всех факторов и в этих условиях проводится эксперимент. Далее эксперимент повторяется несколько раз через неравные промежутки времени и сравниваются значения параметра оптимизации, разброс которых характеризует воспроизводимость результатов. Объект удовлетворяет требованию воспроизводимости результатов при условии, что разброс значений не превышает заданной величины (требований к точности эксперимента), и не удовлетворяет – если превышает. Таким образом, рассматриваться будут только такие объекты, для которых требование воспроизводимости выполняется.
2) Объект исследования должен быть управляемым. Управляемым объектом называется такой объект, на котором возможен активный эксперимент. Активным называется эксперимент, который предполагает возможность в каждом опыте задавать уровни факторов, которые представляют интерес. Если такая возможность отсутствует, эксперимент называется пассивным. На практике нет абсолютно управляемых объектов. На реальный объект обычно действуют как управляемые, так и неуправляемые факторы. Неуправляемые факторы влияют на воспроизводимость эксперимента и являются причиной ее нарушения. Если требования воспроизводимости не выполняются, обращаются к активно-пассивному эксперименту.
Плохая воспроизводимость объясняется действием фактора, систематически изменяющегося (дрейфующего) во времени. В этом случае обращаются к специальным методам планирования. В случае если все факторы неуправляемы, возникает задача установления связи между параметром оптимизации и факторами по результатам наблюдений за поведением объекта, т. е. по результатам пассивного эксперимента. Планирования экстремального эксперимента применяется для воспроизводимых управляемых статических объектов.
Планирование экстремального эксперимента — это метод выбора количества и условий проведения опытов, минимально необходимых для отыскания оптимальных условий процесса.
При оптимизации процессов, явлений, величин распространены два подхода:
1) Детерминированный подход, который предполагает построение физической модели процесса на основании тщательного изучения механизма явлений (например, кинетики, гидродинамики), что позволяет получить математическую модель объекта в виде системы дифференциальных уравнений.
2) Статистический подход (связанный с планированием эксперимента).
Таким образом, задача планирования эксперимента – это задача выбора необходимых для эксперимента опытов, методов математической обработки их результатов и принятия решений. Частными случаями этой задачи являются планирование экстремального и интерполяционного экспериментов.
1.2. Параметр оптимизации. Виды параметров оптимизации.
При планировании экстремального эксперимента необходимо четко сформулировать цель исследования, которая должна допускать количественную оценку и определить параметр оптимизации, т. е. характеристику цели, заданную количественно. Параметр оптимизации является реакцией (откликом) на воздействие факторов, которые определяют поведение выбранной вами системы.
В зависимости от объекта и цели исследования параметры оптимизации классифицируются следующим образом (рис. 2). Каждый объект может характеризоваться сразу всей совокупностью параметров или любым подмножеством из этой совокупности. Один из путей достижения оптимума состояния или свойства объекта – выбор единственного параметра оптимизации, при этом прочие характеристики процесса служат ограничениями. Другой путь — построение обобщенного параметра оптимизации как функции от множества исходных.
Экономические параметры оптимизации, такие, как прибыль, себестоимость и рентабельность, обычно используются при исследовании действующих промышленных объектов.
Среди технико-экономических параметров наибольшее распространение имеет производительность. Такие параметры, как долговечность, надежность и стабильность, связаны с длительными наблюдениями (например, изучение радиоэлектронной аппаратуры).
Характеристики количества и качества продукта образуют группу технико-технологических параметров. В качестве меры количества получаемого продукта используют выход, например, процент выхода химической реакции, выход годных изделий. К показателям качества исследуемого объекта можно отнести: качество обработки изделий, качество состава сплава, прочность, свариваемость, количество вредных примесей и т. п.
К «прочим» относятся важные параметры, которые реже встречаются, например, статистические параметры, используемые для улучшения характеристик случайных величин или случайных функций (задачи минимизации дисперсии случайной величины, уменьшения числа выбросов случайного процесса за фиксированный уровень и т. д.).
С ростом сложности объекта возрастает роль психологических аспектов взаимодействия человека или животного с объектом. К примеру, при выборе оптимальной организации рабочего места оператора параметром оптимизации может служить число ошибочных действий в различных возможных ситуациях.
Пример 1. Во время второй мировой войны несколько сот английских торговых судов на Средиземном море были вооружены зенитными орудиями для защиты от вражеских бомбардировщиков. Поскольку это мероприятие было достаточно дорогим (требовалось иметь на каждом судне боевую команду), через несколько месяцев решили оценить его эффективность. Какой из параметров оптимизации более подходит для этой цели?
а) Число сбитых самолетов.
б) Потери в судах, оснащенных орудиями, по сравнению с судами без орудий.
Если Вы считаете, что эффективность установления орудий на торговые суда можно оценить числом сбитых самолетов, то Вы вряд ли смогли бы занять пост командующего английским флотом на Средиземном море. Выбранный Вами параметр оптимизации оценивает эффективность уничтожения самолетов. В то же время ясно, что значения параметра оптимизации в этом случае будут низкими, так как существуют куда более эффективные средства для этой цели (авиация, боевой флот), чем зенитные орудия на торговых судах.
Если же Вы полагаете, что эффективность установки орудий на торговые суда можно оценить сопоставлением потерь в судах, оснащенных орудиями, с потерями в судах без орудий, то это разумный выбор параметра оптимизации, потому что основной задачей при установке орудий была защита судов. Самолеты вынуждены были теперь использовать противозенитные маневры и бомбометание с большой высоты, что уменьшало потери. Из числа атакованных самолетами торговых судов с зенитными орудиями было потоплено 10% судов, а потери в судах без орудий составили 25%. Затраты на установку орудий и содержание боевых расчетов окупились очень быстро.
Лекция №2
ОБОБЩЕННЫЙ ПАРАМЕТР ОПТИМИЗАЦИИ.
2.1. Требования к параметру оптимизации.
Параметр оптимизации — это признак, по которому мы хотим оптимизировать процесс, реакция (отклик) на воздействия факторов, которые определяют поведение изучаемой системы.
Требование №1: Он должен быть количественным, задаваться числом при любой возможной комбинации выбранных уровней факторов. Множество значений, которые может принимать параметр оптимизации, называется областью его определения. Области определения могут быть непрерывными и дискретными, ограниченными и неограниченными. Например, выход реакции — это параметр оптимизации с непрерывной ограниченной областью определения. Он может изменяться в интервале от 0 до 100%. Число бракованных изделий, число зерен на шлифе сплава, число кровяных телец в пробе крови — вот примеры параметров с дискретной областью определения, ограниченной снизу.
При условии, что нет способа количественного измерения результата, приходится воспользоваться приемом, называемым ранжированием (ранговым подходом). При этом параметрам оптимизации присваиваются оценки — ранги по заранее выбранной шкале: двухбалльной, пятибалльной и т. д. Ранговый параметр имеет дискретную ограниченную область определения. В простейшем случае область содержит два значения (да, нет; хорошо, плохо). Это может соответствовать, например, годной продукции и браку.
Ранг — это количественная оценка параметра оптимизации, но она носит условный (субъективный) характер. При этом в соответствие качественному признаку ставится некоторое число — ранг.
Для каждого физически измеряемого параметра оптимизации можно построить ранговый аналог. Потребность в построении такого аналога возникает, если имеющиеся в распоряжении исследователя численные характеристики неточны или неизвестен способ построения удовлетворительных численных оценок. Недостатком рангового подхода перед физическим измерением является его низкая чувствительность.
Пример 2. Ваша жена решила испечь яблочный пирог по новому рецепту. Вам, конечно, трудно остаться в стороне, и вы предлагаете ей свои услуги по оптимизации этого процесса. Цель процесса — получение вкусного пирога, но такая формулировка цели еще не дает возможности приступить к оптимизации: необходимо выбрать количественный критерий, характеризующий степень достижения цели. Можно принять следующее решение: очень вкусный пирог получает отметку 5, просто вкусный пирог — отметку 4 и т. д.
Как вы полагаете, можно ли после такого решения переходить к оптимизации процесса?
Давайте разберемся. Нам важно количественно оценить результат оптимизации. Решает ли отметка эту задачу? Конечно, потому что, как мы договорились, отметка 5 соответствует очень вкусному пирогу и т. д. Другое дело, что этот подход, называемый ранговым, часто оказывается грубым, нечувствительным. Но возможности такой количественной оценки результатов не должна вызывать сомнений. Другие примеры рангового подхода: определение чемпиона мира по фигурному катанию или гимнастике, дегустация вин и т. д. Из области химии: сравнение продуктов по цвету, прозрачности, форме кристаллов.
Требование №2: параметр оптимизации должен выражаться единым числом, как регистрация показания прибора.
Например, скорость движения машины определяется числом на спидометре. Чаще приходится производить некоторые вычисления. Так бывает при расчете выхода реакции. В химии часто требуется получать продукт с заданным отношением компонентов, например, А : В = 3 : 2. Один из возможных вариантов решения подобных задач состоит в том, чтобы выразить отношение одним числом (1,5) и в качестве параметра оптимизации пользоваться значениями отклонений (или квадратов отклонений) от этого числа.
Требование №3 связано с количественной природой параметра оптимизации, — однозначность в статистическом смысле. Заданному набору значений факторов должно соответствовать одно с точностью до ошибки эксперимента значение параметра оптимизации. (Однако обратное неверно: одному и тому же значению параметра могут соответствовать разные наборы значений факторов).
Требование №4: для успешного достижения цели исследования необходимо, чтобы параметр оптимизации действительно оценивал эффективность функционирования системы в заранее выбранном смысле. Это требование является главным, определяющим корректность постановки задачи. Представление об эффективности не постоянно в ходе исследования, а меняется по мере накопления информации и в зависимости от достигнутых результатов. Это приводит к последовательному подходу при выборе параметра оптимизации. Так, например, на первых стадиях исследования технологических процессов в качестве параметра оптимизации часто используется выход продукта. Однако в дальнейшем, когда возможность повышения выхода исчерпана, нас начинают интересовать такие параметры, как себестоимость, чистота продукта и т. д.
Пример 3. При флотации сульфидной руды в лабораторных условиях изучалась эффективность применения нового реагента-пенообразователя. В качестве параметра оптимизации выбрано извлечение (при заданном качестве) концентрата в основной флотации. После проведения эксперимента выяснилось, что реагент дает более высокий выход концентрата по сравнению с прежним пенообразователем. Как вы считаете, обоснованно ли выбран параметр оптимизации, если ставилась задача оптимизации всего процесса флотационного обогащения руды?
Параметр оптимизации — извлечение концентрата в основной флотации — при решении задачи оптимизации всего процесса флотационного обогащения руды выбран не совсем обоснованно. Это правильный ответ, потому что существенно достижение конечной цели — получение готового концентрата (после перечистной флотации), а выбранный параметр оптимизации характеризует эффективность достижения промежуточной цели. Промежуточная цель — повышение выхода концентрата после основной флотации — была достигнута, но при промышленных испытаниях снизились показатели контрольной флотации, что привело к снижению извлечения и качества концентрата по всему циклу. Параметр оптимизации оказался неэффективным с точки зрения достижения конечной цели.
Требование №5: параметр оптимизации должен быть эффективный в статистическом смысле, т. е. должен определяется с наибольшей возможной точностью.
Пример 4. Нас интересует исследование прочностных характеристик некоторого сплава. В качестве меры прочности можно использовать как прочность на разрыв, так и макротвердость. Поскольку эти характеристики функционально связаны, то с точки зрения эффективности они эквивалентны. Однако точность измерения первой характеристики существенно выше, чем второй. Требование статистической эффективности заставляет отдать предпочтение прочности на разрыв.
Требование №6: Универсальность или полнота. Под универсальностью параметра оптимизации понимается его способность всесторонне характеризовать объект. В частности, технологические параметры оптимизации недостаточно универсальны: они не учитывают экономику. Универсальностью обладают, например, обобщенные параметры оптимизации, которые строятся как функции от нескольких частных параметров.
Пример выбора параметра оптимизации, обладающего полнотой, рассмотрен в работе для процессов зонной перекристаллизации. Обычно применяемый для этой цели коэффициент распределения, представляющий отношение концентраций примесей в твердой и жидкой фазах, излишне специфичен. Предложен более полный параметр оптимизации — энтропийная функция S:
где cij — концентрация i-й примеси (при их числе т) в j-м участке слитка (при их числе п).
Требование №7: параметр оптимизации должен иметь физический смысл, быть простым и легко вычисляемым.
Требование физического смысла связано с последующей интерпретацией результатов эксперимента. Технологические параметры оптимизации имеют ясный физический смысл, но иногда для них может не выполняться, например, требование статистической эффективности. Тогда рекомендуется переходить к преобразованию параметра оптимизации. Преобразование, например, типа , может сделать параметр оптимизации статистически эффективным (например, дисперсии становятся однородными), но остается неясным: что же значит достигнуть экстремума этой величины?
Параметр оптимизации оказывает влияние на вид математической модели исследуемого объекта. Экономические параметры, в силу их аддитивной природы, легче представляются простыми (линейными) функциями, чем физико-химические показатели.
2.2. Решение задач с несколькими выходными параметрами оптимизации.
При производстве изделий приходится учитывать физико-механические, технологические, экономические, художественно-эстетические и другие параметры (прочность, эластичность, относительное удлинение и т. д.). При математическом моделировании оптимизируется одна функция, важная с точки зрения цели исследования, при ограничениях, налагаемых другими функциями. Возможность уменьшения числа выходных параметров определяется при помощи корреляционного анализа.
При этом между всевозможными парами параметров необходимо вычислить коэффициент парной корреляции, который является характеристикой связи между двумя случайными величинами. Если обозначить один параметр через у1, а другой — через у2, а число опытов, в которых они будут измеряться, — через N, так, что и=1, 2,..., N, где и — текущий номер опыта, то коэффициент парной корреляции r вычисляется по формуле:
Здесь и средние арифметические соответственно для у1 и у2.
Область определения коэффициента парной корреляции от –1 до +1. Если с ростом значения одного параметра возрастает значение другого, у коэффициента будет знак плюс, а если уменьшается, то минус. Чем ближе найденное значение ry1y2 к единице, тем сильнее значение одного параметра зависит от того, какое значение принимает другой, т. е. между ними существует линейная связь, и при изучении процесса можно рассматривать только один.
Для проверки значимости коэффициента r пользуются сравнением его значения с табличным (критическим) значением r. Для использования таблицы задают число степеней свободы f = N – 2 и выбирают уровень значимости, например, равный 0,05 (5%-ный уровень риска), что соответствует вероятности верного ответа при проверке гипотезы Р = 1 – а = 0,95, или 95%. Это значит, что только в 5% случаев возможна ошибка при проверке.
Проверка гипотезы сводится к сравнению абсолютной величины коэффициента парной корреляции с критическим значением. Если rэкс < rтабл, то нет тесной линейной связи между параметрами, а если rэкс ≥ rтабл, то гипотеза о корреляционной линейной связи не отвергается.
При высокой значимости коэффициента r любой из двух анализируемых параметров исключают из рассмотрения как не содержащий дополнительной информации об объекте исследования. Исключить можно тот параметр, который технически труднее измерять, или тот, физический смысл которого менее ясен. При планировании эксперимента целесообразно измерять все параметры, затем оценить корреляцию между ними и строить модели для их минимально возможного числа или же воспользоваться обобщенным параметром.
2.3. Обобщенный параметр оптимизации. Простейшие способы построения обобщенного отклика.
Путь к единому параметру оптимизации для сложного процесса лежит через обобщение. Каждый отклик имеет свой физический смысл и свою размерность. Чтобы объединить отклики необходимо выполнить следующее:
– ввести для каждого из откликов безразмерную однотипную шкалу, чтобы сделать их сравнимыми. Выбор шкалы зависит от априорных сведений об откликах, точности определения обобщенного признака;
– выбрать правила комбинирования исходных частных откликов в обобщенный показатель.
Пример 1. При разработке оптимальной рецептуры нового пластифицированного полимерного материала качество продукции оценивалось семью выходными параметрами: y1 — термостабильность композиции, мин; у2 — блеск (баллы), у3 — морозостойкость, °С; y4 — модуль упругости при +20° С, кгс/см2; у5 — предел прочности при растяжении, кг/см2; у6 — относительное удлинение при разрыве, %; у7 — число перегибов до разрушения, шт.
Для каждого частного отклика вводятся преобразования:
Для комплексной оценки материалов были построены два обобщенных показателя:
учитывающий требования и разработки и заказчика, и учитывающий только основные требования заказчика. По обобщенному показателю Y1 рекомендуются только три рецептуры (каждый опыт соответствует одной рецептуре), а по Y2 – удовлетворительное качество имеют материалы в семи опытах.
Таблица 1– Натуральные, преобразованные и обобщенные отклики
Пример 2. Другой способ получения обобщенного отклика применяется, когда для каждого из частных откликов известен «идеал», к которому нужно стремиться. Существует* много способов введения метрики*, задающей «близость к идеалу». Вводится новое обозначение: уu0 — наилучшее («идеальное») значение u-го отклика, тогда уuг — уu0 рассматривается как мера близости к «идеалу». Существует две причины невозможности использования разности при построении обобщенного отклика:
– разность имеет размерность соответствующего отклика, а у каждого из откликов может быть своя размерность, что препятствует их объединению;
– отрицательный или положительный знак разности создает неудобства при расчетах, поэтому для перехода к безразмерным значениям разность уuг – уu0 делят на желаемое значение уu0: (уuг – уu0)/ уu0.
Для нивелирования знаков разность возводят в квадрат:
Если в опыте все частные отклики совпадут с идеалом, то Y = 0. К такому значению необходимо стремиться. При этом задаются значением нижней границы, поскольку верхняя граница равна нулю.
Недостатком такой оценки является нивелировка частных откликов. Все они входят в обобщенный отклик на равных правах, что практически не всегда достигается. Устраняют этот недостаток введением некоторого веса аu
причем
Чтобы проранжировать отклики по степени их важности и найти соответствующие веса, используют экспертные оценки.
Для перехода к более сложным способам обобщения параметров фиксируют более тонкие различия на шкале преобразования откликов, и опираются на опыт экспериментатора, для чего вводится система предпочтений экспериментатора на множестве значений каждого частного отклика, получение стандартной шкалы и обобщение результатов.
ЛЕКЦИЯ №3
ФАКТОРЫ. СВОЙСТВА ФАКТОРОВ.
3.1. Факторы. Свойства факторов и совокупности факторов.
Факторы были названы входами “чёрного ящика”.
Ещё было отмечено одно свойство факторов: чтобы объект исследования был управляемым, факторы должны позволять активное вмешательство в выбор уровней изменения фактора. Чем меньше возможности в управлении факторами, тем хуже воспроизводимость эксперимента.
Определение: Фактор – это способ воздействия на оптимизируемый объект.
В рассмотрение нужно включить все существенные факторы, которые могут влиять на процесс. Если какой-либо существенный фактор окажется неучтённым, то это может примести к ошибочным заключениям, а при физическом эксперименте и неприятным последствиям. Существенный неучтенный фактор повышает ошибку опыта.
Увеличение числа факторов увеличивает размерность факторного пространства, а увеличение размерности пространства в степенной зависимости влечёт увеличение числа опытов. О такой ситуации образно говорят как о “проклятии размерности”. Если число факторов больше пятнадцати, нужно обратиться к методам отсеивания несущественных факторов.
Фактор считается заданным, если с его названием указана область определения – совокупность всех значений, которые в принципе может принимать данный фактор. Область определения может быть непрерывной или дискретной. Непрерывность и дискретность понимается в статистическом смысле (с заданной величиной погрешности).
В примере по формированию обобщённого отклика в качестве факторов использовались реальные параметры объектива. Область определения данных факторов, радиусов, толщин, воздушных промежутков, посадочных зазоров, влекущих децентрировку оптических поверхностей, имела семь дискретных состояний, заданных квалитетами точности. В этом смысле область определения рассмотренных факторов – дискретна, но в пределах квалитета точности фактор статистически с заданной функцией распределения вероятности непрерывно принимал некоторое значение, в принципе неконтролируемое. Именно в таком смысле понимается статистическая дискретность фактора.
Чем шире границы точности квалитета, тем менее управляем эксперимент и тем хуже его воспроизводимость. Мы будем рассматривать только дискретные в статистическом смысле факторы.
Для непрерывных факторов, таких как температура, время, масса и т.д. всегда выбираются дискретные множества уровней.
Области определения факторов, как правило, ограничены. Ограничения носят либо принципиальный, либо технический характер.
3.2. Кодирование фактора.
Факторы могут быть количественными или качественными. Кодирование количественного фактора осуществляется естественным путём с помощью некоторого функционального преобразования, быть может, тождественного.
Качественным факторам непосредственно не соответствует числовая шкала. Должно быть произведено кодирование качественного фактора. Кодирование производится путём сопоставления различным уровням фактора чисел натурального ряда. Причём, порядок уровней может быть произволен, но после кодирования он фиксируется.
Качественным фактором в исследуемом объективе “Минитар” может быть, например, метод крепления: присвоим известным четырём методам, последовательно: 1 насыпному с промежуточными кольцами, 2 – насыпному без промежуточных колец, 3 – насыпному в оправах и 4 – комбинированному методу. Влияние данного качественного фактора на модель проявляется в изменении вида функций влияния первичных погрешностей на частичные погрешности и изменением их состава.
3.3. Требования, предъявляемые к факторам при планировании эксперимента.
- фактор должен быть управляемым, то есть нужное значение фактора поддерживается постоянным в статистическом смысле,
- фактор должен быть операциональным, т.е. может быть указана последовательность действий (операций), с помощью которых устанавливаются его конкретные уровни. Такое требование обеспечивает однозначное понимание фактора. Невыполнимый жёсткий допуск на первичную погрешность – пример неоперационного фактора.
С операциональным определением фактора связаны выбор его размерности и точность фиксирования
- фактор должен быть однозначным. Фактор не должен зависеть от других факторов.
В данном случае имеется в виду линейная зависимость.
- множество факторов должно быть достаточно полным. Если какой-либо существенный фактор пропущен, это приведёт к неправильному определению оптимальных условий и большой ошибке опыта.
Области практических приложений с использованием физического планирования эксперимента многообразны: химия, металлургия, биология, медицина, обогащение полезных ископаемых, пищевая и текстильная промышленность, сельское хозяйство, военное дело и др. Физическое планирование эксперимента в приборостроении проводится на физических макетах установок и приборов. Однако обычно ограничиваются лишь установлением зависимостей откликов от факторов, то есть решают так называемую интерполяционную задачу.
Модельное планирование эксперимента может проводиться всегда, если построена компьютерная модель процесса, системы, прибора или узла.
Лекция №4
ВЫБОР МАТЕМАТИЧЕСКОЙ МОДЕЛИ.
ОПТИМИЗАЦИЯ ИССЛЕДУЕМЫХ ПРОЦЕССОВ.
4.1. Выбор вида математической модели.
Под математической моделью понимаем вид функции отклика:
у = f(x1, x2,…, xk).
С целью построения математической модели какого-либо объекта исследования необходимо:
1) Выбрать модель, т. е. выбрать вид этой функции, записать ее уравнение.
2) Спланировать и провести эксперимент для оценки численных значений констант (коэффициентов) выбранного уравнения.
Первоначально при выборе модели рассматривают геометрический аналог функции отклика — поверхность отклика. В случае многих факторов геометрическая наглядность теряется и рассматривается абстрактное многомерное пространство.
Для изображения геометрически возможных состояний «черного ящика» с двумя входами достаточно располагать плоскостью с обычной декартовой системой координат. По одной оси координат откладываются значения (уровни) одного фактора, а по другой оси — второго, тогда каждому состоянию «ящика» соответствует точка на плоскости.
Поскольку существуют области определения факторов, у каждого фактора есть минимальное ximin и максимальное ximax возможные значения, между которыми он может изменяться либо непрерывно, либо дискретно.
Если факторы совместимы, то границы образуют на плоскости прямоугольник, внутри которого лежат точки yi. Пунктирными линиями обозначены границы областей определения каждого из факторов, а сплошными — границы их совместной области определения (рис. 11). Пространство, в котором строится поверхность отклика с обозначением оси y, называется факторным пространством (рис. 12). Размерность факторного пространства зависит от числа факторов. Для перехода от трехмерного пространства к плоскости достаточно провести сечение поверхности отклика плоскостями, параллельными плоскости X1ОX2, и полученные в сечениях линии спроецировать на эту плоскость (например, изображения гор и морских впадин на географических картах (рис. 13)). Точка М является точкой оптимума. Каждая линия соответствует постоянному значению параметра оптимизации и называется линией равного отклика. Каждому возможному состоянию «ящика» соответствует одно значение параметра оптимизации. Однако обратное неверно: одному возможному значению параметра оптимизации может соответствовать несколько состояний «ящиков».
Существует три варианта поиска оптимума при минимуме затрат:
1) Если экспериментатор располагает таблицей, в которой содержатся все возможные состояния объекта и соответствующие им отклики, он выбирает то (или те) состояние, которое соответствует наилучшему отклику.
2) Случайный выбор некоторого числа состояний и определение откликов в них, в надежде, что среди этих состояний попадутся оптимальное или близкие к нему состояния.
3) Построение математической модели для предсказания значений откликов в тех состояниях, которые не изучались экспериментально.
Эта стратегия приводит к шаговому принципу, лежащему в основе рассматриваемого метода планирования эксперимента.
4.2. Шаговый принцип поиска экстремума функции.
Первоначально выполняются предположения относительно свойств неизвестной модели до начала эксперимента (как говорят, априори). Предположения, которые невозможно проверить называются постулатами. Если в действительности они не выполняются, то весьма возможно, что мы не найдем оптимум. Точнее, мы примем за оптимум то, что на самом деле им не является (хотя, быть может, нас и удовлетворит).
Главные предположения о свойствах поверхности отклика — это непрерывность поверхности, ее гладкость и наличие единственного оптимума. Эти постулаты позволяют представить изучаемую функцию в виде степенного ряда в окрестности любой возможной точки факторного пространства (аналитические функции). При выборе способа постепенного приближения к оптимальной точке этого пространства, необходимо, чтобы результат не зависел от положения исходной точки.
На рис. 14, а показан благоприятный случай функции отклика для одного фактора, а на рис. 14, б — множество нарушений: два экстремума (оптимума) и пик (нарушение гладкости и непрерывности).
В результате движения слева направо при поисках оптимума, существует вероятность обнаружения только одного из максимумов – наименьшего или наибольшего. Однако такая вероятность сохраняется и при движении справа налево, при условии проведения опытов не во всех точках.
Пример. Сущность шагового принципа заключается в следующем:
а) Если известны значения параметра оптимизации в нескольких соседних точках факторного пространства возможно (в силу гладкости и непрерывности функции отклика) представить результаты в соседних точках. Следовательно, возможно найти точки, для которых ожидается наибольшее увеличение (или уменьшение) параметра оптимизации.
б) Следующий эксперимент переносят в найденные точки и последовательно продвигаются в выбранном направлении, пренебрегая остальными.
в) Сделав новый эксперимент, оценивают направление для последующего продвижения. Процедуру повторяют до нахождения оптимума.
В факторном пространстве выбирают точку и рассматривают множество точек в ее окрестности, т. е. выбирают в области определения факторов малую подобласть. В этой подобласти проводят эксперимент, на основании которого строят первую модель, которую используют для предсказания результатов опытов в точках, не вошедших в эксперимент. Если эти точки лежат внутри нашей подобласти, то такое предсказание называется интерполяцией, а если вне — экстраполяцией. Чем дальше от области эксперимента лежит точка, для которой предсказывают результат, тем с меньшей уверенностью это можно делать. Поэтому экстраполируют недалеко и используют результаты экстраполяции для выбора условий проведения следующего эксперимента.
Существует два способа поиска оптимума функции:
1) Крестиками на рисунке обозначены условия опытов. В случае а использован подход, который иногда называют классическим (метод Гаусса—Зейделя). Он состоит в том, что сначала последовательно изменяются значения одного фактора (эксперимент 1). Затем находится и фиксируется наилучшее значение этого фактора. В этих условиях последовательно изменяются значения второго фактора (эксперимент 2) и т. д. (если больше факторов).
2) В случае б первоначально изучается локальная область 1, затем определяется наиболее интересное направление и в этом направлении ставятся следующие опыты 2.
Эффективность поиска оптимума зависит от вида поверхности, последовательности перебора факторов в случае а и из окрестностей какой точки начат эксперимент в случае б. Процедуры б в отношении результата при рассмотрении линий равных откликов в виде эллипсов, главные оси которых составляют некоторый острый угол с осями координат, будет эффективнее, чем процедура а. (рис. 16).
4.3. Полиномиальные модели исследуемых процессов.
Перед выбором модели формулируют требования, предъявляемые к модели:
1) Способность предсказывать направление дальнейших опытов с требуемой точностью.
2) Точность предсказания во всех возможных направлениях должна быть одинакова, поскольку до получения модели неизвестно, какое направление необходимо. Это значит, что в некоторой подобласти, в которую входят и координаты выполненных опытов, предсказанное с помощью модели значение отклика не должно отличаться от фактического больше чем на некоторую заранее заданную величину. Модель, удовлетворяющая такому требованию, называется адекватной. Проверка выполнимости этого требования называется проверкой адекватности модели. Если несколько моделей отвечают нужным требованиям, предпочитают самую простую модель.
В теории планирования эксперимента при прочих равных условиях предпочитают в качестве класса моделей степенные ряды для отображения зависимости функции отклика от факторов. Используют отрезки степенных рядов — алгебраические полиномы. Построение полинома возможно в окрестностях любой точки факторного пространства. Это наиболее простой, удобный и математически разработанный класс моделей. Полиномы для случая двух факторов:
Для оценки коэффициентов полиномов применяют планирование эксперимента.
Неизвестная функция отклика представляется полиномом. Операция замены одной функции (функции отклика) эквивалентной функцией (степенным полиномом) называется аппроксимацией. Аппроксимировали неизвестную функцию полиномом.
После выбора класса модели эксперимент необходим, чтобы найти численные значения коэффициентов полинома, поэтому, чем больше коэффициентов в уравнении, тем больше опытов необходимо провести. Однако необходимо стремиться к сокращению число экспериментов, поэтому встает задача нахождения полинома, который содержит как можно меньше коэффициентов, но удовлетворяет требованиям, предъявленным к модели. Чем ниже степень полинома при заданном числе факторов, тем меньше в нем коэффициентов.
Необходимо, чтобы модель хорошо предсказывала направление наискорейшего улучшения параметра оптимизации (направление градиента).
Первоначально для описания функции отклика используют полином первой степени, который содержит информацию о направлении градиента и наименьшее число коэффициентов при данном числе факторов.
Выбор подобласти в факторном пространстве (окрестности любой точки), в которой линейная модель адекватна, выполняется при условии аналитичности функции отклика. Размер этой области заранее неизвестен, но адекватность можно проверять по результатам эксперимента. После определения требуемых размеров выбранной области используют движение по градиенту для поиска направления к оптимуму. На следующем этапе отыскивают линейную модель уже в другой подобласти. Цикл повторяется, пока движение по градиенту не перестанет давать эффект, что означает попадание в область, близкую к оптимуму. Либо попаданием в стационарную область задача решена, либо надо переходить к полиномам более высоких степеней, например второй степени, чтобы подробнее описать область оптимума. Кроме задачи оптимизации, существует задача построения интерполяционной модели, при решении которой экспериментатора интересует не оптимум, а возможность предсказания результата с требуемой точностью во всех точках некоторой заранее заданной области. В данном случае не приходится выбирать подобласть, а необходимо последовательно увеличивать степень полинома до тех пор, пока модель не окажется адекватной. Если адекватной оказывается линейная, или неполная квадратная модель (без членов, содержащих квадраты факторов), то ее построение аналогично тому, что требуется для оптимизации.
Лекция №5
ПОЛНЫЙ ФАКТОРНЫЙ ЭКСПЕРИМЕНТ.
5.1. Принятие решений перед планированием эксперимента.
Планирование эксперимента предполагает выбор области эксперимента, для чего необходимо оценить границы областей определения факторов. При этом должны учитываться ограничения нескольких типов:
Первый тип — принципиальные ограничения для значений факторов, которые не могут быть нарушены ни при каких обстоятельствах. Например, если фактор — температура, то нижним пределом будет абсолютный нуль.
Второй тип — ограничения, связанные с технико-экономическими соображениями, например, со стоимостью сырья, дефицитностью отдельных компонентов, временем ведения процесса.
Третий тип (наиболее распространенный) – ограничения, связанные с конкретными условиями проведения процесса, Например, существующей аппаратурой, технологией, организацией. Пример: В реакторе, изготовленном из некоторого материала, температуру нельзя поднять выше температуры плавления этого материала.
Выбор экспериментальной области факторного пространства основан на анализе априорной информации. Информацию, содержащуюся в результатах предыдущих исследований, называют априорной (т. е. полученной до начала эксперимента) и используют для получения представления о параметре оптимизации, о факторах, о наилучших условиях ведения процесса и характере поверхности отклика. Для этого пользуются графиками (или таблицами) однофакторных экспериментов, осуществлявшихся в предыдущих исследованиях или описанных в литературе. Если однофакторная зависимость не представляется линейным уравнением, то в многофакторном случае будет существенная кривизна.
Далее в области определения факторов необходимо найти локальную подобласть для планирования эксперимента. Процедура выбора подобласти включает два этапа: выбор основного уровня и выбор интервалов варьирования.
Основным (нулевым) уровнем называется комбинация (или несколько комбинаций) уровней факторов, которые соответствуют наилучшим условиям, определенным из анализа априорной информации. Каждая комбинация является многомерной точкой в факторном пространстве, которую рассматривают как исходную точку для построения плана эксперимента, которое сводится к выбору экспериментальных точек, симметричных относительно нулевого уровня факторов.
Существует три случая выбора основного уровня факторов:
1) При наличии сведений о координатах одной наилучшей точки, и отсутствии информации о границах определения факторов, данную точку рассматривают в качестве основного уровня. Аналогичное решение принимается, если границы области известны и наилучшие условия лежат внутри этой области.
2) При условии, если наилучшая точка лежит на границе (или весьма близко к границе) области, основной уровень выбирается со сдвигом от наилучших условий.
3) Если координаты наилучшей точки неизвестны, но есть сведения о некоторой подобласти, в которой процесс идет хорошо, основной уровень выбирается, либо в центре, либо в случайной точке этой подобласти. Сведения о подобласти получают, анализируя изученные ранее процессы, из теоретических данных или из предыдущего эксперимента.
4) При наличии нескольких эквивалентных наилучших точек, координаты которых различны, и отсутствии дополнительных данных (технологического, экономического характера и т. д.), выбор основного уровня произволен.
5.2. Сущность полного факторного эксперимента.
Решение задачи начинается с выбора области эксперимента, ограниченной факторным пространством, в котором находятся значения уровней факторов, варьируемых при проведении опытов. В области эксперимента устанавливают основные уровни факторов и выбирают интервалы их варьирования, задающие верхнее и нижнее предельные значения факторов. Основным или «нулевым» уровнем фактора называется его значение, принятое за исходное при планировании эксперимента. Основные уровни выбираются в результате анализа априорной информации о предварительных исследованиях изучаемого объекта таким образом, чтобы их сочетание отвечало значению функции отклика, наиболее близкому к оптимальному. Сочетание уровней факторов определяет условия проведения опыта и является многомерной точкой в факторном пространстве. Сочетание основных уровней принимают за исходную точку для построения плана эксперимента, который ограничен экспериментальными точками, симметричными относительно исходной точки или центра плана.
Интервалом варьирования фактора называется число, прибавление которого к основному уровню дает верхний уровень фактора, а вычитание – нижний. Кроме того, при выборе интервала варьирования верхний или нижний уровни фактора не должны выходить за пределы области определения фактора.
Для удобства записи условий эксперимента и обработки экспериментальных данных натуральные уровни факторов кодируют, используя выражение:
(5.1)
где – кодированное значение фактора; – натуральное значение фактора (в единицах измерения); – натуральное значение «нулевого» уровня фактора; Ii – интервал варьирования натурального значения i-го фактора.
Натуральное значение верхнего уровня фактора рассчитывается как , а натуральное значение нижнего уровня, соответственно, как . В результате нормировки кодированное значение верхнего уровня фактора обозначается хiв = +1, значение нижнего уровня – хiн = –1, а значение «нулевого» уровня – хi0 = 0; порядок уровней в опыте не имеет значения.
Для определения натурального значения фактора, соответствующего какому-либо кодированному значению, также используют формулу (5.1).
Эксперимент, в котором реализуются все возможные сочетания заданных уровней факторов, называют полным факторным экспериментом. Если число уровней каждого фактора равно р, а число факторов – k, то число всех сочетаний уровней факторов, а следовательно, и число опытов ПФЭ
(5.2)
Полный факторный эксперимент, в котором каждый из факторов принимает только два значения: +1 или –1, обозначается как N = 2k. Геометрической интерпретацией ПФЭ типа 23 при k = 3 является куб, изображенный на рис. 5.1, б. Координаты вершин куба характеризуют условия проведения опытов при различных возможных сочетаниях значений факторов x1, x2 и x3.
а
б
Рис. 5.1. Области полных факторных экспериментов: а – N = 22; б – N = 23
5.3. Полный факторный эксперимент типа 2к.
Таким образом, первый этап планирования эксперимента для получения линейной модели основан на варьировании факторов на двух уровнях. Для к факторов число опытов равно 2к.
Эксперимент, в котором реализуются все возможные сочетания уровней факторов, называется полным факторным экспериментом.
Условия эксперимента можно записать в виде таблицы, где строки соответствуют различным опытам, а столбцы – значениям факторов и параметра оптимизации.
Такие таблицы называются матрицами планирования эксперимента. Например,
Таблица 5.1 – Матрица планирования эксперимента 22
№
X1
X2
Y
1
-1
-1
Y1
2
+1
-1
Y2
3
-1
+1
Y3
4
+1
+1
Y4
Геометрическая интерпретация полного факторного эксперимента 22 приведена на рисунке 5.2.
Рис. 5.2. Геометрическая интерпретация полного факторного эксперимента 22.
Здесь через точку основного уровня проведены новые оси координат, параллельные натуральным координатам и соответствующие кодированным факторам, то есть с изменённым масштабом, таким образом, чтобы интервал варьирования равнялся 1. Условия проведения опытов соответствую вершинам квадрата, центром которого является основной уровень.
Площадь, ограниченная квадратом называется областью эксперимента.
Иногда область эксперимента удобнее считать площадь, ограниченную окружностью, описанной около квадрата. Для трёх факторов область эксперимента – куб, для большего числа факторов область эксперимента – гиперкуб.
В задачах интерполяции область эксперимента называют областью предсказываемых значений отклика y.
Запись матрицы планирования, особенно для многих факторов, громоздка. Для её сокращения вводят буквенные обозначения строк следующим образом: порядковый номер фактора ставится в соответствие строчной букве латинского алфавита: x1 – a, x2 – b, … и т.д. Теперь для каждой строки матрица планирования выписывают буквенное обозначение факторов, находящихся на верхних уровнях. Опыт на нижних уровнях условно обозначают (1). Матрица планирования 22 в буквенных обозначениях имеет вид:
Таблица 5.2 – Матрица планирования в буквенных значениях
№
X1
X2
Буквенные
обозначения
строк
Y
1
-1
-1
(1)
Y1
2
+1
-1
a
Y2
3
-1
+1
b
Y3
4
+1
+1
ab
Y4
5.4. Приёмы составления матриц планирования.
При составлении матриц планирования при большом числе факторов пользуются приёмами составления матриц, определяющих правила перехода от матрицы меньшей размерности к матрице большей размерности при добавлении нового фактора или при прямом составлении.
Первый приём.
Каждая комбинация уровней исходного плана встречается дважды: в сочетании с нижним и верхним уровнями нового фактора. Поэтому записываем исходный план для одного уровня нового фактора и повторяем его с другим уровнем.
Второй приём.
Перемножаем столбцы исходного плана построчно с учётом знаков. Второй раз повторяем исходный план и перемножаем столбцы по строкам, но меняем знак произведения на противоположный.
Третий приём.
Это приём прямой записи каждого столбца. Число строк определяется по формуле 2к. Далее используется приём чередования знаков. В первом столбце знаки меняются поочерёдно, во втором они чередуются через два, в третьем – через 4, в четвёртом через 8 и т.д.
5.5. Свойства полного факторного эксперимента.
1) Симметричность. Матрицы планирования эксперимента относительно центра эксперимента: алгебраическая сумма элементов вектор-столбца каждого фактора равна нулю. Или для любого фактора к и N опытов справедливо равенство
.
2) Условие нормировки. Сумма квадратов элементов каждого столбца равна числу опытов, или
.
3) Ортогональность. Матрицы планирования. Скалярное произведение двух вектор столбцов равно нулю для любых двух не равных друг другу факторов из общего числа Р.
.
4) Ротатабельность. Точки в матрице планирования подбираются так, что точность предсказания значений параметра оптимизации одинакова на равных расстояниях от центра эксперимента и не зависит от направления.
ЛЕКЦИЯ №6
ПРОВЕДЕНИЕ ЭКСПЕРИМЕНТА. ОШИБКИ ОПЫТОВ.
6.1. Составление матрицы планирования полного факторного эксперимента.
Условия эксперимента записываются в виде таблицы, где строки соот-ветствуют различным опытам, а столбцы – значениям факторов. Такая таблица называется матрицей планирования эксперимента. Каждый столбец в матрице называется вектор-столбцом, а каждая строка – вектор-строкой.
Полный факторный эксперимент типа N = 23 состоит из проведения восьми опытов и включает в себя все возможные комбинации уровней факторов x1, x2 и x3, а матрица планирования такого эксперимента приведена в табл. 6.1.
Таблица 6.1
Матрица планирования полного трехфакторного эксперимента типа N = 23
Номер опыта
Факторы
Функция отклика y
x1
x2
x3
1
2
3
4
5
6
7
8
–
+
–
+
–
+
–
+
–
–
+
+
–
–
+
+
–
–
–
–
+
+
+
+
y1
y2
y3
y4
y5
y6
y7
y8
Кодированные значения факторов в опытах 1 – 8 (см. табл. 6.1) являются координатами вершин 1 – 8 геометрического куба (рис. 6.1, б), центром которого является основной уровень (0;0;0), а грани куба параллельны плоскостям x10x2, x10x3 или x20x3, образуемым пересечением двух осей координат, и имеют высоту и ширину, равные двум интервалам варьирования Ii. В задачах интерполяции область эксперимента (т. е. объем куба для k = 3) является областью предсказываемых значений функции отклика у.
Один из распространенных приемов построения матрицы планирования, с помощью которого построена матрица ПФЭ типа 23 (см. табл. 6.1), основан на правиле чередования знаков. В первом столбце знаки меняются поочередно, во втором они чередуются через два, в третьем – через четыре, в четвертом – через восемь и т. д. по степеням двойки.
6.2. Полный факторный эксперимент и математическая модель.
Математическая модель исследуемого технологического процесса, разрабатываемая по результатам полного факторного эксперимента, в первом приб-лижении представляет собой полином первой степени вида:
(6.1)
где b0, bi – оценки коэффициентов линейной математической модели (коэффициентов регрессии), которые рассчитываются по следующим формулам:
(6.2)
(6.3)
где xij – кодированное значение i-го фактора в j-м опыте эксперимента; x0j – кодированное значение фиктивного фактора, соответствующего коэффициенту b0, в j-м опыте эксперимента (x0j = +1); N – число опытов эксперимента.
Величина коэффициента показывает влияние данного фактора на параметр оптимизации при переходе фактора с нулевого уровня на верхний или нижний и чем она больше, тем большее влияние оказывает фактор. Если коэффициент имеет знак плюс, то с увеличением значения фактора параметр оптимизации исследуемого процесса увеличивается, а если минус, то уменьшается.
Планируя эксперимент на первом этапе, исследователь не уверен, что получит пригодную модель для математического описания процесса, поэтому в случае непригодности полученной модели переходят к нелинейной модели, которая описывается неполным квадратным уравнением вида:
(6.4)
Нелинейность модели связана с тем, что вклад фактора в функцию отклика при переходе от нижнего к верхнему уровню, зависит от уровня, на котором находится другой фактор. Такая зависимость называется взаимодействием факторов и обозначается согласно формуле (6.4) как xixl. Полный факторный эксперимент позволяет количественно оценивать эффекты взаимодействия. Вектор-столбец взаимодействий факторов получают построчным перемножением вектор-столбцов факторов. Оценка коэффициента регрессии bil, соответствующего эффекту взаимодействия факторов xixl, рассчитывается по формуле:
(6.5)
Матрица планирования ПФЭ типа 23 со всеми возможными эффектами взаимодействия факторов представлена в табл. 6.2.
Таблица 6.2
Матрица планирования ПФЭ типа 23 с эффектами взаимодействия
Номер
опыта
Факторы и эффекты взаимодействия факторов
Функция отклика y
x0
x1
x2
x3
x1x2
x1x3
x2x3
x1x2x3
1
2
3
4
5
6
7
8
+
+
+
+
+
+
+
+
–
+
–
+
–
+
–
+
–
–
+
+
–
–
+
+
–
–
–
–
+
+
+
+
+
–
–
+
+
–
–
+
+
–
+
–
–
+
–
+
+
+
–
–
–
–
+
+
–
+
+
–
+
–
–
+
y1
y2
y3
y4
y5
y6
y7
y8
Эффект взаимодействия двух факторов называется эффектом взаимодействия первого порядка, трех факторов – эффектом взаимодействия второго порядка и получается в результате перемножения трех столбцов – x1, x2 и x3.
6.3. Проверка воспроизводимости опытов (однородности дисперсий).
Каждый эксперимент содержит элемент неопределенности вследствие ограниченности экспериментального материала, и повторные опыты не дают полностью совпадающих результатов, потому что существует ошибка опыта.
Для оценки точности эксперимента в каждой j-й точке факторного пространства проводят n параллельных опытов при тех же условиях, при которых проводились основные. В результате получают значения yj1, yj2,…, yjk исследуемого параметра, для которых находят среднее значение по формуле:
(6.6)
где yjt – значение функции отклика для j-й вектор-строки матрицы планирования в t-м параллельном опыте; t – номер параллельного опыта, t = 1,…, n; n – число параллельных опытов.
В результате постановки параллельных опытов оценки коэффициентов b0, bi, bil рассчитываются по формулам (6.2), (6.3) и (6.5) с подстановкой вместо yj значения для каждой вектор-строки матрицы планирования эксперимента.
Опыт считается статически воспроизводимым, если дисперсия функции отклика y однородная (одинаковая) в каждой точке факторного пространства. Оценка дисперсии для каждой j-й точки факторного пространства определяется по формуле:
(6.7)
где – среднее значение параметра у по результатам n параллельных опытов в j-й строке матрицы планирования эксперимента; yjt – значение функции отклика у для j-й строки в t-м параллельном опыте.
Гипотезу о воспроизводимости опытов (об однородности дисперсий) проверяют с помощью критерия Кохрена. Расчетное значение критерия Кохрена вычисляют по формуле:
(6.8)
Критическое значение критерия Кохрена Gкр находят из таблицы распределения Кохрена (прил. 1) по числу степеней свободы числителя q1 = n – l и знаменателя q2 = N и уровню значимости α, который для инженерных расчетов берется равным 0,05 или 0,1.
Если Gр Gкр, гипотеза об однородности дисперсий принимается, в противном случае отвергается, и тогда эксперимент повторяют, изменив условия его проведения (набор факторов, интервал их варьирования и др.).
Оценка дисперсии воспроизводимости эксперимента (дисперсии параметра оптимизации или функции отклика) рассчитывается по формуле:
(6.9)
ЛЕКЦИЯ №7
ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА. РЕГРЕССИОННЫЙ АНАЛИЗ.
7.1. Регрессионный анализ.
Регрессионный анализ – это исследование регрессионного уравнения – линейной модели плана. Исследование проводится в рамках метода наименьших квадратов (МНК). Регрессионный анализ базируется на трёх постулатах.
Первый постулат.
Параметр оптимизации y есть случайная величина с нормальным законом распределения.
Для поверки нормальности необходимо провести десятки параллельных опытов. Далее пользуются одним из критериев согласия.
Наибольшее распространение в практике получил критерий Пирсона. Идея этого метода состоит в контроле отклонений гистограммы экспериментальных данных от гистограммы с таким же числом интервалов, построенной на основе распределения, совпадение с которым определяется, в данном случае с нормальным распределением.
При большом числе параллельных опытов размах отклика приближается к интервалу трёх сигм.
Пусть, например, в результате n>50-ти параллельных опытов среднее значение отклика, минимальное и максимальные значения , вычислили оценку дисперсии s2. Выбрали m интервалов, вычислили величину интервала ∆, кванта, и подсчитали частотности попадания ki, i=1,2,…,m значений отклика в i-тый интервал, тем самым подготовили данные для построения гистограммы.
Для определения теоретических частотностей в маткаде
1) задаём ранжированную переменную i:=0…m-1
2) определяем значения середин интервалов zi = zmin +(1/2+i)∆
3) вычисляем вектор теоретических частотностей по формуле Ki = dnorm(zi,,s2)*n.
Использование критерия Пирсона заключается в вычислении величины хи-квадрат:
(7.1)
где ki, Ki – экспериментальные и теоретические значения частот в i-том интервале разбиения, m – число интервалов разбиения, Pi – значения вероятностей в том же интервале разбиения, .
С функцией хи-квадрат мы сталкивались при использовании критерия Бартлета для проверки гипотезы об однородности дисперсий.
Число степеней свободы переменной хи-квадрат в критерии Пирсона вычисляется в данном случае по формуле υ=m-3, а не по формуле n-1, как в критерии Бартлета. Две степени свободы задействованы на вычислении двух сумм в числителе и знаменателе отношения критерия Пирсона.
И так, задавшись уровнем значимости, чаще всего 0,05, обращаемся к функции квантилей хи-квадрат распределения, имеющей в маткаде имя dchisq, с параметрами dshisq(1-0.05, m-3). Если вычисленное по опытным данным значение критерия Пирсона χ2 меньше вычисленного по функции квантилей, то гипотеза нормальности принимается, иначе отвергается.
При нарушении нормальности мы лишаемся возможности установления вероятностей, с которыми справедливы те или иные высказывания относительно результатов эксперимента.
Второй постулат. Дисперсия отклика не зависит от его абсолютной величины. Проверка осуществляется с помощью проверки дисперсии на однородность с применением критериев Фишера или Бартлета. Нарушение этого постулата недопустимо. При нарушении однородности дисперсии прибегают к функциональному преобразованию отклика. Преобразование ищется методом проб и ошибок. Обычно начинают с логарифма.
Смысл нелинейного преобразования в том, что он подчёркивает, или выделяет один интервал изменения переменной перед другим. Например, квадратичное преобразование подчёркивает большие величины, а малые (меньшие 1) ещё больше уменьшает. Логарифм, наоборот, “придерживает” скорость роста монотонно возрастающих величин, и поэтому логарифмы дисперсий могут уже оказаться однородными, тогда как сами дисперсии неоднородны.
Третий постулат. Значения факторов суть “неслучайные” величины. Это неожиданное утверждение означает, что установление каждого фактора на заданный уровень и его поддержание на этом уровне существенно точнее, чем ошибка воспроизводимости.
Четвёртый постулат. Факторы не коррелированны. Для матрицы планирования это свойство выполняется автоматически в силу свойства ортогональности.
7.2. Проверка значимости коэффициентов регрессии.
Проверку значимости коэффициентов проводят по t-критерию Стьюдента построением доверительного интервала коэффициента. При использовании полного факторного эксперимента доверительные интервалы для всех коэффициентов (в том числе и эффектов взаимодействия) равны друг другу.
Прежде всего необходимо рассчитать дисперсию коэффициента регрессии при равномерном дублировании n опытов по формуле:
(7.2)
Далее строится доверительный интервал коэффициентов bi и bil:
(7.3)
где tкр – табличное (критическое) значение критерия Стьюдента, выбирается по данным прил. 2 в зависимости от числа степеней свободы, с которым определялось значение , и выбранного уровня значимости α; – квадратичная ошибка коэффициента регрессии,
(7.4)
Коэффициент считается значимым, если его абсолютная величина больше доверительного интервала, т. е. если выполняется неравенство:
(7.5)
Доверительный интервал задается верхней и нижней границами: bi + Δbi и bi – Δbi. Чем у́же доверительный интервал (при заданном α), тем с большей уверенностью можно говорить о значимости коэффициента.
7.3. Проверка адекватности полученной математической модели.
Полный факторный эксперимент проводится в первую очередь для получения линейной математической модели исследуемого процесса, поэтому предварительно проверяют адекватность линейного уравнения регрессии. При условии, если линейная модель неадекватна, переход к нелинейной модели осуществляют добавлением к линейной одного из эффектов взаимодействия факторов, после чего проверяют адекватность вновь полученной модели, и так до тех пор, пока не построят адекватное уравнение регрессии.
Проверка адекватности полученного линейного уравнения регрессии проводится с помощью критерия Фишера, расчетное значение которого представляет собой следующее соотношение:
(7.6)
где – оценки дисперсии адекватности математической модели.
Оценка дисперсии адекватности математической модели при равномерном дублировании n параллельных опытов определяется по формуле:
(7.7)
где р = k + 1 – число коэффициентов линейного уравнения регрессии (для трех факторов: 3 + 1 = 4); число коэффициентов уравнения регрессии увеличивается на 1 при поочередном добавлении к линейной модели эффектов взаимодействия факторов с целью получения адекватного уравнения; – предсказанное значение функции отклика по проверяемой математической модели в каждой j-й вектор-строке матрицы ПФЭ.
Гипотеза об адекватности математической модели принимается, если соблюдается условие: .
Критическое значение критерия Фишера выбирается из таблицы распределения Фишера в зависимости от числа степеней свободы для числителя q1 = N – (k + 1), знаменателя q2 = N(n – 1) и уровня значимости α (прил. 3).
Для записи математической модели в реальных физических величинах производят обратный переход от кодированного масштаба факторов к натуральному, подставляя вместо кодированных значений xi натуральные значения .
ЛЕКЦИЯ №8
ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА.
8.1. Принятие решений после построения модели процесса.
Ситуации различаются по трём признакам:
1) адекватна или неадекватна модель;
2) значимость коэффициентов: (все значимы, частично или все незначимы);
3) информация о положении оптимума: если все значения обобщённого отклика близки и высоки по шкале желательности, то мы находимся в окрестности оптимума.
А) Линейная модель адекватна.
А1. Все коэффициенты значимы, область оптимума близка, то возможны три решения:
1) окончание исследования;
2) переход к планам второго порядка (использование регрессионных уравнений второго порядка: Налимов В.В., Чернова Н.А. Статистические методы планирования экстремальных экспериментов. М., Наука, 1965.);
3) движение по градиенту.
А2. Коэффициенты значимы частично.
Коэффициент незначим по трём причинам:
1) неудачен выбор интервала варьирования соответствующего фактора или центра эксперимента. Увеличивают интервал варьирования, смещают центр.
2) фактор включён из осторожности, но он не влияет на параметр оптимизации. Если это так, то фактор стабилизируется и исключается из рассмотрения.
3) большая ошибка опыта (погрешность воспроизводимости). В этом случае увеличивают число параллельных опытов или во всех точках плана, или в некоторых, и тем самым снижают величину дисперсии воспроизводимости.
Кроме того, возможна достройка плана или до полного факторного эксперимента, либо переход к реплике меньшей дробности.
При близости оптимума можно перейти к планам второго порядка.
А3. Все коэффициенты незначимы (кроме b0). В этом случае используются вышеперечисленные мероприятия по повышению уровня значимости, кроме, очевидно, исключения из рассмотрения.
Если область оптимума близка, то возможно окончание эксперимента.
Б) Линейная модель неадекватна.
Это значит, что поверхность отклика в области эксперимента достаточно крута и её аппроксимация гиперплоскостью несостоятельна.
Признаки неадекватности линейной модели:
1) Основной: критерий Фишера отношения дисперсий адекватности и воспроизводимости;
2) Значимость хотя бы одного из эффектов взаимодействия;
3) Значимость суммы коэффициентов регрессии при квадратичных членах . Оценкой этой суммы служит разность b0 – y0 , где y0 – значение отклика в центре плана. Этот признак необходимый, но не достаточный. Квадратичные эффекты могут быть значимы, хотя, разность незначима, так как квадратичные эффекты имеют разные знаки.
Независимо от того, значимы или нет линейные коэффициенты регрессии при неадекватности модели план перестраивают путём:
1) изменения интервалов варьирования;
2) перенос центра плана;
3) достройка плана;
4) Включение в регрессионную функции нелинейных эффектов. Строим неполный полином второго порядка и движемся по градиенту. Градиент в этом случае будет меняться от точки к точке.
5) Если область оптимума близка, возможно окончание эксперимента или переход к построению планов второго порядка.
8.2. Движение по градиенту.
Наиболее короткий путь к вершине – направление градиента функции отклика. Направление градиента перпендикулярно линиям уровня (рис. 8.1).
Рис. 8.1. Движение по поверхности отклика по градиенту.
Градиент есть вектор в факторном пространстве, координаты которого задаются частными производными по одноимённой координате:
.
Если модель линейна, градиент выражается через коэффициенты регрессии.
Таким образом, изменяя независимые переменные, факторы, пропорционально линейным коэффициентам регрессии, мы будем двигаться в направлении градиента отклика по самому крутому пути. Такая процедура называется крутым восхождением.
При движении по градиенту не участвуют незначимые факторы. Они стабилизируются на одном из уровней .
Качественные факторы, имеющие два уровня, также не участвуют в движении по градиенту. Фиксируется либо лучший уровень, либо движение по градиенту реализуется дважды.
8.3. Этапы расчёта крутого восхождения.
Рассмотрим пример полного факторного эксперимента 22.
Уровни факторов устанавливаются в соответствии с границами области определения факторов, выбором нулевых уровней и интервалов варьирования (табл. 8.1).
Таблица 8.1. Уровни факторов
Параметр
Факторы
X1
X2
Нижняя граница
0,5
3,0
Верхняя граница
3,0
8,0
Основной уровень
1,5
7,0
Интервал варьирования
0,5
1,0
Верхний уровень
2,0
8,0
Нижний уровень
1,0
6,0
Этот пример взят из химии. x1 – процентное содержание раствора неодима, x2 – величина рН раствора. На выходе процентное содержание неодима в растворе. Границы факторов указаны из физических соображений.
Матрица планирования и полученные по ней результаты представлены в таблице 8.2.
Таблица 8.2. Матрица планирования и результаты эксперимента
№
x0
x1
x2
Y
1
+1
-1
-1
95
2
+1
-1
-1
90
3
+1
+1
+1
85
4
+1
+1
+1
82
b
88,0
-2,0
-4,5
1) Рассчитываем составляющие градиента на интервалах варьирования:
b1I1=-2*0,5=-1, b2*I2 = -4,5*1,0 = -4,5
2) Оцениваем шаг движения по градиенту или коэффициент, на который нужно умножить составляющие градиента. Мы должны оставаться в области определения факторов, стартуя с основного уровня на всех уровнях матрицы планирования.
В данном случае с уровней x1=1,5 в границах [0,5; 3] и x2 = 7 в границах [3; 8].
Мы находимся вблизи границы второго фактора, поэтому выбираем шаг движения по нему в размере 0,5. Масштабный коэффициент составит: 0,5/4,5 = 1/9.
Составляющие градиента, не выводящие из области определения факторов при этом соответственно равны ∆x1 = -0,11 и ∆x2 = -0,5
3) Округляем составляющие движения по градиенту: ∆x1 = -0,1 и ∆x2 = -0,5
4) Проводим серию опытов крутого восхождения по схеме (табл. 8.3).
Табл. 8.3. Опыты крутого восхождения
№
x1
x2
5
1,4
6,5
6
1,3
6,0
7
1,2
5,5
8
1,1
5,0
9
1,0
4,5
Опыты крутого восхождения называют ещё мысленными, поскольку с помощью уравнения регрессии можно оценить ожидаемое значение отклика
.
Для определения кодированного значения фактора используем известную формулу
,
где знак “тильда” стоит над натуральным значением отклика. Таблица кодированных значений факторов в серии опытов крутого восхождения и предсказанные значения представлена ниже.
Таблица 8.4. Предсказанные отклики
№
x1
x2
5
-0,2
-0,5
90,65
6
-0,4
-1,0
93,3
7
-0,6
-1,5
95,95
8
-0,8
-2,0
98,6
9
-1,0
-2,5
101,25
Погрешность предсказания растёт линейно с удалением от нулевого уровня. Предсказанное значение отклика в 9-том опыте нереально. Реальные значения откликов будут отличаться.
8.4. Свойства крутого восхождения.
1)Влияние соотношения численных значений коэффициентов регрессии.
Если один из коэффициентов регрессии значительно превышает другие, то это равносильно вырождению многофакторной задачи в однофакторную задачу, что менее эффективно. Аналогично, если часть коэффициентов значительно выделяется среди других, то эффективная размерность факторного пространства уменьшается.
Функция, величины коэффициентов которой различаются не существенно, называется симметричной относительно коэффициентов. Движение по градиенту более эффективно для симметричной функции регрессии. Это достигается подбором интервалов варьирования факторов.
2) Движение по градиенту должно начинаться из нулевой точки. Казалось бы, что если выбрать точку с максимальным значением отклика, то движение будет эффективнее, поскольку направление градиента везде одинаково.
Однако, опыт был спланирован относительно нулевой точки, точки старта, и градиент имеет наименьшую погрешность именно для нулевой точки. Математически функция регрессии приближается статистически к разложению функции отклика в ряд Тейлора именно в окрестности нулевой точки. Этот факт иллюстрируется рисунком
Рис. 8.2. Движение по градиенту из нулевой и лучшей точек плана.
8.5. Реализация мысленных опытов.
Рассчитав составляющие градиента, мы получили условия мысленных опытов. Число мысленных опытов зависит от задачи. Ограничением служит граница области определения хотя бы по одному фактору.
Какие вопросы нужно решить.
1) Нужно ли ставить все опыты подряд или только некоторые из них?
2) С какого опыта начинать?
3) Достигнута граница по какому-то фактору. Что делать?
4) Проводить ли повторные мысленные опыты?
1) Первый вопрос относится к стратегии. Имеется несколько стратегий:
• одновременная, когда ставятся все опыты или подряд, или через один, или через два,
• последовательная: ставится два-три опыта и проводится анализ результатов.
• Метод “ножниц”, когда реализуется два крайних мысленных опыта и прощупывается пространство внутри интервала с помощью третьего опыта и оптимум захватывается в “вилку”.
Эти вопросы важны, конечно, при физических мысленных опытах.
2) С какого опыта начинать.
Если модель адекватна, то начинают реализацию с тех опытов, условия которых выходят за область эксперимента хотя бы по одному фактору.
Для неадекватной модели один-два опыта выполняют в области эксперимента.
3) Достигнута граница одного из факторов. Возможны два решения:
1) значение фактора фиксируется и продолжается движение по остальным факторам
2) остановиться и поставить новую серию опытов линейного приближения с иными интервалами варьирования.
4) При мысленных опытах повторных опытов не проводится, но лишь дублируется лучший результат.
8.6. Принятие решений после крутого восхождения.
Возможны две ситуации: крутое восхождение эффективно и неэффективно.
Крутое восхождение считается эффективным, если хотя бы один из реализованных опытов даст лучший результат по сравнению с наилучшим опытом серии.
А. Крутое восхождение эффективно.
Если область оптимума достигнута, то исследование или заканчивается, или происходит уточнение, детализация функции отклика с помощью планов второго порядка. В результате результаты эксперимента представляются в виде полинома второго порядка.
Если область оптимума не достигнута, то наилучший опыт выбирается за нулевой для составления следующего шага. Шаг начинается с серии опытов по матрице планирования.
Б. Крутое восхождение неэффективно.
Возможны ситуации.
1) Область оптимума близка.
Это значит, что уже при реализации матрицы планирования получены высокие результаты и крутое восхождение ситуации не улучшило. В этом случае возможно: окончание исследования, переход на планирование второго порядка или, если модель была неадекватной, исследовать причины неадекватности.
2) Область оптимума далека при адекватной линейной модели.
На практике крутое восхождение нередко оказывается неэффективным. Это связано с тем, что реальность не хочет следовать постулатам линейного программирования. В этом случае пробуют провести крутое восхождение не из нулевой точки или же повторить планирование также, стартуя из другой области факторного пространства.
3) Область оптимума далека при неадекватной модели. Необходимо выяснить причины неадекватности и повторить эксперимент.
Применение методов планирования эксперимента требует творческого подхода, так как выбор решений при его проведении преимущественно не формализован.
Планирование эксперимента - эффективный метод исследования, если его применять в подходящих условиях.
Истоки планирования уходят в глубокую древность. Согласно легенде около 2200 г. до н.э. китайский император Ю выполнял мистические вычисления с помощью магического квадрата, который был изображён на панцире божественной черепахи:
4 9 2
3 5 7
8 1 6
Сумма чисел по строкам, столбцам и главным диагоналям 15.
В 1514 году немецкий художник Дюрер изобразил магический квадрат 4х4 в правом углу своей гравюры “Меланхолия”:
16 3 2 13
5 10 11 8
9 6 7 12
4 15 14 1
В настоящее время магические квадраты используются при планировании эксперимента и в теории кодирования.
В Матлабе имеется функция magic(n), вычисляющая магические квадраты.
Лекция №9
ДРОБНЫЙ ФАКТОРНЫЙ ЭКСПЕРИМЕНТ.
9.1. Минимизация числа опытов.
Рассмотрим пример: запишем матрицу планирования для полного факторного эксперимента 22 (табл. 9.1).
Таблица 9.1
Используя такое планирование, вычисляют четыре коэффициента и представляют результаты эксперимента неполным квадратным уравнением:
При условии, что в выбранных интервалах варьирования процесс описывается линейной моделью (т. е. проведен эксперимент и получена линейная зависимость y = f(x1, x2)), определяют три коэффициента: b0, b1 и b2, в результате чего остается одна степень свободы, которую используют для минимизации числа опытов. При линейном приближении b12 → 0 вектор-столбец x1x2 используют для нового фактора x3, поэтому здесь не будет отдельных оценок коэффициентов как для ПФЭ, они смешаются следующим образом:
Коэффициент b1 является оценкой влияния фактора х1 и парного взаимодействия х2х3 на функцию отклика, b2 – оценкой влияния фактора х2 и парного взаимодействия х1х3, b3 – оценкой влияния фактора х3 и парного взаимодействия х1х2. Влияние факторов х1, х2 и х3 в данном случае характеризуется величинами β1, β2 и β3 а влияние парных взаимодействий – величинами β23, β13 и β12. Оценки, в которых невозможно разделить линейный эффект и эффект взаимодействия, называют смешанными. Линейные эффекты рекомендуется смешивать, прежде всего, с теми взаимодействиями, которые согласно априорной информации незначимы. Поскольку мы постулируем линейную модель, все парные взаимодействия факторов будут незначимы.
Число несмешанных линейных эффектов в дробной реплике называют ее разрешающей способностью.
Найденное правило минимизации числа опытов формулируется следующим образом: для сокращения числа опытов новому фактору присваивают вектор-столбец матрицы, принадлежащий взаимодействию, которым можно пренебречь, тогда значение нового фактора в условиях опытов определяется знаками этого столбца. Таким образом, матрица планирования эксперимента 23 состоит не из 8-ми опытов, а только из 4.
Рисунок 1 – Сокращенная матрица планирования эксперимента 23
Матрица (рис. 1) сохраняет все свойства полного факторного эксперимента. Она дает возможность оценить свободный член b0 и три коэффициента при линейных членах, т. к. для х3 использован вектор-столбец х1х2 полного факторного эксперимента 22. При вычислении столбцов произведений х1х3 и х2х3, видно, что элементы столбца х1х3 совпадают с элементами столбца х2, а элементы столбца х2х3 – с элементами столбца x1.
9.2. Дробная реплика.
Половина матрицы планирования полного факторного эксперимента 23, состоящая из четырех опытов, необходимая и достаточная для оценки влияния трех факторов на функцию отклика называется «полурепликой» (при этом х3 = + х1х2). Если х3 приравнять к – х1х2, то получается вторая половина матрицы 23, вторая «полуреплика». В этом случае коэффициенты будут оценками основных эффектов факторов совместно с эффектами взаимодействия факторов:
При реализации обеих «полуреплик» получаются раздельные оценки для линейных эффектов и эффектов взаимодействия, как и в полном факторном эксперименте 23. Объединение двух «полуреплик» – есть полный факторный эксперимент 23.
Матрица из восьми опытов для четырехфакторного планирования будет полурепликой от полного факторного эксперимента 24, а для пятифакторного планирования – четверть-репликой от 25. В последнем случае два линейных эффекта приравниваются к эффектам взаимодействия. Для обозначения дробных реплик, в которых р линейных эффектов приравнены к эффектам взаимодействия, пользуются условным обозначением 2k – p (табл. 9.2).
9.3. Выбор полуреплик. Генерирующие соотношения и определяющие контрасты.
При построении «полуреплики» 23–1 существует всего две возможности: приравнять х3 к + х1х2 или к – х1х2 (две полуреплики 23–1 (табл. 9.3)).
Таблица 9.3
Для произведения трех столбцов матрицы I выполняется соотношение: +l = x1x2x3, а матрицы II: –1 = x1x2x3. Символическое обозначение произведения столбцов, равного +1 или –1, называется определяющим контрастом. Контраст помогает определять смешанные эффекты. Для того чтобы определить, какой эффект смешан с данным, необходимо помножить обе части определяющего контраста на столбец, соответствующий данному эффекту. Так, если +l = x1x2x3, то для х1 имеем: так как
Для х2: для х3 –
Это значит, что коэффициенты линейного уравнения будут оценками
Соотношение, показывающее, с каким из эффектов смешан данный эффект, называется генерирующим соотношением. Поэтому дробные реплики задают с помощью генерирующих соотношений. Генерирующим также называют соотношение, которое показывает, какое из взаимодействий принято незначимым и заменено новым фактором.
Полуреплики, в которых основные эффекты смешаны с двухфакторными взаимодействиями, носят название планов с разрешающей способностью III (по наибольшему числу факторов в определяющем контрасте). Такие планы принято обозначать: .
При выборе полуреплики 24–1 возможно восемь решений:
Реплики 1 – 6 имеют по три фактора в определяющем контрасте, а 7 – 8 по четыре, имеют максимальную разрешающую способность и называются главными. Разрешающая способность задается системой смешивания данной реплики и будет максимальной, если линейные эффекты смешаны с эффектами взаимодействия наибольшего возможного порядка.
При отсутствии априорной информации об эффектах взаимодействия экспериментатор стремится выбрать реплику с наибольшей разрешающей способностью, так как тройные взаимодействия менее важны, чем парные.
Реплики, в которых нет ни одного главного эффекта, смешанного с другим главным эффектом или парным взаимодействием, а все парные взаимодействия смешаны друг с другом, носят название планов с разрешающей способностью IV (по наибольшему числу факторов в определяющем контрасте). Они имеют обозначение .
Полуреплики, заданные определяющими контрастами +l = x1x2x3x4 и –l = x1x2x3x4, называются главными полурепликами, поскольку обладают максимальной разрешающей способностью.
При выборе полуреплик, заданных определяющими контрастами +l = x1x2x3x4 и –l = x1x2x3x4, совместные оценки эффектов факторов определяются соотношениями:
Такой тип смешивания дает возможность оценивать линейные эффекты совместно с эффектами взаимодействий второго порядка, а взаимодействия первого порядка – совместно друг с другом.
Если полуреплики задаются генерирующими соотношениями x4 = x1x2 и x4 = –x1x2, то определяющими контрастами являются +l = x1x2x4 и –l = x1x2x4, следовательно, получаются планы с разрешающей способностью III и некоторые основные эффекты смешиваются с парными взаимодействиями:
Разрешающая способность этих полуреплик ниже, чем у планов с разрешающей способностью IV, с помощью которых линейные эффекты определяются независимо от парных взаимодействий.
Эти полуреплики имеют в каждой строке как четные, так и нечетные комбинации букв и не являются главными. Выбор такой полуреплики разумен, если имеется априорная информация о большей значимости тройных взаимодействий по сравнению с парными или о незначимости трех парных взаимодействий x2x4, x1x4, х1х2.
Пример: Матрица планирования представляет собой полуреплику от 24, заданную генерирующим соотношением x4=x1x2x3. Определяющим контрастом является +l = x1x2x3x4. Умножением определяющего контраста последовательно на х1, х2, х3 и х4, определяются совместно оценки линейных эффектов и взаимодействий:
Матрица планирования, результаты эксперимента и коэффициенты регрессии показаны в табл. 9.4.
Таблица 9.4
При выборе полуреплики 25–1в распоряжении экспериментатора имеется множество вариантов. Фактор х5 можно приравнять к одному из шести парных взаимодействий и получить полуреплику с разрешающей способностью III, что является не лучшим выбором полуреплики. Фактор х5 можно приравнять к одному из четырех тройных взаимодействий, тогда получится план с разрешающей способностью IV, и все линейные эффекты будут смешаны с тройными взаимодействиями. И, наконец, полуреплика может быть задана генерирующими соотношениями x5 = +x1x2x3x4 или x5 = –x1x2x3x4. Определяющими контрастами в этом случае будут +l = x1x2x3x4x5 и –l = x1x2x3x4x5. Такие реплики носят название планов с разрешающей способностью V и обозначаются .
Пример: Имеется пять факторов и необходимо выбрать полуреплику с наибольшей разрешающей способностью.
Для полуреплики, заданной генерирующим соотношением x5 = x1x3x4, +1=x1x3x4x5, следовательно,
Смешивание основных эффектов с тройными взаимодействиями, когда существуют эффекты взаимодействия более высокого порядка, нельзя признать наилучшим, если нет специальных соображений.
При выборе полуреплики, заданной генерирующим соотношением x5 = x1x2x3x4 и определяющим контрастом +l = x1x2x3x4x5, коэффициенты определяют смешанные оценки:
Получена полуреплика с разрешающей способностью V.
В таких планах линейные эффекты смешаны с взаимодействиями третьего порядка, а взаимодействия первого порядка – с взаимодействиями второго порядка. Эта полуреплика имеет преимущества по сравнению с ранее рассмотренной репликой.
Возможны двадцать два решения при выборе плана 25–1:
С ростом числа факторов возрастает дробность применяемых реплик. При построении главных полуреплик в определяющий контраст необходимо включать наибольшее число факторов.
ЛЕКЦИЯ №10
ЦЕНТРАЛЬНОЕ КОМПОЗИЦИОННОЕ ПЛАНИРОВАНИЕ ВТОРОГО ПОРЯДКА.
Использование теории планирования эксперимента является одним из путей существенного повышения эффективности многофакторных экспериментальных исследований. В планировании экспериментов применяются в основном планы первого и второго порядков. Планы более высоких порядков используются в инженерной практике редко. В связи с этим далее приводится краткое изложение методики составления планов эксперимента для моделей первого и второго порядков. Под планом первого порядка понимают такие планы, которые позволяют провести эксперимент для отыскания уравнения регрессии, содержащего только первые степени факторов и их произведения:
(10.1)
Планы второго порядка позволяют провести эксперимент для отыскания уравнения регрессии, содержащего и вторые степени факторов:
(10.2)
Нахождение уравнения регрессии методом планирования экспериментов состоит из следующих этапов:
• выбор основных факторов и их уравнений;
• планирование и проведение собственного эксперимента;
• определение коэффициентов уравнения регрессии;
• статистический анализ результатов эксперимента.
Описание поверхности отклика полиномами первого порядка часто оказывается недостаточным. Во многих случаях удовлетворительная аппроксимация может быть достигнута, если воспользоваться полиномом второго порядка (6).
В этом случае требуется, чтобы каждый фактор варьировался не менее чем на трех уровнях. В этом случае полный факторный эксперимент содержит слишком большое количество опытов, равное . Так, при их 27, а число коэффициентов , при число опытов 243, а коэффициентов 21. В связи с этим осуществление полного факторного эксперимента (ПФЭ) для планов второго порядка не только сложно, но и нецелесообразно.
Сократить число опытов можно, воспользовавшись так называемым композиционным или последовательным планом, разработанным Боксом и Уилсоном. Так, при двух факторах модель функции отклика второго порядка представляет собой поверхность в виде цилиндра, конуса, эллипса и т.д., описываемую в общем виде уравнением:
. (10.3)
Для определений такой поверхности необходимо располагать координатами не менее трех ее точек, т. е. факторы и должны варьироваться не менее чем на трех уровнях. Поэтому план эксперимента в плоскости факторов и на рисунке 3, а не может состоять лишь из опытов 1, 2, 3, 4, располагающихся в вершинах квадрата, как это делается для модели первого порядка. К ним должны быть добавлены опыты (звездные точки) 5, 6, 7, 8, расположенные на осях и с координатами и обязательно опыт 9 в центре квадрата, чтобы по любому направлению (5-9-6), (1-9-4) и т. д. располагалось три точки, определяющие кривизну поверхности в этом направлении.
Рисунок 9.1. Планы второго порядка при : а – ортогональный;
б – рототабельный
Таким образом, в общем случае ядро композиционного плана составляет при ПФЭ , а при - дробную реплику от него. Если линейное уравнение регрессии оказалось неадекватным, необходимо:
1) добавить (2 – k) звездных точек, расположенных на координатных осях факторного пространства где - звездное плечо, или расстояние до звездной точки;
2) провести опытов при значениях факторов в центре плана.
При k факторах общее число опытов в матрице композиционного плана составит:
(10.4)
При этом величина звездного плеча и число опытов в центре плана зависит от выбранного вида композиционного плана.
Композиционный план для и представлен в таблице 10.1.
Таблица 10.1 – Композиционный план второго порядка
Номер опыта
Факторы
Результат
Ядро
плана
1
2
3
4
+1
+1
+1
+1
- 1
+1
- 1
+1
- 1
- 1
+1
+1
+1
- 1
- 1
+1
+1
+1
+1
+1
+1
+1
+1
+1
Звездные точки
5
6
7
8
+1
+1
+1
+1
Центр плана
9
+1
Аналогичным образом строятся планы и для большего числа факторов.
ЛЕКЦИЯ №11
ОРТОГОНАЛЬНОЕ ЦЕНТРАЛЬНОЕ КОМПОЗИЦИОННОЕ ПЛАНИРОВАНИЕ ВТОРОГО ПОРЯДКА.
11.1. Ортогональный центральный композиционный план.
В основе разработки математической модели процесса лежит «шаговый» принцип, который в имитационной модели в виде полинома предусматривает переход от полинома первого порядка
(11.1)
к полиному второго порядка:
(11.2)
где b0, bi, bil, bii – коэффициенты уравнения множественной регрессии.
При условии, если с помощью полного факторного эксперимента не удается получить адекватного математического описания технологического процесса, переходят к центральным композиционным планам (ЦКП) второго порядка. В ортогональном центральном композиционном плане к «ядру» плана, роль которого выполняет полный или дробный факторный эксперимент с тем же числом факторов, необходимо добавить опыты в «звездных» точках и опыт в центре плана.
Число опытов ортогонального центрального композиционного плана определяется по формуле:
(11.3)
где Nя – число опытов в «ядре» плана; k – число факторов математической модели; n0 – число опытов в центре плана.
Если число факторов k ≤ 4, то «ядром» плана является полный факторный эксперимент и число опытов в «ядре» плана
Nя = 2k.
(11.4)
Если число факторов k > 4, то «ядром» плана является дробный факторный эксперимент и число опытов в «ядре» плана
Nя = 2k–р,
(11.5)
где р – число генераторов плана или число незначимых взаимодействий факторов, замененных новыми факторами, учитываемыми в эксперименте.
Важными свойствами ЦКП является то, что информация, полученная при проведении полного факторного или дробного факторного эксперимента, не теряется, а используется в дальнейших исследованиях.
К «ядру» плана добавляют 2k опытов в «звездных» точках, которые проводят за пределами области эксперимента, ограниченной факторным прост-ранством. Кодированные значения факторов xi, задающие условия проведения опытов, в «звездных» точках определяются величиной «звездного» плеча α, которое показывает удаление координаты «звездной» точки фактора от центра плана с координатами (0; 0; 0), и рассчитываются по формуле:
.
(11.6)
Для перехода от кодированных значений факторов xi к натуральным значениям и наоборот применяют формулу (1.1).
В центре плана проводится один опыт (n0 = 1). При проведении опыта в центре плана натуральные значения всех факторов соответствуют «нулевому» уровню, выбранному при анализе априорной информации, а кодированные значения равны 0.
11.2. Составление матрицы планирования ОЦКП для трех факторов.
Планирование эксперимента с использованием ЦКП второго порядка при условии, что в качестве критерия оптимальности принята ортогональность плана, предполагает сохранение свойства ортогональности матрицы планирования. Поскольку в матрице планирования ЦКП не все столбцы ортогональны, так как и , в связи с тем, что x0 = 1, а , с целью ортогонализации плана необходимо преобразовать столбцы матрицы, заменив новой переменной , которую находят по выражению:
(11.7)
После замены на в выражениях и станут равны нулю суммы построчных произведений вектор-столбцов матрицы планирования эксперимента:
(11.8)
Таким образом, искомая квадратичная модель при поиске условий, обеспечивающих ортогональность плана, записывается в виде промежуточной модели вида:
(11.9)
Величина β вводится для обеспечения ортогональности плана:
(11.10)
С учетом проведенных преобразований матрица планирования экспе-римента для трех факторов, задающая условия проведения опытов при использовании ОЦКП, представлена в табл. 11.1. «Ядром» ОЦКП для k = 3 является ПФЭ типа 23 с числом опытов Nя = 8.
При исследовании трехкомпонентной системы y = φ(x1, x2, x3) геометри-ческой интерпретацией области эксперимента является правильный геометрический куб, который представлен на рис. 11.1. Согласно составленной матрице планирования для трех факторов координаты вершин куба соответствуют условиям проведения опытов в «ядре» ОЦКП, т. е. точки 1 – 8 – это опыты ПФЭ типа 23, координаты «звездных» точек соответствуют условиям проведения опытов с 9-го по 14-й, а координаты точки 15 соответствуют условиям проведения опыта в центре плана.
Таблица 11.1
Матрица планирования ОЦКП для трех факторов
Номер опыта
Факторы
1
2
1
2
1
2
Функция отклика yj
x1
x2
x3
x1x2
x1x3
x2x3
1
2
3
4
5
6
7
8
+
–
+
–
+
–
+
–
+
+
–
–
+
+
–
–
+
+
+
+
–
–
–
–
+
–
–
+
+
–
–
+
+
–
+
–
–
+
–
+
+
+
–
–
–
–
+
+
+
+
+
+
+
+
+
+
1– β
1– β
1– β
1– β
1– β
1– β
1– β
1– β
+
+
+
+
+
+
+
+
1– β
1– β
1– β
1– β
1– β
1– β
1– β
1– β
+
+
+
+
+
+
+
+
1– β
1– β
1– β
1– β
1– β
1– β
1– β
1– β
y1
y2
y3
y4
y5
y6
y7
y8
9
10
11
12
13
14
+α
–α
+α
–α
+α
–α
α2
α2
α2– β
α2– β
–β
–β
–β
–β
α2
α2
–β
–β
α2– β
α2– β
–β
–β
α2
α2
–β
–β
–β
–β
α2– β
α2– β
y9
y10
y11
y12
y13
y14
15
–β
–β
–β
y15
Проверка воспроизводимости опытов ОЦКП производится в такой же последовательности, как и для результатов ПФЭ, а именно:
1) определяются средние значения функции отклика по результатам n параллельных опытов для каждой j-й вектор-строки матрицы;
2) оценивается дисперсия функции отклика для каждой j-й вектор-строки матрицы планирования;
3) проверяется гипотеза воспроизводимости опытов;
4) оценивается дисперсия воспроизводимости .
Рис. 11.1. Область эксперимента при k = 3.
11.3. Расчет оценок коэффициентов уравнения регрессии.
Оценки коэффициентов уравнения регрессии рассчитываются по фор-мулам:
(11.11)
(11.12)
(11.13)
(11.14)
(11.15)
где с1, с2, с3 – элементы дисперсионной матрицы, значения которых приведены в табл. 11.2 в зависимости от числа факторов k.
Таблица 11.2
Значения элементов дисперсионной матрицы С
Число факторов
«Ядро»
плана
Число опытов
Элементы матрицы С
с0
с1
с2
с3
2
3
4
5
22
23
24
25–1
9
15
25
27
0,1111
0,6667
0,0400
0,0371
0,1667
0,0913
0,0500
0,0481
0,5000
0,2298
0,1250
0,0871
0,2500
0,1250
0,0625
0,0625
11.4. Проверка значимости коэффициентов регрессии.
Проверка значимости коэффициентов уравнения регрессии проводится по t-критерию Стьюдента.
Гипотеза о значимости коэффициента регрессии принимается, если абсолютное значение коэффициента больше его доверительного интервала:
(11.16)
(11.17)
(11.18)
(11.19)
где – квадратичные ошибки коэффициентов регрессии.
Оценки дисперсий коэффициентов уравнения регрессии определяются выражениями:
(11.20)
(11.21)
(11.22)
(11.23)
Критическое значение критерия Стьюдента tкр выбирается из таблицы распределения Стьюдента в зависимости от числа степеней свободы q и уровня значимости α (см. прил. 2). Число степеней свободы определяется как q=N(n–1).
Если неравенства (11.16) – (11.19) не выполняются, коэффициент регрессии считается незначимым и приравнивается к нулю. Поскольку все коэффициенты регрессии оцениваются независимо, изменение оценки любого коэффициента (например, исключение соответствующего коэффициента из уравнения как незначимого) не приводит к изменению других оценок и их дисперсий. Исключение составляет коэффициент b0, так как он связан с оценками при квадратичных членах, поэтому их исключение приводит к изменению b0.
11.5. Проверка адекватности полученной математической модели.
Проверка адекватности уравнения регрессии проводится с помощью критерия Фишера, расчетное значение которого представляет собой соотношение:
(11.24)
где – оценка дисперсии адекватности полученной математической модели, которая определяется по формуле:
(11.25)
где В – число значимых коэффициентов математической модели; – предсказанное значение функции отклика по полученной математической модели в каждой j-й вектор-строке матрицы ОЦКП (см. табл. 11.1).
Гипотеза об адекватности математической модели принимается, если соблюдается условие: .
Критическое значение критерия Фишера выбирается из таблицы распределения Фишера в зависимости от числа степеней свободы для числителя q1 = n(N – B), знаменателя q2 = N(n – 1) и уровня значимости α (см. прил. 3).
Для записи математической модели в реальных физических величинах производят обратный переход от кодированного масштаба факторов к натуральному, подставляя вместо кодированных значений xi натуральные значения .
ЛЕКЦИЯ №12
РОТОТАБЕЛЬНОЕ ЦЕНТРАЛЬНОЕ КОМПОЗИЦИОННОЕ ПЛАНИРОВАНИЕ ВТОРОГО ПОРЯДКА.
12.1. Рототабельный центральный композиционный план.
Рототабельный центральный композиционный план позволяет получить математическое описание технологического процесса в виде уравнения множественной регрессии второго порядка:
(12.1)
где b0, bi, bil, bii – коэффициенты уравнения множественной регрессии.
Рототабельные планы, как и ортогональные, являются композиционными, поскольку позволяют сохранить экспериментальную информацию, полученную с помощью ПФЭ или ДФЭ, которую исследователь далее дополняет опытами в «звездных» точках и в центре плана.
Критерий рототабельности является более сильным критерием оптимальности центрального композиционного плана по сравнению с критерием ортогональности. Рототабельный план позволяет получить модель, способную предсказывать значение функции отклика с одинаковой точностью независимо от направления и на равных расстояниях от центра плана. Поэтому метод РЦКП позволяет получить более точное математическое описание технологического процесса благодаря увеличению числа опытов в центре плана и специальному выбору величины «звездного» плеча α.
Общее число опытов РЦКП определяется по формуле:
(12.2)
где Nя – число опытов в «ядре» плана (ПФЭ или ДФЭ); 2k – число опытов в «звездных» точках; n0 – число опытов в центре плана (табл. 12.1).
Таблица 12.1
Число опытов в центре плана для рототабельного ЦКП
Число опытов
Число факторов k
2
3
4
5
5
6
6
7
7
Nя
n0
22
5
23
6
24
7
25
10
25–1
6
26
15
26–1
9
27
21
27–1
14
Для обеспечения рототабельности композиционного плана величина «звездного» плеча α определяется из условий:
(12.3)
(12.4)
12.2. Составление матрицы планирования РЦКП для трех факторов.
Матрица планирования РЦКП строится так же, как и для ортогонального плана, однако при этом важным является выбор числа опытов в центре плана, которое определяет характер распределения получаемой информации о поверхности отклика. Число опытов в центре плана выбирается таким, чтобы обеспечивалось рототабельное униформ-планирование, при котором информация о значениях функции отклика остается неизменной для точек сферы радиуса ρ внутри интервала информационного контура (0 ≥ ρ ≥ 1). Униформ-рототабельное планирование возможно при условии, если константа λ 1:
(12.5)
Матрица планирования рототабельного центрального композиционного плана для трех факторов, приведенная в табл. 12.2, неортогональна.
12.3. Порядок проведения эксперимента.
При рототабельном центральном композиционном планировании стандартизация масштабов факторов, порядок постановки опытов, проверка воспроизводимости опытов проводятся так же, как и при ОЦКП. При реализации рототабельных планов отказываются от постановки параллельных опытов для оценки воспроизводимости эксперимента, а дисперсия воспроизводимости в таком случае оценивается по результатам опытов в центре плана.
Таблица 12.2
Матрица планирования РЦКП для трех факторов
Содержание плана
Номер опыта
Факторы и взаимодействия факторов
Функция отклика yj
x0
x1
x2
x3
x1x2
x1x3
x2x3
«Ядро» пла-
на – ПФЭ типа 23
1
2
3
4
5
6
7
8
+
+
+
+
+
+
+
+
+
–
+
–
+
–
+
–
+
+
–
–
+
+
–
–
+
+
+
+
–
–
–
–
+
–
–
+
+
–
–
+
+
–
+
–
–
+
–
+
+
+
–
–
–
–
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
y1
y2
y3
y4
y5
y6
y7
y8
«Звездные»
точки
9
10
11
12
13
14
+
+
+
+
+
+
α
–α
α
–α
α
–α
α2
α2
α2
α2
α2
α2
y9
y10
y11
y12
y13
y14
Опыт в центре плана
15
16
17
18
19
20
+
+
+
+
+
+
y15
y16
y17
y18
y19
y20
12.4. Расчет оценок коэффициентов уравнения регрессии.
Для вычисления оценок коэффициентов регрессии и соответствующих оценок дисперсии вычисляют следующие вспомогательные величины:
(12.6)
(12.7)
Коэффициенты регрессии рассчитываются по формулам:
(12.8)
(12.9)
(12.10)
(12.11)
12.5. Определение оценки дисперсии воспроизводимости эксперимента.
Оценка дисперсии воспроизводимости эксперимента рассчитывается на основании результатов опытов, проведенных в центре плана:
(12.12)
где – значение функции отклика в u-м опыте в центре плана; u – номер параллельного опыта в центре плана (u = 1…n0); – среднее арифметическое значение функции отклика в n0 опытах в центре плана:
(12.13)
Значение рассчитывается для числа степеней свободы q = n0 – 1.
12.6. Проверка значимости коэффициентов регрессии.
Оценка значимости коэффициентов уравнения регрессии проводится по t-критерию Стьюдента сравнением абсолютной величины коэффициентов b0, bi, bil, bii с соответствующими доверительными интервалами этих коэффициентов. Коэффициенты регрессии значимы при соблюдении следующих неравенств:
(12.14)
(12.15)
(12.16)
(12.17)
где – квадратичные ошибки коэффициентов регрессии; tкр – критическое значение критерия Стьюдента, выбирается в зависимости от числа степеней свободы q = n0 – 1 и уровня значимости α (см. прил. 2).
Оценка дисперсий коэффициентов регрессии определяется по формулам:
(12.18)
(12.19)
(12.20)
(12.21)
Необходимо помнить о том, что при РЦКП оценки коэффициентов линейных членов и парных взаимодействий некоррелированы с оценками остальных коэффициентов, а квадратичных членов – коррелированы между собой и оценкой b0. Исключение любого из квадратичных членов приводит к изменению оценок квадратичных членов, а также оценки свободного члена b0.
12.7. Проверка адекватности полученной математической модели.
Проверка адекватности математической модели проводится по расчетному значению критерия Фишера. Однако для рототабельного центрального композиционного плана оценка дисперсии адекватности рассчитывается по формуле:
(12.22)
здесь
(12.23)
(12.24)
где – предсказанное значение функции отклика по полученной математической модели в каждой j-й вектор-строке матрицы РЦКП (см. табл. 12.2).
Число степеней свободы q для расчета оценки дисперсии адекватности определяется по формуле:
(12.25)
где – число статистически значимых коэффициентов уравнения регрессии.
Гипотеза об адекватности математической модели принимается, если соблюдается условие: . Критическое значение критерия Фишера Fкр выбирается в зависимости от числа степеней свободы для числителя , знаменателя q2 = n0 – 1 и уровня значимости α (см. прил. 3).
Для перехода в математической модели от кодированных значений факторов xi к натуральным физическим величинам .
ЛЕКЦИЯ №13
НЕКОМПОЗИЦИОННОЕ ПЛАНИРОВАНИЕ ВТОРОГО ПОРЯДКА.
13.1. Некомпозиционный рототабельный план второго порядка (НРП).
Использование некомпозиционных планов второго порядка по сравнению с центральными композиционными планами второго порядка считается более рациональным, если на основе анализа априорной информации известно, что исследуемый процесс описывается полиномом второго порядка. Это является большим преимуществом некомпозиционных планов, поскольку, если априорная информация о порядке полинома отсутствует, то модель исследуемого процесса подбирают, начиная с линейного уравнения, последовательно увеличивая степень полинома до получения адекватной модели, что приводит к удорожанию и увеличению продолжительности эксперимента.
Известно, что целью исследования является получение математического описания изучаемого процесса. По причине сложности исследуемого технологического процесса и малого объема экспериментальной информации неизвестную математическую модель зависимости искомой величины ξ от k независимых факторов представляют полиномом второго порядка вида:
(13.1)
Истинное уравнение регрессии, полученное по результатам опытов в эксперименте, будет иметь следующий вид:
(13.2)
где y – выборочная оценка функции отклика ξ.
По результатам опытов определяют только выборочные коэффициенты регрессии b0, bi, bil, bii,..., которые являются лишь оценками теоретических коэффициентов β0, βi, βil, βii,... полинома (1.1).
При исследовании двухфакторных процессов и систем рациональным является некомпозиционный план типа правильного шестиугольника (см. рис. 13.1), номера вершин которого соответствуют номерам опытов, а координаты вершин – уровням факторов x1, x2 в этих опытах. Количество опытов в центре плана n0 принимают равным четырем. Рассматриваемый план предусматривает проведение 10 опытов, из которых шесть выполняются при уровнях факторов, указанных в вершинах шестиугольника, и четыре опыта – при уровнях факторов, соответствующих центру плана. Этот план является рототабельным и по числу опытов более экономичным, чем соответствующий рототабельный композиционный план, требующий для своей реализации 13 опытов.
Рис. 13.1. Некомпозиционный рототабельный план второго порядка (k = 2)
Другое достоинство описываемого плана заключается в том, что для фактора x1 он требует использования пяти уровней (+1; +0,5; 0; –0,5; –1), а для фактора x2 – только трех уровней (+0,866; 0; –0,866). При ограниченном на практике числе уровней факторов уменьшение этих уровней представляет собой большое достоинство некомпозиционного плана. Кроме того, смена уровней факторов в процессе исследования усложняет и удорожает эксперимент.
Переход от натуральных значений уровней факторов к кодированным значениям осуществляют с использованием следующего выражения:
(13.3)
где – кодированное значение фактора; – натуральное значение фактора (в единицах измерения); – натуральное значение «нулевого» уровня фактора; Ii – интервал варьирования натурального значения i-го фактора, задающий значения верхнего и нижнего уровня фактора.
Натуральное значение верхнего уровня фактора рассчитывается как , а натуральное значение нижнего уровня, соответственно, как . В результате нормировки кодированное значение верхнего уровня фактора обозначается хiВ = +1, значение нижнего уровня фактора – хiН = –1, а значение «нулевого» уровня – хi0 = 0.
13.2. Составление матрицы планирования НРП второго порядка для двух факторов.
Матрица некомпозиционного рототабельного плана второго порядка для двух факторов, согласно представленной на рис. 13.1 геометрической интерпретации эксперимента, приведена в табл. 13.1 и показывает кодированные значения, которые принимают факторы в каждом из 10 опытов.
Уравнение регрессии математической модели имеет следующий вид:
(13.4)
а коэффициенты регрессии b0, b1, b2, b12, b11, b22 определяются по формулам:
(13.5)
(13.6)
(13.7)
(13.8)
(13.9)
(13.10)
где – значение функции отклика в u-м опыте в центре плана; x1j, x2j – кодированные значения факторов x1, x2 в j-м опыте; yj – значение функции отклика в j-м опыте.
Таблица 13.1
Матрица планирования некомпозиционного рототабельного плана второго порядка для двух факторов
Номер опыта
x0
x1
x2
x1x2
y
1
2
3
4
5
6
7
8
9
10
+
+
+
+
+
+
+
+
+
+
+
–
+0,5
+0,5
–0,5
–0,5
+0,866
–0,866
+0,866
–0,866
+0,433
–0,433
+0,433
–0,433
+
+
+0,25
+0,25
+0,25
+0,25
+0,75
+0,75
+0,75
+0,75
y1
y2
y3
y4
y5
y6
y7
y8
y9
y10
Дисперсия воспроизводимости эксперимента рассчитывается по результатам опытов в центре плана при помощи формулы:
(13.11)
где – среднее арифметическое значение функции отклика, полученное по результатам n0 опытов в центре плана.
Дисперсии коэффициентов регрессии вычисляют по выражениям:
(13.12)
(13.13)
(13.14)
(13.15)
Рассматриваемый план не является полностью ортогональным: коэффициенты b0, b11, b22 коррелированны. Таким образом, при незначимости и исключении из уравнения регрессии любого из перечисленных коэффициентов, остальные коэффициенты пересчитываются в обязательном порядке.
13.3. Некомпозиционный план второго порядка Бокса-Бенкина для исследования трехкомпонентной системы.
Для числа факторов от трех до семи разработан ценный, в практическом отношении, класс некомпозиционных планов второго порядка, которые представляют собой определенные выборки строк из полного факторного эксперимента (ПФЭ) типа 3k и называются в честь своих создателей некомпозиционными планами второго порядка Бокса-Бенкина. В этих планах каждая переменная варьируется на трех уровнях: +1, 0, –1, в то время как рототабельные центральные композиционные планы (РЦКП) второго порядка предусматривают использование каждого фактора на пяти уровнях.
Использование некомпозиционных планов, предусматривающих три уровня варьирования факторов, упрощает и удешевляет проведение эксперимента, что является их первым преимуществом. Вторым преимуществом таких планов является наличие в строках матрицы планирования большого количества нулей, в результате чего существенно упрощается вычисление коэффициентов регрессии искомой математической модели. Кроме того, некомпозиционный план для трех факторов требует постановки 15 опытов по сравнению с соответствующим РЦКП второго порядка, которые предусматривает постановку в одном эксперименте 20 опытов.
Геометрическая интерпретация некомпозиционного плана второго порядка для трех факторов изображена на рис. 13.2. Матрица планирования изображенного на рис. 13.2. НРП представлена в табл. 13.2. Номера опытов, перечисленные в матрице планирования, соответствуют вершинам куба, указанным на схеме. В центре плана (при x1 = x2 = x3 = 0) предусмотрено проведение трех опытов (опыты 5, 10, 15).
Рис. 13.2. Схема некомпозиционного плана второго порядка для трех факторов (выборка из ПФЭ типа 33)
Уравнение регрессии трехкомпонентной системы имеет вид:
(13.16)
а оценки коэффициентов регрессии b0, bi, bil, bii определяются по формулам:
(13.17)
(13.18)
(13.19)
(13.20)
где xij, xlj – кодированные значения факторов xi и xl в j-м опыте.
Таблица 13.2
Матрица планирования некомпозиционного плана второго порядка Бокса-Бенкина для трех факторов (выборка из ПФЭ типа 33)
Номер
опыта
x0
x1
x2
x3
x1x2
x1x3
x2x3
y
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
–
–
+
+
–
–
+
–
+
–
+
+
–
–
+
–
+
–
+
–
+
–
+
–
–
+
+
–
–
+
+
–
–
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
y1
y2
y3
y4
y5
y6
y7
y8
y9
y10
y11
y12
y13
y14
y15
Дисперсия воспроизводимости эксперимента рассчитывается по формуле (6.9), а дисперсии коэффициентов регрессии по выражениям:
(13.21)
(13.22)
(13.23)
(13.24)
где А, В, В1, С, D, р – константы, зависящие от числа факторов (для трехфакторной системы ).
13.4. Проверка значимости коэффициентов уравнения регрессии.
Проверка значимости коэффициентов уравнения регрессии проводится по t-критерию Стьюдента сравнением абсолютной величины коэффициентов b0, bi, bil, bii с соответствующими доверительными интервалами этих коэффициентов. Коэффициенты регрессии считаются значимыми, если соблюдаются следующим неравенства:
(13.25)
(13.26)
(13.27)
(13.28)
где – квадратичные ошибки коэффициентов регрессии (); tкр – табличное (критическое) значение критерия Стьюдента, выбирается из таблицы (приложение 2) в зависимости от числа степеней свободы q = n0 – 1 и уровня значимости α.
13.5. Проверка адекватности полученной математической модели.
Проверка адекватности математической модели проводится по расчетному значению критерия Фишера, которое определяется соотношением:
(13.29)
Дисперсия адекватности рассчитывается по следующей формуле:
(13.30)
где
(13.31)
(13.32)
где – предсказанное значение функции отклика по полученной математической модели в каждой j-й вектор-строке матрицы НП (см. табл. 13.1 и 13.2).
Число степеней свободы q для расчета оценки дисперсии адекватности определяется по формуле:
(13.33)
где – число статистически значимых коэффициентов уравнения регрессии.
Гипотеза об адекватности математической модели принимается, если соблюдается условие: .
Критическое значение критерия Фишера Fкр выбирается из таблицы распределения Фишера в зависимости от числа степеней свободы для числителя , знаменателя q2 = n0 – 1 и уровня значимости α (Приложение 3). При инженерных расчетах α принимается равным 0,05.
Для записи математической модели в реальных физических величинах используют формулу (13.3), позволяющую выполнить переход от кодированных значений факторов xi к натуральным значениям .
ЛЕКЦИЯ №14
ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА НА ДИАГРАММАХ «СОСТАВ-СВОЙСТВО».
14.1. Сущность симплексного планирования эксперимента на диаграммах «состав-свойство».
Симплексное планирование эксперимента применяется при исследовании систем, являющихся смесями q различных компонентов. Переменные xi (i = 1, 2, ..., q) таких систем являются пропорциями (относительным содержанием в долях/процентах) i-x компонентов смеси и удовлетворяют условию:
(14.1)
Геометрическая интерпретация симплексного плана, удовлетворяющая условию нормированности суммы переменных (14.1), представляет собой (q – 1)-мерный правильный симплекс х (треугольник для q = 3, тетраэдр для q = 4 и т. д.). Каждой точке такого симплекса соответствует смесь определенного состава, и, наоборот, любой комбинации относительных содержаний q компонентов соответствует определенная точка симплекса.
Для правильного отображения факторного пространства в виде симплексов, переходят от декартовой системы координат к специальной – симплексной, в которой относительные содержания каждого компонента откладываются вдоль соответствующих сторон (граней) симплекса (см. рис. 14.1, а).
В данном случае изменению относительного содержания компонента х1 от 0 до 1 вдоль оси х1 (в долях от длины отрезка 0b, равного единице) соответствует пропорциональное изменение координаты () вдоль стороны ab = от точки а, где компонент х1 присутствует в пропорции 0, до точки b, где содержание первого компонента равно 1, т. е. смесь состоит из компонента х1. Аналогично, перемещению координаты компонента х2 вдоль оси х2 от центра координат (0;0;0) к точке с координатой х2 = 1 соответствует пропорциональное перемещение координаты вдоль стороны bс от точки b, с нулевым содержанием компонента х2 (х2 = 0), к точке с, с его 100-% содержанием (х2 = 1). Третий компонент смеси х3 на треугольной диаграмме (см. рис. 2.1, а) откладывается вдоль стороны са, начиная от точки с с нулевым содержанием данного компонента (х3 = 0), до точки а с координатой х3 = 1. Число долей х1 отрезка 0b = 1 равно числу долей отрезка ab = (см. рис. 14.1, а), т. е. пропорция х1 = , поэтому при рассмотрении симплексов относительное содержание компонентов на его сторонах обозначается просто xi (см. рис. 14.1, б).
а б
Рис. 14.1. Схема перехода к симплексной системе координат
Для определения пропорции компонента х1, соответствующей некой точке М, необходимо провести отрезок МВ, параллельный стороне са; пропорции компонента х2 – отрезок МС, параллельный стороне аb; пропорции компонента х3 – отрезок МА, параллельный стороне bс. Таким образом, определяется относительное содержание компонентов х1, х2 и х3 от 0 до 1 или от 0% до 100%, при котором функции отклика yМ в любой точке М, количественно характеризующая свойство объекта исследования (сплава или смеси), обладает соответствующим значением.
14.2. Симплекс-решетчатые планы.
Задача построения математической модели «состав-свойство», включающей все компоненты системы, решается с использованием полиномиальной модели Х. Шеффе степени n, каноническая форма которой имеет вид:
(14.2)
где .
Приведенные полиномы вида (2.2) получают из обычных полиномов:
(14.3)
соответствующей степени для q переменных введением соотношения и содержат Сq+n–1 коэффициентов.
Для приведения алгебраического полинома третьей степени (n = 3) исследуемого трехкомпонентного металлического сплава (q = 3) общего вида
(14.4)
к виду
(14.5)
выполняются следующие подстановки
(14.6)
(14.7)
(14.8)
которые получаются умножением обеих частей выражения (2.1) на , и
(14.9)
которое получается умножением обеих частей выражения (2.1) на b0.
Кроме того, необходимо выполнить замещение на
(14.10)
а также (в членах и для i n1.
ЛЕКЦИЯ №15
СИМЛПЕКС-РЕШЕТЧАТЫЕ ПЛАНЫ ТРЕТЬЕГО ПОРЯДКА.
15.5. Составление матрицы планирования симплекс-решетчатого плана третьего порядка.
Для оценки коэффициентов аппроксимирующего полинома степени n (14.2) во всех точках плана, соответствующих узлам {q, n} – решетки, реализуются опыты и определяются отклики системы y.
Матрица планирования симплекс-решетчатого плана третьего порядка со всеми возможными комбинациями кодированных значений факторов x1, x2, x3, задаваемых согласно координатам узлов кубической симплексной решетки вида {3, 3} (см. рис. 14.2), приведены в табл. 15.1.
Вводятся специальные обозначения для откликов системы y. Отклики для параметров оптимизации, содержащих только один фактор xi с ненулевым значением в вершине симплекса, обозначаются yi. Отклик для бинарной системы факторов xi и xj с относительным содержанием компонентов 1:1 обозначается yij (i
Тебе могут подойти лекции
А давай сэкономим
твое время?
твое время?
Дарим 500 рублей на первый заказ,
а ты выбери эксперта и расслабься
Включи камеру на своем телефоне и наведи на Qr-код.
Кампус Хаб бот откроется на устройстве
Не ищи – спроси
у ChatGPT!
у ChatGPT!
Боты в Telegram ответят на учебные вопросы, решат задачу или найдут литературу
Попробовать в Telegram
Оставляя свои контактные данные и нажимая «Попробовать в Telegram», я соглашаюсь пройти процедуру
регистрации на Платформе, принимаю условия
Пользовательского соглашения
и
Политики конфиденциальности
в целях заключения соглашения.
Пишешь реферат?
Попробуй нейросеть, напиши уникальный реферат
с реальными источниками за 5 минут
с реальными источниками за 5 минут
Математическая статистика
и планирование промышленного эксперимента
Хочу потратить еще 2 дня на работу и мне нужен только скопированный текст,
пришлите в ТГ