Планирование эксперимента
Выбери формат для чтения
Загружаем конспект в формате docx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
КОНСПЕКТ ЛЕКЦИЙ ПО ДИСЦИПЛИНЕ
«ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА»
ЛЕКЦИЯ 1
ВВЕДЕНИЕ
В инженерной практике часто возникает необходимость сделать надежные выводы о функционировании того или иного объекта на основании массива числовых данных, полученных в результате наблюдений за ним. По различным причинам, и в первую очередь из-за наличия возмущений, числа в массиве данных, на основании которых необходимо делать выводы об объекте, представляют собой значения случайных величин. Другими, также существенными, причинами стохастичности числовой информации являются погрешности измерения анализируемых параметров и ограниченная точность работы исполнительных механизмов, с помощью которых задаются и поддерживаются требуемые значения факторов. Поэтому для анализа функционирования объекта необходимо применять статистические методы.
Статистические методы основываются на теории вероятностей и математической статистике. С их помощью оказывается возможным принимать обоснованные решения по ограниченному числу наблюдений за объектом.
Традиционно статистические методы рассматривают как средство обработки данных, полученных в ходе экспериментов по изучению какого-либо явления. При таком подходе задачи обработки и анализа числовой информации состоят в определении с заданной достоверностью различных отображений изучаемых явлений. Например – значения некоторой величины, степени взаимосвязи между различными величинами,
вида зависимости между ними и так далее. К таким методам можно отнести описательную статистику, корреляционный и регрессионный анализ, методы проверки гипотез и т. д. Так как они предназначены для решения относительно самостоятельных задач путем обработки исходной числовой информации, то их можно назвать элементарными статистическими методами.
Вместе с тем, достаточно давно стало очевидным, что статистические методы, наряду с другими, являются необходимыми инструментами обеспечения качества. Сегодня уже общепризнано, что они - важная составная часть комплексной системы менеджмента качества на предприятии. В отличие от элементарных, статистические методы контроля и управления качеством направлены на своевременное обнаружение тенденций к недопустимому отклонению качества от заданного уровня и на выявление причин появления таких тенденций. Указанные цели могут быть достигнуты только в результате решения нескольких взаимосвязанных задач. Поэтому статистические методы контроля и управления качеством включают несколько элементарных методов, реализуемых в определенной последовательности. В качестве наиболее характерных примеров можно назвать статистический приемочый контроль, статистический контроль процессов, MSA.
В связи с широким использованием статистических методов в производстве и управлении, все более усиливается необходимость их освоения специалистами в различных областях деятельности. Так, в зарубежной практике управления качеством считается, что все на предприятии, от руководителя до рабочего, обязаны знать основы статистических методов.
Поскольку для успешного применения статистических методов требуется определенный минимум знаний и навыков, руководство предприятия должно решить вопрос подготовки не только квалифицированных специалистов в области прикладной статистики, но и обеспечить необходимый уровень знаний статистических методов и навыков их применения у различных категорий работников в соответствии с их должностными обязанностями.
В процессе узучения дисциплины «Планирование эксперимента» представлены элементы теории, на которых базируются наиболее часто используемые методы для обработки и анализа числовой информации, контроля и управления качеством продукции. Рассмотрены примеры решений соответствующих задач.
Для облегчения расчетов в практической части дисциплины будет применяться программная среда MS Excel, которая является стандартным компонентом пакета MS Office и в связи с этим широко доступен. В нем предусмотрены средства (программная надстройка «Пакет анализа», статистические и другие функции рабочего листа, средства графического отображения результатов), которые позволяют инженеру достаточно просто решать самые разнообразные задачи обработки и анализа данных.
В рамках изучения дисциплины, кроме расчетной части, также будут рассмотрены организационные вопросы составления плана проведения эксперимента, контроль сроков выполнения мероприятий по плану. Кроме того, приведены сведения по видам активного и пассивного экспериментов.
Существенное внимание уделяется методу математического планированного эксперимента. Рассмотрены методы составления матрицы (плана) проведения эксперимента для полного и дробного факторного экспериментов с подсчетом необходимого количества опытов. Даны сведения по поиску оптимальных значений функции отклика (параметра оптимизации) в области существования факторов (пошаговый иттерационный метод крутого восхождения Бокса-Уилсона).
1.1. Сведения из теории вероятности и математической статистике
(генеральная совокупность, выборка случайных величин, характеристики выборки). Понятие о видах планирования математического и физического
экспериментов, принципах геометрического и физического подобия объектов управления
Математическая статистика рассматривает вероятностные события в отличие от предмета детерминистической математики, которая ведет анализ событий и явлений, происходящих с вероятностью 100 %. Статистические законы поэтому подчиняются особым законом (случайного распределения, вероятности протекания события, проверки возможности осуществления того или иного процесса и т.п.). Основные понятия математической статистики относятся к понятиям генеральная совокупность случайной (случайных) величины (величин) и выборки из генеральной совокупности определенного объема (количества значений, наблюдений, опытов).
Генеральная совокупность – эта суммарный массив данных, который имеет в перспективе объем, стремящийся к бесконечности, и охватывает все параметры и факторы, которые наблюдаются за неограниченное количество времени. Реальные массивы данных, отобранные из генеральной совокупности в течение определенного времени и ограниченного количества, называют выборками из генеральной совокупности данных.
Для оценки параметров генеральной совокупности применяют несколько основных характеристик. К ним относят математическое ожидание – m, дисперсию – σ и др. В выборке к этим понятиям применяют оценочные величины смещенные и несмещенные. Так, несмещенной оценкой математического ожидания m является среднее значение случайной величины в выборке Xср = Σxi/n, дисперсии σ – среднеквадратическое или стандартное отклонение S = [Σ(Xi -Xср)2/(n-1)]0,5 и т.п.
Исходные данные для проведения практических занятий представлены в 16 вариантах случайных выборок (объем выборки – n = 59), один из которых приведена ниже.
% С
% Cr
%Mn
Ni
Ti
HRC
Ки
ᵠ
2,49
15,21
5,75
2,87
1,52
61,04
5,01
16,58
2,15
17,83
4,58
2,4
1,16
62,17
7,76
9,22
2,01
17,15
3,26
2,98
1,24
61,49
6,06
17,97
2,62
19,33
5,46
2,6
1,18
60,08
11
5
2,54
15,57
3,34
1,85
1,39
62,65
8,5
16,17
2,11
16,55
5,78
1,76
1
59,34
10,42
4,66
3
16,99
5,59
2,9
1,66
60
11,96
5,9
2,99
20,92
4,9
1,02
1,93
59,32
6,35
10,71
2,82
17,85
3,46
2,97
1,06
61,95
5,13
10,15
2,06
19,69
4,52
1,87
1,69
60,51
8,47
8,38
2,56
17,95
4,02
1,47
1,43
62,01
6,46
5,26
2,67
16,49
5,78
1,95
1,96
61,68
11,19
7,29
2,09
18,27
5,88
2,34
1,69
62,68
10,8
17,5
2,64
17,52
3,11
1,13
1,96
59,4
6,56
4,99
2,95
16,23
3,48
1,61
1,09
62,48
6,79
5,04
2,62
15,15
4,82
1,39
1,15
59,62
6,04
6,84
2,55
16,53
3,19
1,08
1,24
59,99
5,23
2,06
2,04
18
5,16
2,13
1,49
62
10,66
2,46
2,17
19,45
3,46
1,04
1,43
59,92
5,96
12,79
2,97
17,4
3,42
1,88
1,29
60,73
9,94
10,58
2,65
19,8
5,1
1,56
1,77
62,36
5,22
11,2
2,2
15,84
5,66
2,17
1,94
61,97
9,63
9,45
2,39
18,17
4,03
2,03
1,2
62,4
9,84
13,73
2,53
17,61
3,1
2,77
1,97
62,16
8,67
13,62
2,06
17,45
5,56
1,09
1,82
61,26
5,51
10,6
2,16
15,93
5,5
1,22
1,43
62,73
11,34
16,51
2,96
20,44
5,82
2,58
1,03
60,91
9,57
4,07
2,75
19,64
4,54
2,76
1,86
62,55
9,22
7,25
2,7
19,55
5,13
1,15
1,93
62,06
10,19
13,86
2,72
20,36
3,26
1,63
1,5
59,98
10,16
17,61
2,54
19,63
4,03
2,61
1,01
62,49
7,2
11,12
2,67
15,9
5,08
2,44
1,43
59,56
9,21
10,51
2,85
20,82
3,21
2,92
1,93
61,28
8,15
2,35
2,28
19,5
5,39
2,29
1,38
60,25
7,9
7,79
2,73
17,63
5,03
1,31
1,56
60,38
10
14,66
2,73
16,78
3,05
1,13
1,38
62,92
7,02
5,39
2,77
16,23
5,87
1,22
1,88
59,66
11,33
3,18
2,11
19,11
5,28
2,52
1,37
60,23
6,79
9,08
2,87
18,35
5,52
1,65
1,26
60,02
11,69
9,92
2,2
16,21
3,07
2,57
1,64
62,35
11,1
6,04
2,2
16,07
4,01
2,58
1,64
61,63
9,74
3,58
2,38
16,97
3,53
1
1
59,39
7,37
10,42
2,56
15,85
3,87
1,36
1,3
59,55
10,14
6,77
2,44
17,19
3,61
2,07
1,84
62,96
11,7
2,96
2,75
17,7
3,2
2,93
1,89
59,7
10,86
6,12
2,26
17,16
5,12
1,99
1,52
60,1
7,63
12,65
2,21
17,94
4,89
1,93
1,58
60,13
10,45
17,72
2,06
15,72
5,72
1,09
1,9
62,42
6,82
12,56
2,71
19,44
4,91
1,6
1,05
61,63
6,52
9,57
2,79
18,06
5,16
2,37
1,45
60,02
7,98
9,93
2,83
15,86
4,37
2,94
1,15
59,92
5,85
16,12
2,66
18,85
3,1
2,76
1,38
62,88
5
14,91
2,74
19,49
3,93
2,95
1,69
59,3
7,98
10,96
2,62
15,67
5,91
2,51
1,97
59,61
7,81
7,1
2,56
20,09
3,81
2,74
1,35
62,55
11,44
2,91
2,27
15,81
3,76
1,28
1,87
60,11
11,95
7,01
2,79
19,99
5,7
1,23
1,73
61,97
5,84
2,74
2,7
16,43
4,8
1,84
1,52
60,07
5,93
4,41
2,71
18,82
4,15
2,89
1,46
62,62
10,68
13,85
Практическая первичная обработка выборки случайной величины осуществляется в следующем порядке.
С применением программного продукта Exel вычисляют статистические характеристики (минимальные, максимальные, размах значений, средние значения, среднеквадратическое отклонение-стандартное отклонение, коэффициент вариации, медиана, мода) расчетной выборки. То есть вычислить по независимым (Хi) и зависимым (Yi) случайным величинам следующие характеристики:
- минимальные значения случайных величин - (Xi, Yi)min;
- максимальные значения случайных величин - (Xi, Yi)max;
- размах – R = (Xi, Yi)max - (Xi, Yi)min;
- среднее значение (Xiср, Yiср) = Σ(Xiср, Yiср)/n, где n – объем выборки;
- среднеквадратическое отклонение=стандартное отклонение Sхi = [Σ (Xi – Xср)2/n]0,5; Syi = [Σ (Yi – Yср)2/n]0,5;
- коэффициент вариации, % – Vxi = (Sхi/Xсрi)100 % и Vyi = (Syi/Yсрi)100%;
- медиана выборки (med) – срединное значение случайной величины между минимальным и максимальным ее значениями – med (Xi, Yi) = [(Xi, Yi)max - (Xi, Yi)min]/2; медиана в большистве случаев не совпадает со средним значением выборки;
- мода выборки (mod) – наиболее часто встречающееся значение случайной величины (определяется анализом случайной выборки или по гистограмме).
Для графической интепретации распределения случайных величин в выборке и сравнения практического распределения с теоретическими предварительно строят гистограммы реального распределения.
Для конкретной случайной величины (Xi, Yi) ее распределение в выборке определяется построением гистограммы. Алгоритм этого построения заключается в следующем:
- на оси ординат откладывается частота (ni) или частость (ni/n) – количество значений случайной величины, попадающих в определенный интервал значений; на оси абцисс откладывается несколько интервалов внутри размаха случайной величины, число этих интервалов определяется статистически, в большинстве случаев это число составляет 10 интервалов;
- при этом проверочными критериями правильности построения гистограммы являетя выполнения условий Σni = n или Σ(ni/n) = 1.
Методы определения соответствия фактического распределения случайных величин теоретическому для последующей интерпретации и обработки данных выборки будут заданы на практических занятиях.
Контрольные вопросы
1. Генеральная совокупность и выборка случайных величин.
2. Основные хараткеристики случайой величины в выборке.
3. Графическое представление распределения случайной величины.
4. Гистограммы – правила построения.
5. Понятие о корреляционном анализе.
6. Понятие о регрессионном анализе.
ЛЕКЦИЯ 2
Статистические методы в управлении качеством продукции. Текущий контроль продукции. Принципы выбора контролируемых параметров и их уровня в стандартах на металлургическую продукцию. Статистическое обоснование объема выборки при контроле у поставщика и потребителя. Контрольные карты. Общая схема управления технологическим объектом с адаптивным блоком
После второй мировой войны нашли широкое применение в технологической практике различных отраслей промышленности методы активизации творческого мышления (мозговой штурм, АРИЗ, применение вепольного анализа и др.), а также получили развитие системный подход, получивший в последствии название Системы управления качеством (или Система качества), метод всеобщего управления качеством. В разработку этих эффективных методов управления и обеспечения высокого качества продукции, получения ноу-хау, создания изобретений и т.п. внесли коллективы ученых физиков, разработавших атомную и водородную бомбы, японские ученые и промышленики, создавшие так называемую японское экономическое чудо (японские методы развития и повышения эффективности производства и качества продукции). В указанные научно-организационные достижения внесли существенный вклад целый ряд ученых – У.Э. Шухарт, А. Фельгейнбаум (создатель системы всеобщего управления качеством – TQM), У.Э. Деминг. Фактически все эти ученые наиболее эффекивно работали на воссоздание, совершенствование японской экономики.
Значительный взнос в управление качеством продукции внесли статистические методы. В этом случае эффективно использование как простых статистических оценок – применение карт сбора и анализа первичной информации, диаграмм Парето, контрольных карт различного типа, так и более сложных статистических оценочных методов – диаграмма причинно-следственных связей (диаграмма Исикавы, она же схема «рыбий скелет»), использование методики статистической аттестации продукции по корреляционной связи между параметрами с возможностью адаптации полученного прогнозирующе-управляющего регрессионного уравнения по корректировке свободного члена уравнения во времени по среднему значению отклонений расчетных значений функции отклика от фактических значений контрольной выборки, сформированной из разрушающих испытаний каждой десятой партии-плавки.
При разработке нормативной документации (НД), например на металлургическую продукцию, такой как ГОСТ, национальный стандарт на технические требования, европейский стандарт – нормы – EN, международный стандарт – ISO, руководствуются следующими принцами-подходами:
- организация – разработчик (научно-исследовательские предприятия, в первую очередь, Технические комитеты при соответствующих органах стандартихиции могут быть инициаторами разработки новой НВ – предприятия изготовителя и потребителя) изучает всесторонне состояние вопроса и опрашивает заинтерессованные стороны – изготовителей, потребителей, службы стандартизации и метрологии и т.п. и составляет первичную редакцию документа; при этом нормирование качественных и служебных характеристик осуществляется с учетом анализа лучших мировых аналогов на продукцию;
- первичная редакция НД рассылается на согласование и выставление замечаний заинтерессованным сторонами, которые анализируются и попадают в очередную редакцию НД;
- далее созывается координационное совещание, в котором принимают участие заинтерессованные лица, принимающие участие в личностной дискуссии по спорным вопросам; такое совещание может собираться не один раз, если существуют существенные противоречия у участников такого совещания;
- в конечном итоге, при согласовании всех основных противоречий, технический комитет принимает решение об утверждении НД и согласовыет это решение с национальным органом-институтом по стандартизации, сертификации и метрологии, при этом может быть указан срок на внедрение нового документа в промышленных отраслях.
Со статистической точки зрения имеются критерии по значимому определению минимального объема исследовательской выборки, в металлургии, например, этот объем принимается не менее 50 измерений, плавок-партий.
Контрольные карты (КК) – рис. 1 - различного типа являются графическим изображением стабильности технологического процесса во времени. Например, КК типа Xср-R строится следующим образом. Имеется для примера 5 временных периодов, по какому-либо параметру качества. Из 5-ти значений средних значений по периодам наблюдения рассчитывают среднее из средних значений Xср/ср, аналогичные действия проводят и с распределением по периодам значений размаха – R = Xmax -Xmin и строят аналогичные зависимости R по временным интервалам. Для наглядности графики размахом симметрично располагают под графиками средний из средних значений показателя качества.
По приводимым ниже зависимостям вычисляют нижнию и верхнюю границы реглирования и делают вывод о стабильности технологии, а также разрабатывают корректирующие технологии.
Ниже также приводится общая схема управления объектом управления/регулирования/исследования с адаптивным блоком.
Диаграмма Парето (рис. 2) применяется для определения степени важности – значимости влияния факторов на функцию отклика (Yi) – строится графическая зависимость, в которой по оси абцисс располагают факторы, а на оси ординат – удельный вес (%) или доля от единицы. При этом сначала на оси абцисс располагают наиболее значимые факторы, график строят в виде ступенчатой кривой, а после каждого фактора его влияние суммируют с предыдущим уровнем влияния фактора по значимости влияния с получением накопительной – кумулятивной кривой. Последнее значение этой кривой должно быть равно 100 % (1). На диаграмме Парето выделяют область наиболее весомых – значимых факторов, суммарный удельный вес влияния которых равен 75 %, остальные факторы незначимо влияют на параметр (Yi). Это – один из эффективных способов отсеивания незначммых факторов. По заданию преподавателя обучающийся строит диаграмму Парето по экспериментальным данным.
Рис. 2. Образец диаграммы Парето
Построить контрольную карту (КК) типа Xср – R. По заданию преподавателя обучающийся должен построить КК и установить уровень стабильности показателя качества продукции.
Рис. 1. Контрольная карта типа Xср – R
Границы регулирования определяют по следующим зависимостям:
- для средних значений Xср – верхняя граница регулирования: UCL = Xср/ср + A2Rср; нижняя граница регулирования: LCL = Xср/ср - A2Rср;
- для значений размаха R - верхняя граница регулирования: UCL = D4Rср; нижняя граница регулирования: LCL = D3Rср.
Значения соответствующих коэффициентов представлены в табл.
N
A2
D3
D4
2
1,880
-
3,267
3
1,023
-
2,575
4
0,729
-
2,282
5
0,577
-
2,115
6
0,483
-
2,004
7
0,419
0,076
1,924
8
0,373
0,136
1,864
9
0,337
0,184
1,816
10
0,308
0,223
1,777
Обозначения на схеме управления объектом с адаптивным блоком (рис. 3): Xвект – вектор входных контролируемых возмущений, Xi - текщее зачение X, ΔX - разница значений между текущим и эталонным значениями X, Yвект – вектор выходных параметров оптимизации, Yi – текущее значение Y, ΔY – разница значений между текущим и эталонным значениями Y, Fвект – вектор входных контролируемых возмущений, Xзад. – заданное значение X, Yзад – заданное значение Y, Uвект – управляющий вектор, Р - регулятор, АБ – адаптивный блок.
Левая цепь (Xвект - Xi - ΔX – Р - Uвект - АБ – объект управления) называется управлением по возмущению – характеризуется высоким быстродействием, но низкой точностью. Правая цепь (Yвект - Yi – ΔY – Р - Uвект – АБ – объект управления) – управление по отклонению, характеризуется низким быстродействием, но высокой точностью.
Совместное использование обеих цепей обеспечивает эффективное управление объектом, этому способствует и наличие адаптивного блока, который корректирует управляющее регрессионное уравнение по изменению (при необходимости, - условие этого см. ниже) значений свободного члена.
Рис. 3.
Контрольные вопросы
1. Развитие положений по управлению качеством.
2. Основные поятия о статистическом управлении качеством.
3. Системы управления качеством.
4. Всеобщее управление качеством – TQM.
5. Карты-листки сбора первичной информации о процессах, объектах управления, регулирования.
6. Диаграмма причино-следственых связей -диграмма Исикавы.
7. Этапы разработки нормативной документации (НД).
8. Контрольные карты процессов.
9. Диаграмма Парето.
10. Схема управления/регулирования/исследования объекта с адаптивным блоком.
ЛЕКЦИЯ 3
Характеристики видов экспериментов (теоретический подход, математи-ческое симулирование условий эксперимента, физический эксперимент), условия подобия физического объекта и материальной копии. Выбор наиболее эффективной схемы эксперимента. Составление плана проведения экспериментов разных уровней (опытный, лабораторный, полупромышленный, промышленный, изготовление опытно-промышленной партии)
В настоящее время в опытно-экспериментальной практике в промышленности и лабораторных условиях существуют несколько видов экспериментов. К ним относятся:
- проведение активных и пассивных опытов;
- математическое моделирование с применением различных расчетных методов и систем;
- применение теоретических подходов с дифференциальным исчислением описания тех или иных физических процессов и явлений, технологий и т.п. – теоретический подход к описанию процессов, явлений;
- физическое моделирование с применением различных симулирующих установок и устройств, а также различных химико-физических сред и условий.
В ряде случаев исследователи могут использовать для получения достоверного
результата исследований применяют сочетание нескольких экспериментальных практик.
Каждый из указанных способов имеет достоинства и недостатки.
Так, например, применение для описания объекта исследования теоретических положений и зависимостей, полученных путем решения систем дифферециальных уравений в частных производных (уравнение теплопроводности, массопереноса, описание состояние точки деформируемого тела) приводит к получению неточных решений и весьма трудоемко в процессе решения. Это связано с тем, что при решении таких задач приходится применять большое количество упрощений и допущений, что отрицательно сказывается на точности результатов. Такие уравнения связи функции отклика от внешних независимых факторов обычно справедливы для очень узкого применения в условиях, при которых они (уравнения) были получены.
Уравнения связи зависимых и независимых переменных, полученные в результате проведения активных экспериментов (опытов) справедливы для тех устройств и условий, при которых они были получены. На основании вышеуказаного, на практике зачастую применяют зависимости, полученных классическим теоретическим путем, уточненные эмпирическими коэфициентами для конкретного оборудования и технологического процесса. Зачастую получают положительный эффект и удовлетворительную сходимость фактических и расчетных значений.
Математическое моделирование на современных программных комплексах (например, методы динамического программирования, линейного и нелинейного программирования, нейросетевого планирования, метода конечных элементов и др. – расчетные системы типа DEFORM 3D, DEFORM 3D+HEAT TREATMENT, qFORM и др. с наполнением граничными условиями и исходными данными) применяется, в основном в качестве первичного оценивания процесса и получения предварительных результатов для последующего уточнения параметров объекта исследования другими экспериментально-расчетными способами.
Методы физической имитации физических и технологических процессов получили достаточное широкое развитие и дают достаточно точные решения. В ряде случаев планирование физического моделирования индивидуально и требует даже разработки и изготовления специальной оснастки. Однако, в настоящее время появилось некоторое количество испытательных комплексов универсального назначения для проведение высокотемпературной деформации в сочетании с регулируемых охлаждением и т.п. Это комплексы типа GLEEBLE 3500, 3800, различные дилатометры и т.п.
Немаловажное значение при проведении экспериментальных исследований носит так называемый «масштабный фактор». При проведении лабораторных экспериментов было замечено, что имеется отличие в физико-химических и технологических свойствах объектов уменьшенных опытных размеров и макрообъектов (при переходе от маленьких моделей к большим промышленным объектам). В качестве примера, приведем физические свойства твердосплавных прокатных валковых материалов на образцах уменьшенного размера (полное соответствие требованиям), но свойства больших твердосплавных валков были забракованы. При этом следует применять подходы теории и практики подобия как геометрического, так и физического.
Перед проведением физического эксперимента, как и любого другого типа опытов, следует тщательно продумать условия их осуществления. Для этого следует разработать план эксперимента, предварительно продумав все физико-технические эффекты действий экспериментатора и их соответствие существующей теории и практике явления, процесса. План должен быть подписан лицом, его составившим и ответственным за его исполнение; утвержден руководителем организации; согласован с соисполнителями. Как правило, содержательная часть плана должна быть составлена в виде таблицы, например следущей формы:
№
п/п
Наименование мероприятий
Цель проведения и ожидаемые результаты
Исполнители
Сроки исполнения
Вид отчетности
1.
Аналитический и патентный обзор по проблеме исследования
Выявление «узких» мест, постановка или уточнение целей и задач исследования
Указываются или конкретные ФИО, или подразделения организации
I кв. очередного года
Акт приемки-сдачи между заказчиком и исполнителем
…
…
…
После выполнения плана эксперимента составляется заключение или отчет по результатам исследований и определяются направления дальнейших действий. Отчет и рекомендации согласовывают с Заказчиком хоздоговорной или иной темы НИР или НИОКР.
Эксперименты могут быть лабораторным, полупромышленным, промышленным и т.п.
По результатам проведенных экспериментов, разработки рекомендаций и технологических инструкций осуществляют, как правило, под авторским надзором исполнителя – разработчика опытной технологии, изготовление полупромышленной партии изделий (например, термообработанных деталей машиностроительного назначения) ограниченного объема (количество деталей оговаривается или в плане проведения экспериментов, или устанавливается заказчиком). После получения положительных результатов изготовления полупромышленной партии осуществляют производство промышленной партии увеличенного объема. После получения положительных результатов в промышленной партии и отзывов потребителей такая продукция является внедренной в производство и освоенной на конкретном предприятии.
Контрольнные вопросы
1. Виды/типы экспериментов.
2. Основы применения принципов подобия.
3. Выбор рациональной схемы эксперимента.
4. Методика составления планов различных экспериментов.
5. Математическое моделирование.
6. Физическое моделирование.
ЛЕКЦИЯ 4
Введение в методику планирования эксперимента (общие понятия, принципы). Виды параметров оптимизации, обобщенный параметр оптимизации, функция желательности. Выбор типа математической полиномиальной или иной модели.
Методика математически планируемого эксперимента заключается в том, чтобы по возможности сократить до минимума количество опытов и получить при этом адекватные результаты с получением эффективного уравнения регрессии с целью дальнейшего прогнозирования и управления технологическим процессом. Путем применения технологии крутого восхождения (метода Бокса-Уилсона) возможно рассчитать отимальные (экстремальные) значения функции отклика (параметра оптимизации) в области изменчивости факторного пространства.
Параметр оптимизации – это синоним понятий зависимая случайная величина, функция отклика, функция цели, критерий оптимальности, критерий эффективности.
Параметры оптимизации можно разделить на экономические, достижение наилучших значений которых может быть конечной целью процесса планирования эксперимента, а также на технико-технологические, которые в совокупности обусловливают уровень качества продукции.
Примеры локальных экономических параметров оптимизации – прибыль, рентабельность, срок окупаемости капитальных вложений, минимизация затрат, обеспечение высокого качества продукции и т.д. Зачастую достижению одного параметра оптимизации мешают другие параметры оптимизации. В связи с этим решение оптимизационных задач в условиях активных окружающих противоречий является весьма сложной процедурой.
К технико-технологическим параметрам оптимизации можно отнести одно- и много параметрические варианты.
Очень важно выбрать параметр оптимизации. При этом существенную роль играет уровень априорных сведеий об объекте исследований. Чем больше исследователю известно, тем лучше будет выбор параметра оптимизации. В процессе исследования можно прийти к выводу, что следует поменять выбранный параметр оптимизации на другой.
При низком уровне априорной информации учитывают порядок параметра информации. На этом этапе применяются ранговые оценки параметра оптимизации. Для этого используют или экспертов и их мнение или проводят серию предварительных опытов с перебором разных параметров оптимизации и вычисления наиболее эффективного. В ряде случаев имеются технические трудности в осуществлении экспериментов, например при измерении факторов процесса. Иногда используют поэтому косвенные параметры оптимизации, которые легко измерить.
Эффективным способом является поиск обобщенного параметра оптимизации.
Путь к единому параметру оптимизации часто лежит через обобщение. Как уже говорилось, из многих откликов, определяющих объект, очень часто трудно выбрать один, самый важный. Поэтому необходимо множество откликов обобщать (свертывать) в единый количественный признак.
С таким обобщением связан ряд трудностей. Каждый отклик имеет свой физический смысл и свою размерность. Чтобы объединить различные отклики, прежде всего приходятся ввести для каждого из них некоторую безразмерную шкалу. Шкала должна быть однотипной для всех объединяемых откликов — это делает их сравнимыми. Выбор шкалы — не простая задача, зависящая от априорных сведений об откликах, а также от той точности, с которой мы хотим определить обобщенный признак.
После того как для каждого отклика построена безразмерная шкала, возникает следующая трудность — выбор правила комбинирования исходных частных откликов в обобщенный показатель. Единого правила не существует. Здесь можно идти различными путями, и выбор пути неформализован. Рассмотрим несколько различных способов построения обобщейного показателя.
Простейшие способы построения обобщенного отклика.
Пусть исследуемый объект характеризуют n частных откликов Yu (u =1,2, . . ., n) и каждый из этих откликов измеряется в N опытах. Тогда Yui— это значение u-го отклика в i-м опыте (i = 1,2, . . ., N). Каждый из откликов Yu имеет свой физический смысл и, чаще всего, разную размерность. Введем простейшее преобразование: набор данных для каждого Yu поставим в соответствие, с самым простым стандартным аналогом — шкалой, на которой имеется только два значения: 0 — брак, неудовлетво- рительное качество, 1 — годный продукт, удовлетворительное качество. Преобразованные значения обозначим так: Yui: преобразованное значение u-uо отклика в i-м опыте. Здесь мы применили шкалу, в которой использовано числовое множество из двух элементов (в данном случае 0 и 1). Стандартизовав таким образом шкалу частных откликов, мы подошли ко второму этапу — их обобщению. По какому же правилу следует комбинировать частные отклики?
Будем рассуждать следующим образом. В ситуации, когда каждый преобразованный частный отклик принимает только два значения 0 и 1, естественно желать, чтобы и обобщенный отклик принимал одно из этих двух возможных значений, причем так, чтобы значение 1 имело место, если, и только если, все частные отклики в этом опыте приняли значение 1. А если хотя бы один из откликов обратился в 0, то и обобщенный отклик будет нулем.
При таких рассуждениях для построения обобщенного отклика удобно воспользоваться формулой Yi = (ПN=1N)1/n, где Yi — обобщенный отклик в i опыте; ПN=1N - произведение частных откликов у1, у2.. . уN.
Корень мы ввели для того, чтобы связать эту формулу с другой, более сложной, которая будет рассмотрена далее. В данном же случае ничего не изменится, если написать Yi = ПN=1N
Совершенно очевидно, что такой подход слишком груб и жёсток.
Функция желательности
Одним из наиболее удобных способов построения обобщенного отклика является обобщенная функция желательности Харрингтона. В основе построения этой обобщенной функции лежит идея преобразования натуральных значений частных откликов в безразмерную шкалу желательности или предпочтительности. Шкала желательности относится к психофизическим шкалам. Ее назначение — установление соответствия между физическими и психологическими параметрами. Здесь под физи- ческими параметрами понимаются всевозможные отклики, характеризующие функционирование исследуемого объекта. Среди них могут быть эстетические и даже статистические параметры, а под психологическими параметрами понимаются чисто субъективные оценки экспериментатора желательности (предпочтительности) того или иного значения отклика. Чтобы получить шкалу желательности, удобно пользоваться готовыми разработанными таблицами соответствий между отношениями предпочтения в эмпирической и числовой (психологической) системах (см. табл.).
Таблица 1
Стандартные отметки на шкале желательности
Желательность
Отметки на шкале
желательности
Очень хорошо
Хорошо
Удовлетворительно
Плохо
Очень плохо
1,00-0,80
0,80-0,63
0,63-0,37
0,37-0,20
0,20—0,00
Значение частного отклика, переведенное в безразмерную шкалу желательности, обозначается через du (u = 1, 2, . . ., n) и называется частной желательностью (от desirable фр. — желательный). Шкала желательности имеет интервал от нуля до единицы. Значение du=0 соответствует абсолютно неприемлемому уровню данного свойства, а значение du = l — самому лучшему значению свойства. Понятию «очень хорошо» соответствуют значения на шкале желательности 1 > du > 0,8, а понятию «очень плохо» — 0 < du < 0,2 и т. д. Выбор отметок на шкале желательности 0,63 и 0,37 объясняется удобством вычислений: 0,63 ≈ 1 – (1/е), 0,37 ≈ 1/е . Значение du = 0,37 обычно соответствует границе допустимых значений.
Эти числа на первый взгляд напоминают черную магию. Но все объясняется достаточно просто. В табл. 1 представлены числа, соответствующие некоторым точкам кривой (рис. 4), которая задается уравнением d = e-e-y или d=exp[-exp(-y)], где ехр — принятое обозначение экспоненты. На оси ординат нанесены значения желательности, изменяющиеся от 0 до 1.
Рис. 4. Функция желательности – стр. 37 – Адлер Ю.П. и др. Планирование эксперимента при поиске оптимальных условий. 1976.
По оси абсцисс указаны значения отклика, записанные в условном масштабе. За начало отсчета 0 по этой оси выбрано значение, соответствующее, желательности 0,37. Выбор именно данной точки связан с тем, что она является точкой перегиба кривой, что в свою- очередь создает определенные удобства при вычислениях. То же самое верно для значения желательности, соответствующего 0,63. Выбор этой кривой не является единственной возможностью. Однако она возникла в результате наблюдений за реальными решениями экспериментаторов и обладает такими полезными свойствами как непрерывность, монотонность и гладкость. Кроме того, эта кривая хорошо передает тот факт, что в областях желательностей, близких к 0 и 1, «чувствительность» ее существенно ниже, чем в средней зоне.
Симметрично относительно нуля на оси у' (у' — кодированная шкала) расположены кодированные значения отклика. Значение на кодированной шкале принято выбирать от 3 до 6.
Например, на рис. 4 использовано шесть интервалов в сторону убывания и шесть в сторону возрастания. Ниже вы познакомитесь со случаем, когда выбрано три интервала. Выбор числа интервалов определяет крутизну кривой в средней зоне.
Кривую желательности обычно используют как номограмму, поскольку это легко и оперативно. Так, если в ситуации (I) получен выход 63 %, то ему будет соответствовать желательность 0,9, что показано пунктиром на рисунке. На практике такой простой прием часто оказывается вполне достаточным, но не всегда. Во-первых, потому что точность графического определения желательности может оказаться недостаточной, а, во-вторых, потому что эта точность зависит от положения на шкале у.
Тогда приходится прибегать к аналитическому методу определения желательности и с помощью шкалы у' и приведенного выше уравнения находить оценки желательности.
При наличии только одного отклика границы этого отклика заданы естественно: от 0 до 100%. Однако, это не всегда бывает так. Стоит включить в рассмотрение отклики, характеризующие, например, качество материала, и границы станут весьма неопределенными.
Естественно возникает вопрос, на, каком основании устанавливаются границы допустимых значений для частных откликов. При этом нужно иметь в виду, что ограничения могут быть односторонними в виде уu ≤ уmax или уu ≥ уmin и двусторонними в виде ymin ≤ yu ≤ уmax. Здесь возможны две ситуации. Первая, самая благоприятная, возможна, если экспериментатор располагает инструкцией, в которой четко сформулированы требования ко всем частным откликам, т. е. имеется спецификация с одним или двумя ограничивающими пределами. Тогда отметка на шкале желательности du = 0,37 соответствует ymin, если имеется одностороннее ограничение уu ≥ уmin или ymax для уu ≤ уmax. В случае двустороннего ограничения этой отметке ставится в соответствие и ymin, и уmax. Во второй ситуации спецификация отсутствует, тогда ограничения на шкале и другие отметки делаются весьма субъективно, на основании опыта и интуиции экспериментатора. Совершенно очевидно, что в таком случае довольно опасно руководствоваться мнением одного-единственного исследователя, а желательно учесть мнения нескольких специалистов. При обобще- нии ряда мнений и установлении степени согласованности между различными специалистами можно воспользоваться методом ранговой корреляции.
Преобразование частных откликов в частные функции желательности
Представим себе такой случай, когда существует спецификация с одним или двумя ограничивающими пределами и эти пределы являются единственными значениями качества. Тогда вне пределов du= 0, а внутри пределов du= 1.
Пусть ymin - нижний предел спецификации и уu ≥ уmin .
При таком одностороннем ограничении частная функция желательности будет иметь вид
1. du = 0, если уu ˂ уmin и du = 1, если уu ≥ уmin;
Аналогично для двустороннего ограничения получаем:
2. du = 0, если уu ˂ уmin - уu ˃ уmax и du = 1, если ymin ≤ yu ≤ уmax.
Нетрудно видеть, что шкала желательности выродилась в простейшую шкалу классификаций с двумя классами эквивалентности. Эти два случая показаны на рис. 5. Но такое положение, когда ограничивающие пределы спецификации являются единственными критериями качества, встречается довольно редко, так как трудно разделить результаты твердой границей на две категории: годен, не годен. Поэтому преобразования частных откликов в их стандартные аналоги на шкале желательности осуществляются по более сложным законам. Примером такого более сложного преобразования служит таблица желательности (табл. 1) и соответствующая ей функция желательности.
При односторонних ограничениях уu ˂ уmin или уu ≥ уmin на рис. 6 представлена частная функция желательности для свойства, ограниченного с одной стороны. К чис-
Рис. 5. Задание частной функции желательности
о — одностороннее ограничение; б — двустороннее ограничение
лу свойств, подчиняющихся одностороннему ограничению, относятся очень многие характеристики качества материалов: те плостойкость, прочность, ударная вязкость, морозостойкость, модуль упругости, относительное удлинение при разрыве и т. д. Для всех этих показателей ограничение имело вид уu ≥ уmin.
Другой вид одностороннего ограничения yu ≤ уmax характерен для таких показателей, как содержание различных вредных примесей, влажность, удельный вес, содержание дорогих или дефицитных компонентов и т. п.
Для двустороннего ограничения ymin ≤ yu ≤ уmax пример функции желательности показан на рис. 7. Случай двустороннего ограничения встречается не так часто, как одностороннего, и он более сложен для оценки откликов. Примерами могут служить молекулярный вес материалов, предназначенных для переработки литьем или экструзией, насыпной вес и вес утряски, индекс расплава и т. п. Индекс расплава, например, является важной характеристикой литьевых и экструзионных типов полиметилметакрилата. Слишком низкий индекс наблюдается у материалов с недостаточной текучестью, что отрицательно влияет на ход технологического процесса при переработке полимера. При высоком показателе индекса расплава возникают затруднения во время формования материала.
Рис. 6. Функция желательности для свойства, ограниченного с одной сто-
роны
Рис. 7. Функция желательности для свойства, ограниченного с двух сторон
Шкала желательности есть попытка формализации представлений экспериментатора о важности тех или других значений частных откликов. Нет никакой гарантии, что такие представления можно считать правильными. Особенно, если не существует спецификации: В тех случаях, когда шкала желательности создается сов- местно экспериментатором и консультантом по планированию эксперимента, можно представить себе и такую ситуацию, когда не было между ними достаточно глубокого взаимопонимания и шкала получилась неудачной. Тогда нужно учесть все недостатки и построить другую шкалу, более точно отражающую предпочтительность значений откликов.
Обобщенная функция желательности
После того, как выбрана шкала желательности и частные отклики преобразованы в частные функции желательности, можно приступить к основной задаче — построению обобщенного показателя D, названного Харрингтоном обобщенной функцией желательности. Обобщать, то есть переходить от du к D, предлагается по формуле
D = [Пu=1n(du)]1/n, где Пu=1n – символ произведения значений du при изменении u от 1 до n, 1/n – показатель корня n-степени из произведений du.
Здесь обобщенная функция желательности задается как среднее геометрическое частных желательностей. Такое представление можно рассматривать как удобную модель психологической реакции исследователя, которая возникает при решении определенного класса задач. Примером может служить установление пригодности материала с данным набором свойств для использования его в заданных условиях.
Если хотя бы один частный отклик, входящий в комплекс параметров качества материала, не удовлетворяет требованиям спецификации (например, при определенной температуре материал становится хрупким и разрушается), то как бы ни были хороши прочие свойства, этот материал не может быть использован по назначению
Рис. 8. Шкала желательности нового полимерного материала
Действительно, способ задания обобщенной функции желательности таков, что если хотя бы одна частная желательность du = 0, то обобщенная функция тоже будет равна нулю, с другой сторны D=l тогда и только тогда, когда все du =1 (u = 1, 2, … ., n). Обобщенная функция желательности весьма чувствительна к малым значениям частных желательностей. Можно представить себе другие задачи, когда столь жесткие свойства обобщенного критерия окажутся неприемлемыми. Тогда нужно перейти к другим способам обобщения. А пока вернемся к функции желательности.
Способ задания базовых отметок шкалы желательности, представленный в табл. 1, один и тот же как для частных желательностей, так и для обобщенной. Так, если d1, d2, . . ., dn = 0,63, то и D =0,63, если d1, d2, . . ., dn = 0,37, то и D =0,37 и т. п. В обобщенную функцию желательности могут входить самые разнообразные частные отклики: технологические, технико-экономические, экономические, эстетические и т. п.
На рис. 8 представлена шкала желательности нового полимерного материала.
Мы рассмотрели самый простой способ получения обобщенного критерия — графический. Но часто приходится прибегать к аналитической зависимости, особенно при систематических исследованиях одного и того же объекта. Тогда можно использовать полиномы невысоких степеней, обычно первой или второй степени. Проверка пригодности того или иного полинома является специальной статистической задачей.
Располагая информацией о y'i, мы можем рассчитать di по формуле.
di = exp[-exp(- y')]
Для получения кодированных значений y'i взяты три равномерных интервала, т. е. выбран код: —3, —2, —1, 0, +1, +2, +3. Кодированные значения откликов относятся к верхней границе интервала.
Такой код можно поставить в соответствие абсциссе однажды построенной кривой. Если требуется регулировать ее крутизну, то это можно сделать изменением числа интервалов. Чтобы приспособить такую стандартную кривую к реальным частным откликам, достаточно дополнить табл. 1 следующей информацией:
di y'I y1 y2 y3 y4 y5 y6 y7
1,00-0,80 3,0 300 7 -30 80 300 330 100
0,80-0,63 1,5 200 10 -25 90 250 280 80
0,63-0,37 0,85 120 15 -20 105 220 250 60
0,37-0,20 0.00 100 20 -18 120 200 200 25
0,20-0,00 -0,50 95 40 -15 130 150 150 20
Обобщенная функция желательности является некоторым абстрактным построением и поэтому, прежде чем рекомендовать ее в качестве единого критерия оптимизации, представлялось интересным исследовать такие ее важные свойства, как адекватность, статистическая чувствительность и эффективность. Оказалось, что для шкал желательности статистическая чувствительность и эффективнвсть частных и обобщенной функций желательности не ниже, чем таковые для любого технологического показателя, им соответствующего.
Обобщенная функция желательности является количественным, однозначным, единым и универсальным показателем качества исследуемого объекта, и если добавить еще такие свойства, как адекватность, эффективность и статистическая чувствительность, то становится ясным, что ее можно использовать в качестве критерия оптимизации.
Обобщенная функция желательности нашла широкое применение для оценки качества полимерных материалов, резиновых и латексных изделий, а также при разработке различных рецептур. Используется она в последнее время также и в промышленности.
Выбор модели
Под моделью понимается вид функции отклика:
у = f (x1, x2,…, xk).
Выбрать модель — значит выбрать вид этой функции, записать ее уравнение. Тогда останется спланировать и провести эксперимент для оценки численных значений констант (коэффициентов) этого уравнения. Но как выбрать модель?
Чтобы постепенно продвигаться к ответу на этот вопрос, давайте сначала построим геометрический аналог функции отклика — поверхность отклика. Будем для наглядности рассматривать случай с двумя факторами.
Заметим, что в случае многих факторов геометрическая наглядность теряется. Мы попадаем в абстрактное многомерное пространство, где у нас нет навыка ориентирования. Приходится переходить на язык алгебры. Тем не менее простые примеры, которые мы сейчас рассмотрим, помогут вам, как мы думаем, при работе с многими факторами.
Мы хотим изобразить геометрически возможные состояния «черного ящика» с двумя входами. Для этого достаточно располагать плоскостью с обычной декартовой системой координат. По одной оси координат будем откладывать в некотором масштабе значения (уровни) одного фактора, а по другой оси — второго. Тогда каждому состоядию «ящика» будет соответствовать точка на плоскости.
Но, как вы помните из предыдущей главы, для факторов существуют области определения. Это значит, что у каждого фактора есть минимальное и максимальное возможные значения, между которыми он может изменяться либо непрерывно, либо дискретно. Если факторы совместимы, то границы образуют на плоскости некоторый прямоугольник, внутри которого лежат точки, соответствующие Состояниям «черного ящика». Пунктирными линиями на рис. 9 обозначены границы областей определения каждого из факторов, а сплошными — границы их совместной области определения.
Чтобы указать значение паратетра оптимизации, требуется еще одна ось координат. Если ее построить, то поверхность отклика будет выглядеть так, как на рис.10. Пространство, в котором строится поверхность отклика, мы будем называть факторным пространством. Оно задается координатными осями, по которым откладываются значения факторов и параметра оптимизации. Иногда под факторным пространством понимается пространство, образованное только осями факторов. Раз-
Рис. 9. Область определения факторов
мерность факторного пространства зависит от числа факторов. При многих факторах поверхность опушка уже нельзя изобразить наглядно и приходится ограничиваться только алгебраическим языком.
Но для двух факторов можно даже не переходить к трехмерному пространству, а ограничиться плоскостью. Для этого достаточно произвести сечение поверхности отклика плоскостями, параллельными плоскости X1ОX2, и полученные в сечениях линии спроектировать на эту плоскость. Так строят, например, изображения гор и морских впадин на географических картах (рис. 11).
Рис. 10. Поверхность отклика
Точка М на рисунке - это и есть та оптимальная точка, которую мы ищем. Каждая линия соответствует постоянному значению параметра оптимизации. Такая линия называется линией равного отклика. Существует соответствие между состоянием «ящика» и значением параметра оптимизации: каждому возможному состоянию «ящика» соответствует одно значение параметра оптимизации. Однако обратное
Рис. 11. Проекция сечений поверхности отклика на плоскость
неверно: одному возможному значению параметра оптимизации может соответствовать и одно, и несколько; и сколько угодно состояний «ящиков».
Правда, эти утверждения справедливы, если не учитывать ошибок в определении значений параметра оптимизации. К вопросу об оценке и учете этих ошибок мы вернемся ниже, а пока не будем принимать их во внимание.
Теперь, когда мы можем представить себе поверхность отклика, пора вернуться к основному вопросу: как ставить эксперимент, чтобы найти оптимум при минимуме затрат? Это прежде всего вопрос стратегии.
Если бы мы располагали таблицей, в которой содержались бы все возможные состояния объекта и соответствующие им отклики, то особой необходимости в построении математической модели не было бы. Просто мы бы выбрали то (или те) состояние, которое соответствует наилучшему отклику. Но мы уже знаем, сколь велик
перебор возможных состояний, и должны отказагься от практической реализации этой возможности.
Другая возможность — случайный выбор некоторого числа состояний и определение откликов в них, в надежде, что среди этих состояний попадутся оптимальное или по крайней мере близкие к нему состояния. Мы не будем рассматривать эту интересную возможность, так как, к сожалению, она не вписывается
в нашу тему.
Наконец, третья возможность — строить математическую модель, чтобы с ее помощью предсказывать значения откликов в тех состояниях, которые не изучались экспериментально. Если не можем измерить отклик в каждом состоянии, то сумеем хоть предсказывать результат. Причем даже не в каждом состоянии, а только в наиболее интересных, в тех, которые приближают нас к оптимуму.
Такая стратегия приводит нас к шаговому принципу, лежащему в основе рассматриваемого метода планирования эксперимента.
Шаговый принцип
За отказ от полного перебора состояний надо чем-то платить. Цена — это предположения, которые мы должны сделать относительно свойств неизвестной нам модели до начала эксперимента (как говорят, априори).
Некоторые из предположений мы никогда не сможем проветрить. Такие предположения называются постулатами. Если в действительности они не выполняются, то весьма возможно, что мы не найдем оптимум. Точнее, мы примем за оптимум то, что на самом деле им не является (хотя, быть может, нас и удовлетворит).
Какие же предположения о свойствах поверхности отклика мы делаем? Главное — это непрерывность поверхности, ее гладкость и наличие единственного оптимума (быть может, и на границе области определения факторов).
Эти постулаты позволяют представить изучаемую функцию в виде степенного ряда в окрестности любой возможной точки факторного пространства (такие функции в математике называются аналитическими). Кроме того, если мы придумаем какой-то
способ постепенного приближения к оптимальной точке, нужно, чтобы результат не зависел от исходной точки. Если оптимум один, то неважно, приближаемся мы к нему справа или слева, а если их несколько, да они еще неравноценны.
Рис. 12. Примеры функций отклика для одного фактора
На рис. 12 приведены две картинки, изображающие функции отклика для одного фактора. На рис. 12, а показан благоприятный случай. На рис. 12, б — много нарушений. Здесь и два экстремума (оптимума) и пик (нарушение гладкости и непрерывности).
Если в поисках оптимума мы начнем последовательно двигаться слева направо, то найдем наименьший из максимумов и вряд ли узнаем о существовании второго, наибольшего. Правда, он так локализован и остер, что его не мудрено пропустить и
при движении с правого конца, если ставить опыты не во всех точках.
Возможно, вы обратили внимание на то, что требование непрерывности не согласуется с представлением о дискретных уровнях факторов. Однако в действительности это не страшно. Мы ведь можем считать, что фактор принимает непрерывный ряд значений (если даже некоторые значения не имеют смысла или физически нереализуемы). Важно только помнить о таком соглашении при использовании результатов. А для построения математической модели это создает значительные удобства.
Так как мы заранее считаем, что предпосылки выполняются, то надо максимально использовать возможности, которые при этом открываются.
Если, например, мы будем знать значения параметра оптимизации в нескольких соседних точках факторного пространства, мы сможем (в силу гладкости и непрерывности функции отклика) представить себе результаты, которые можно ожидать в других соседних точках. Следовательно, можно найти такие точки, для которых ожидается наибольшее увеличение (или уменьшение, если мы ищем минимум) параметра оптимизации. Тогда ясно, что следующий эксперимент надо переносить именно в эти точки. Надо продвигаться в этом направлении, пренебрегая остальными. (Вот где экономятся опыты!) Сделав новый эксперимент, снова можно оценить направление, в котором скорее всего следует двигаться. В силу единственности оптимума мы, таким образом, рано или поздно непременно его достигнем. Это и есть шаговый принцип.
Сделаем некоторые пояснения. Мы выбираем в факторном пространстве какую-то точку и рассматриваем множество точек в ее окрестности, т. е. выбираем в области определения факторов малую подобласть. Здесь мы хотим провести эксперимент, на
основании которого должна быть построена первая модель. Эту модель мы намерены использовать для предсказания результатов опытов в тех точках, которые не входили в эксперимент. Если эти точки лежат внутри нашей подобласти, то такое предсказание
называется интерполяцией, а если вне — экстраполяцией. Чем дальше от облаети эксперимента лежит точка, для которой мы хотим предсказать результат, тем с меньшей уверенностью это можно делать. Поэтому мы вынуждены экстраполировать недалеко и использовать результаты экстраполяции для выбора условий проведения
Рис. 13. Два способа поиска оптимума
следующего эксперимента. Дальше цикл повторяется.
Попутно полученную модель можно использовать для проверки различных гипотез о механизме изучаемого явления или о его отдельных сторонах. Например, если вы предполагаете, что увеличение значения некоторого фактора должно приводить к увеличению значения параметра оптимизации, то с помощью модели можно узнать, так ли это. Такая проверка называется интерпретацией модели.
На рис. 13 изображены два варианта поиска оптимума для одной и той же поверхности. Крестиками на рисунке обозначены условия опытов. В случае а использован подход, который иногда называют классическим (метод Гаусса—Зейделя). Он состоит в том, что сначала последовательно изменяются значения одного
фактора. (На рисунке этот эксперимент обозначен 1). Затем находится и фиксируется наилучшее значение этого фактора. В этих условиях последовательно изменяются значения второго фактора (2) и т. д. (если больше факторов).
В случае б представлен простейший вариант шаговой процедуры. Сначала изучается локальная область 1), затем определяется наиболее интересное направление и в этом направлении ставятся следующие опыты 2).
Оказалось (см. рис. 13), что в обоих случаях достигнут одинаковый результат при одинаковом суммарном количестве опытов.
Как вы думаете, всегда ли эти две процедуры эквивалентны?
Что нам требуется? Выяснить, нет ли нарушений наших предпосылок. Легче всего установить, сколько оптимумов (экстремумов) имеет изображенная функция. Если экстремумов больше одного, то уже нарушена предпосылка. Кроме того, существенно, нет ли каких-нибудь нарушений гладкости и непрерывности функции (например, пиков).
Дело в том, что эффективность зависит от вида поверхности, а также от того, в какой последовательности перебираются факторы в случае а и из окрестностей какой точки начат эксперимент в случае б.
Попробуйте вместо окружностей, которые задают линии равных откликов, нарисовать эллипсы, главные оси которых составляют некоторый острый угол с осями координат. Вы увидите, что эффективность процедур окажется различной.
Вот иллюстрация, которая сразу показывает правильность вашего ответа (рис. 14). Это, разумеется, только иллюстрация. В жизни не всегда удается за один цикл достигнуть оптимума.
Рис. 14. Два способа поиска оптимума
Рис. 15. График логарифмической функции
Но несомненно, что по крайней мере в отношении результата процедура б, т. е. шаговый метод, в среднем эффективнее, чем процедура а. Можно придумать и более конкурентноспособные процедуры, чем а, но они обычно требуют значительно больше
опытов.
Теперь займемся выбором модели для первого эксперимента более конкретно.
Как выбрать модель?
Модели бывают разные. Моделей бывает много. Чтобы выбрать одну из них, надо понять, что мы хотим от модели, какие требования мы к ней предъявляем. Теперь мы, пожалуй, сможем сформулировать эти требования.
Исходя из выбранной стратегии, ясно, что главное требование к модели — это способность предсказывать направление дальнейших опытов, причем предсказывать с требуемой точностью. Так как до получения модели мы не знаем, какое направление нам понадобится, то естественно требовать, чтобы точность предсказания во всех возможных направлениях была одинакова.
Это значит, что в некоторой подобласти, в которую входят и координаты выполненных опытов, предсказанное с помощью модели значение отклика не должно отличаться от фактического больше чем на некоторую заранее заданную величину. Модель, которая удовлетворяет такому или какому-либо аналогичному требованию, называется адекватной. Проверка выполнимости этого требования называется проверкой адекватности модели. Разработаны специальные статистические методы, с помощью которых проверяется адекватность.
Если несколько различных моделей отвечают нужным требованиям, то следует предпочесть ту из них, которая является самой простой.
На рис. 15 изображена логарифмическая функция. На некотором отрезке [хmin, xmax] она с удовлетворительной точностью описывается двумя уравнениями:
y = logbx, (1)
у = bх. (2)
В уравнении (2) b — коэффициент, который мы можем оценить, например, по результатам эксперимента. Какое из уравнений, (1) или (2), по вашему мнению, проще?
Простота — вещь относительная. Если вы заранее не сформулируете точно, что называется простым, а что сложным, то невозможно произвести выбор. Вот почему на наш вопрос не было никакого другого ответа, кроме «не зпаю».
При прочих равных условиях следует предпочитать степенные ряды. Точнее, отрезки степенных рядов — алгебраические полиномы. При таком соглашении можно сказать, что уравнение (2) проще, чем уравнение (1).
Фактически произведен выбор класса моделей. Когда это возможно, следует искать модель среди полиномов. Построение полинома возможно в окрестностях любой точки факторного пространства, поскольку мы предположили, что функция является аналитической.
Выбрать — значит сравнить. А как сравнить между собой классы моделей, если свойства объекта заранее неизвестны? Остается предполагать, что нам будут редко встречаться задачи, в которых исходные постулаты окажутся существенно неверными.
Если это так, то мы действительно выбрали наиболее простой, удобный и математически разработанный класс моделей.
Возможно, что кто-то заранее выбрал для нашей задачи конкретную модель. Тогда тоже возникает необходимость в планировании эксперимента для оценки ее коэффициентов. Но мы не будем рассматривать задачи этого типа.
Давайте выпишем полиномы для случая двух факторов. Они будут различаться по максимальным степеням входящих в них переменных.
Полином нулевой степени: у = bо.
Полином первой степени: у = b0 + b1x1 +b2x2.
Полином второй степени: у = b0 + b1x1 + b2x2 + b12x1x2 + b11x12 + b22x22.
Полином третьей степени:
у = b0 + b1x1 + b2x2 + b12x1x2 + b11x12 + b22x22 + b112x12x2 + b122x1x22 + b111x13 + b222x23
Полиномиальные модели
Итак, мы представили '"неизвестную нам функцию отклика полиномом. Операция замены одной функции другой, в каком-то смысле эквивалентной функцией называется аппроксимацией. Значит, мы аппроксимировали неизвестную функцию полиномом.
Но полиномы бывают разных степеней. Какой, взять на первом шаге?
Эксперимент нужен только для того, чтобы найти численные значения коэффициентов полинома. Поэтому чем больше коэффициентов, тем больше опытов окажется необходимым. А мы стремимся сократить их число. Значит, надо найти такой полином, который содержит как можно меньше коэффициентов, но удовлетворяет требованиям, предъявленным к модели. Чем ниже степень полинома при заданном числе факторов, тем меньше в нем коэффициентов.
Мы хотим, чтобы модель хорошо предсказывала направление наискорейшего улучшения параметра оптимизации. Такое направление называется направлением градиента. Ясно, что движений в этом направлении приведет к успеху быстрее, чем
движение в любом другом направлении (это значит, что будет достигнута экономия числа опытов).
Как вы думаете, можно ли в этой связи всегда использовать полином первой степени?
С одной стороны, он содержит информацию о направлении градиента, с другой — в нем минимально возможное число коэффициентов при данном числе факторов. Единственное опасение в том, что неясно, будет ли линейная модель всегда адекватной. Ответ зависит еще и от объекта.
Вопрос в том, как выбрать подобласть в факторном пространстве, чтобы линейная модель оказалась адекватной. Условие аналитичности функции отклика гарантирует нам эту возможность. Всегда существует такая окрестность любой точки (точнее, почти любой точки), в которой линейная модель адекватна. Размер такой области заранее не известен, но адекватность, как вы помните, можно проверять по результатам эксперимента. Значит, выбрав сначала произвольную подобласть, мы, рано или поздно, найдем ее требуемые размеры. И как только это случится, воспользуемся движением по градиенту.
На следующем этапе мы будем искать линейную модель уже в другой подобласти. Цикл повторяется до тех пор, пока движение по градиенту не перестанет давать эффект. Это значит, что мы попали в область, близкую к оптимуму. Такая область называется «почти стационарной». Здесь линейная модель уже не нужна. Либо попаданием в почти стационарную область задача решена (случай, рассматриваемый в этой книге), либо надо переходить к полиномам более высоких степеней, например второй степени, чтобы подробнее описать область оптимума.
Удачный выбор подобласти имеет, как вы видите, большое значение для успеха всей работы. Он связан с интуитивными решениями, которые принимает экспериментатор на каждом этапе.
Кроме задачи оптимизации, иногда возникает задача построения интерполяционной модели. В этом случае нас не интересует оптимум. Просто мы хотим предсказывать результат с требуемой точностью во всех точках некоторой заранее заданной области. Тут не приходится выбирать подобласть. Необходимо последовательно увеличивать степень полинома до тех пор, пока модель не окажется адекватной. Если адекватной оказывается линейная, или неполная квадратная модель (без членов, содержащих квадраты факторов), то ее построение аналогично тому, что требуется для оптимизации. Поэтому мы попутно будем рассматривать и эту задачу.
Контрольные вопросы
1. Общие понятия, принципы планирования эксперимента.
2. Параметр оптимизации.
3. Обобщенный параметр оптимизации.
4. Функция желательности.
5. Преобразование частных откликов в частные функции желательности
6. Обобщенная функция желательности.
7. Выбор математической модели.
8. Область определения факторов.
9. Пошаговый принцип.
10. Два пути нахождения оптимума.
11. Полиноминальные модели.
ЛЕКЦИЯ 5
Полный и дробный факторный эксперимент. Правила построения планов для ПФЭ и ДФЭ. Риски при использовании планов с дробными репликами – влияние на точность прогнозирова-ния функции отклика. Типы планов эксперимента – дву- и трех факторные планы типа N = mk (N – необходимое количество опытов, m – количество уровней варьирования случайных фак-торов, k – количество факторов)
Постановка задачи полного факторного эксперимента (ПФЭ) и его частного случая – дробного факторного эксперимента (ДФЭ) заключается в определении правильного составления плана эксперимента. При этом при ПФЭ количество необходимых опытов определяют по формуле:
N = mk (1),
где n – число уровней варьирования факторов (случайных независимых переменных), k – количество факторов.
Уровни варьирования факторов на практике принимают в двух вариантах – первый вариант принимает два уровня, когда факторы варьируют в значениях Xmin и Xmax, второй вариант – три уровня Xmin, Xmax и Xср. При этом в ПФЭ выбирают все возможные сочетания вариантов, которые и расчитывают по указанной формуле (1). Вследствие вышеуказанного количество опытов существенно возрастает с увеличением количества уровней варьирования факторов и факторов. В табл. 2 представлено число опытов для ПФЭ типа 2k.
Таблица 2
k
2
3
4
5
6
7
8
9
10
11
12
13
14
15
N
4
8
16
32
64
128
256
512
1024
2048
4096
8192
16324
32768
Как видно из табл. 2, начиная с количества факторов 4 и выше количество опытов делает применение ПФЭ фактически невозможным из-за необоснованного потери времени и трудоемкости проведения опытов, увеличения стоимости экспериментов.
Выходом из сложившейся ситуации находят в применении ДФЭ, при котором можно резко сократить количество опытов. За это, однако, приходится платить снижением точности получаемого регрессионного уровнения. При этом возрастает во много раз ценность и стоимость априорной информации о параметрах оптимизации (функции отклика) и факторах. То есть необходимо установить значимость факторов, степень их влияния на функцию отклика и подобрать план (матрицу) математического дробного эксперимента таким образом, чтобы снизить риск потери точности регрессии.
Закономерности формирования планов (матриц) ПФЭ
План эксперимента (ПФЭ) представляет собой составление таблицы, в которой перебраны все варианты (сочетания) осуществления экспериментов на разных уровнях варьирования факторов. При этом весьма удобно использовать не натуральные значения факторов на разных значениях их варьирования, а их кодированные значения, вычисляемые по следущей зависимости:
Xj = (Xnj – X0j)/I,
где Xj — кодированное значение фактора, Хnj - натуральное значение фактора, X0j — натуральное значение основного уровня, I — интервал варьирования – I = max-min, j — номер фактора.
Для качественных факторов, имеющих два уровня, один уровень обозначается +1, а другой - 1.
Пример составления плана эксперимента типа 2k при k = 2 и k = 3, то есть при количестве опытов 2 и 8 соответственно.
План 22 План 23
ПО – параметр оптимизации
(функция отклика)
Свойства плана (матрица) полного факторного эксперимента типа 2k
Два свойства следуют непосредственно из построения матрицы.
1. Первое из них - симметричность относительно центра эксперимента — формулируется следующим, образом:
- алгебраическая сумма элементов вектор-столбца каждого фактора равна нулю, или Σ(от i=1 до N) Xij = 0, где i – номер опыта, N— число опытов, j – номер фактора (j = 1, 2,…, k).
2. Второе свойство — так называемое условие нормировки - формулируется следующим образом: сумма квадратов элементов каждого столбца равна числу опытов, или Σ(Xij)2 = N. Это следствие того, что значения факторов в матрице задаются + 1 и —1.
3. Сумма почленных произведений любых двух вектор-столбцов матрицы равна нулю, или ΣXjiXui = 0, j ≠ u; j, u = 1, 2,…, k. Это важное свойство называется ортогональностью матрицы планирования.
4. Четвертое свойство называется ротатабельностью, т. е. точки в матрице планирования подбираются так, чтобы точность предсказания значений параметра оптимизации была одинакова на равных расстояниях от центра эксперимента и не зависила бы от направления.
После построения матрицы эксперимента при выполнении всех свойств этих планов эксперимента, указанных выше, и получив результаты функции отклика (Yi) в каждом опыте, можно перейти к расчету коэффициентов уравнения – свободного члена
(b0) и коэффициентов (bi) при Xi.
b0 = (ΣYi)/N;
bi = (ΣXijYj)/N;
Для плана 23 расчет коэффициентов регрессионного уравнения по исходной матрице планируемого эксперимента (см. выше) будет производится по следующим зависимостям:
b0 = (Y1 + Y2 + Y3 + Y4 + Y5 + Y6 + Y7 + Y8)/8
b1 = (-X11Y11 - X12Y12 + X13Y13 + X14Y14 – X15Y15 -X16Y16 + X17Y17 + X18Y18)/8
b2 = (-X21Y11 + X22Y12 - X23Y13 + X24Y14 – X25Y15 + X26Y16 - X27Y17 + X28Y18)/8
b3 = (X31Y11 – X32Y12 – X33Y13 + X34Y14 – X35Y15 + X36Y16 + X37Y17 – X38Y18)/8,
где нижние индексы X и Y представляют следущее – 1-ый индекс- номер переменой, 2-ой – номер опыта; X35 означает третий X в пятом опыте и т.п.
Ортогональность матрицы планирования позволяет получить независимые друг от друга оценки коэффициентов. Это означает, что величина любого коэффициента не зависит от того, какие величины имеют другие коэффициенты.
Однако сформулированные выше утверждения справедливы лишь в том случае, если модель включает только линейные эффекты и эффекты взаимодействия. Эффект взаимодействия – это произведение факторов, которые имеют значимые корреляционные связи типа bijXiXj, а коэффициент и произведение освобождает Xi и Xj от их взаимного влияния. Между тем существенными могут оказаться коэффициенты при квадратах факторов, их кубах и т. п. Так, для случая существенных квадратичных членов в двухфакторном эксперименте модель можно записать так:
у = b0 + b1x1 + b2x2 + b12x1x2 + b11x12 + b22x22.
Какую информацию о квадратичных членах можно извлечь из полного факторного эксперимента?
Попытка построения вектор-столбцов для х12 и х22 приводит к получению единичных столбцов, совпадающих друг с другом и со столбцом х0. Так как эти столбцы неразличимы, то нельзя сказать за счет чего получилась величина bо. Она включает значение свободного члена и вклады квадратичных членов. В этом случае говорят, что имеет место смешанная оценка. Это символически записывается следующим образом:
b0 = β0 + Σ(от j до k)βjj,
где b0 — вычисленный нами коэффициент, а греческими буквами, как принято в статистике, обозначены неизвестные истинные значения свободного члена (β0) и квадратичных коэффициентов (βjj). Если бы мы сделали сколь угодно много опытов, то в пределе получили бы истинные значения коэффициентов. На практике реализуются лишь малые выборки, по которым вычисляются оценки истинных коэффициентов.
По отношению к квадратичной модели для двух факторов получается такая система смешивания:
b0 = β0 + Σ(от j до k)βjj b2 → β2 b1 → β1 b12 → β12
Следовательно, оценки всех коэффициентов, кроме bо, не смешаны.
Число опытов в полном факторном эксперименте превышает число коэффициентов линейной модели, причем тем больше, чем больше факторов. Разность между числом опытов и числом коэффициентов во многих случаях оказывается очень велика, и возникает естественное желание сократить число необходимых опытов.
Контрольные вопросы
1. Общие понятия о полном факторном эксперименте (ПФЭ).
2. Общие понятия о дробном факторном эксперименте (ДФЭ).
3. Построения планов экспериментов.
4. Свойства плаов (матриц) ПФЭ.
5. Алгоритм расчета коэффициентов регрессионных уравнений.
6. Выбор типа математической модели.
ЛЕКЦИЯ 6
Дробный факторный эксперимент (ДФЭ)
Количество опытов в полном факторном эксперименте значительно превосхо-дит число определяемых коэффициентов линейной модели. Другими словами, полный факторный, эксперимент обладает большой избыточностью опытов. Было бы заманчивым сократить их число за счет той информации, которая не очень существенна при построении линейных моделей. При этом нужно стремиться к тому, чтобы матрица планирования не лишилась своих оптимальных свойств. Сделать это не так просто, но все же возможно. Итак начнем поиск путей минимизации числа опытов.
Начнем с самого простого — полного факторного эксперимента 22. Напишем еще раз эту хорошо нам известную матрицу (табл. 3).
Таблица 3
Полный факторный эксперимент 22
Пользуясь таким планированием, можно вычислить четыре коэффициента и представить результаты эксперимента в виде неполного квадратного уравнения:
Y = b0 + b1X1 + b2X2 + b12X1X2
Если имеются основания считать, что в выбранных интервалах варьирования процесс может быть описан линейной моделью, то достаточно определить три коэффициента bо, b1 и b2. Остается одна степень свободы. Употребим ее для минимизации числа опытов. При линейном приближении b12 → 0 и вектор-столбец X1X2 можно использовать для нового фактора X3. Поставим этот фактор в скобках над взаимодействием X1X2 и посмотрим, каковы будут оценки коэффициентов. Здесь уже не будет тех раздельных оценок, которые мы имели в полном факторном эксперименте 2k. Оценки смешаются следующим образом:
b1 → β1 + β23; b2 → β2 + β13; b3 → β3 + β12.
Но нас это не должно огорчать. Ведь мы постулируем линейную модель, и, следовательно, все парные взаимодействия незначимы. Главное, мы нашли средство минимизировать число опытов: вместо восьми опытов для изучения трех факторов оказывается можно поставить четыре! При этом матрица планирования не теряет своих оптимальных свойств (ортогональность, ротатабельность и т. п.), в чем вы можете самостоятельно убедиться. Найденное правило можно сформулировать так: чтобы сократить число опытов, нужно новому фактору присвоить вектор-столбец матрицы, принадлежащий взаимодействию, которым можно пренебречь. Тогда значение нового фактора в условиях опытов определяется знаками этого столбца.
Посмотрите, пожалуйства, на три матрицы, приведенные ниже. Эти матрицы предлагаются взамен полного факторного эксперимента 23, требующего, как вы знаете, восьми опытов. Каким бы из них вы воспользовались?
Матрица 1 Матрица 2
Матрица 3
Проверим свойства матрицы № 1. Каждый вектор-столбец матрицы, кроме первого, содержит равное число +1 и —1. Это означает, что выполняется условие:
Σ(от 1 до 4)Xji = 0.
Теперь перемножим каждую пару вектор-столбцов и посмотрим, будет или сумма произведений равна 0. К сожалению,
Σ(от 1 до 4)X2iX3i = - 4, т. е. совершена какая-то ошибка в выборе матрицы. Постараемся ее найти. Вектор-столбцы для X1 и X2 не вызывают сомнения. Ведь эта часть матрицы — полный факторный эксперимент 22. А как построен вектор-столбец для X3? Элементы этого столбца обратны по знаку элементам соседнего столбца X2. Два этих столбца оказались взаимосвязанными: Х3 = - Х2. При этом b3 → β3 – β2 и β2 - β3. В таком планировании не могут быть раздельно оценены основные эффекты. Значит, мы потеряли информацию о двух линейных коэффициентах нашей модели. Таким планированием воспользоваться невозможно.
Матрица № 2 содержит всего три опыта. Три опыта недостаточны для оценки четырех коэффициентов: b0, b1, b2 и b3. Кроме того, ни одно из свойств, присущих полному факторному эксперименту, здесь не выполняется, за исключением нормировки.
Матрица № 3 сохраняет все свойства полного факторного эксперимента. Она дает возможность оценить свободный член bо и три коэффициента при линейных членах, потому что для Х3 использован вектор-столбец Х1Х2 полного факторного эксперимента 22.
Если мы в дополнение к столбцам матрицы № 3 вычислим еще столбцы для произведений Х1Х3 и Х2Х3, то увидим, что элементы столбца Х1Х3 совпадут с элементами столбца Х2, а элементы столбца Х2Х3 - с элементами столбца X1. Найденные нами коэффициенты будут оценками для совместных эффектов:
b1 → β1 + β23; b2 → β2 + β13; b3 → β3 + β12.
Такое планирование нас вполне устраивает. Мы смешали эффекты взаимодействия с основными эффектами. (Но все основные эффекты оцениваются раздельно друг от друга!) Так как постулируется линейная модель, то предполагается, что эффекты взаимодействия близки к нулю, и поэтому b1 ≈ β1; b2 ≈ β2; b3 ≈ β3.
Мы рассмотрели самый простой случай: матрицу из четырех опытов для трехфакторного планирования. С увеличением числа факторов вопрос о минимизации числа опытов превращается в довольно сложную задачу. Рассмотрим ее детально. При этом нам не обойтись без новых определений и понятий.
Дробная реплика
Поставив четыре опыта для оценки влияния трех трех факторов, мы воспользовались половиной полного факторного эксперимента 23, или «полурепликой». Если бы мы X3 приравняли к (–)X1X2, то получили бы вторую половину матрицы 23. В этом случае: b1 → β1 - β23; b2 → β2 - β13; b3 → β3 - β12. При реализации обеих полуреплик можно получить раздельные оценки для линейных эффектов и эффектов взаимодействия, как и в полном факторном эксперименте 23.
Объединение этих двух полуреплик и есть полный факторный эксперимент 23.
Матрица из восьми опытов для четырехфакторного планирования будет полурепликой от полного факторного эксперимента 24, а для пятифакторного планирования — четверть-репликой от 25.
В последнем случае два линейных эффекта приравниваются к эффектам взаимодействия. Для обозначения дробных реплик, в которых р линейных эффектов приравнены к эффектам взаимодействия, удобно пользоваться условным обозначением 2k-p. Так, полуреплика от 26 запишется в виде 26-1, а четверть-реплика от 25 - в виде 25-2.
Таблица 4
Условия обозначения дробных реплик и число опытов
Коли-
чество
опытов
Дробная реплика
Условное обозначение
Количество опытов
Для дробного эксперимента
Для полного факторного эксперимента
3
½ реплика от 23
23-1
4
8
4
½ реплика от 24
24-1
8
16
5
¼ реплика от 25
25-2
8
32
6
1/8 реплика от 26
26-3
8
64
7
1/16 реплика от 27
27-4
8
128
5
1/2 реплика от 25
25-1
16
32
6
¼ реплика 26
26-2
16
64
7
1/8 реплика 27
27-3
16
128
8
1/16 реплика 28
28-4
16
256
9
1/32 реплика от 29
29-5
16
512
10
1/64 реплика от 210
210-6
16
1024
11
1/128 реплика от 211
211-7
16
2048
12
1/256 реплика от 212
212-8
16
4096
13
1/512 реплика от 213
213-9
16
8192
14
1/1024 реплика от 214
214-10
16
16384
15
1/2048 реплика от 215
215-11
16
32768
Условные обозначения дробных реплик и количество опытов приведены в табл. 4.
Выбор полуреплик. Генерирующие соотношений и определяющие контрасты
При построении полуреплики 23-1 существует всего две возможности: приравнять X3 к +X1X2 или к (-)X1X2. Поэтому есть только две полуреплики 23-1 (табл. 5).
Таблица 5
Две полуреплики 23-1
Для произведения трех столбцов матрицы I выполняется соотношение: + l = X1X2X3, а матрицы II: -1 = X1X2X3. Вы видите, что все знаки столбцов произведений одинаковы и в цервом случае равны плюс единице, а во втором — минус единице.
Символическое обозначение произведения столбцов, равного +1 или -1, называется определяющим контрастом. Контраст помогает определять смешанные эффекты. Для того чтобы определить, какой эффект смешан с данным, нужно помножить обе части определяющего контраста на столбец, соответствующий данному эффекту. Так, если l = X1X2X3, то для Х1 имеем:
Х1 = X12X2X3 = X2X3, так как всегда Хi2 = 1.
Аналогично для Х2 находим
X2 = X1X22X3 = X1X3,
для X3 - X3 = X1X2X32 = X1X2.
Это значит, что коэффициенты линейного уравнения будут оценками
b1 → β1 + β23; b2 → β2 + β13; b3 → β3 + β12.
Соотношение, показывающее, с каким из эффектов смешан данный эффект, называется генерирующим соотношением.
Полуреплики, в которых основные эффекты смешаны с двухфакторными взаимодействиями, носят название планов с разрешающей способностью III (по наибольшему числу факторов в определяющем контрасте). Такие планы принято обозначать: 23-1III.
При выборе полуреплики 24-1 возможно восемь решений:
1). X4 = X1X2 ; 4). X4 = - X2X3; 7). X4 = X1X2X3;
2). X4 = -X1X2; 5). X4 = X1X3; 8). X4 = - X1X2X3.
3). X4 = X2X3; 6). X4 = - X1X3;
Разрешающая способность этих полуреплик различна. Так, реплики 1 - 6 имеют по три фактора в определяющем контрасте, а 7—8 по четыре. Реплики 7 и 8 имеют максимальную разрешающую способность и называются главными. Разрешающая способность задается системой смешивания данной реплики. Она будет максимальной, если линейные эффекты смешаны с эффектами взаимодействия наибольшего возможного порядка.
При отсутствии априорной информации об эффектах взаимодействия экспериментатор стремится выбрать реплику с наибольшей разрешающей способностью, так как тройные взаимодействия обычно менее важны, чем парные. Если существует информация об эффектах взаимодействия, то она должна использоваться при выборе реплики.
Реплики, в которых нет ни одного главного эффекта, смешанного с другим главным эффектом или парным взаимодействием, а все парные взаимодействия смешаны друг с другом, носят название планов с разрешающей способностью IV (по наибольшему числу факторов в определяющем контрасте). Они имеют обозначение
24-1IV. Полуреплика, заданная определяющим контрастом +1 = X1X2X3X4, имеет только четные комбинации букв в каждой строке. Ее можно записать следующим образом, считая строку (1) четной:
(1), ad, bd, ab, ас, cd, bc, abcd.
А полуреплика, заданная 1 = - X1X2X3X4, имеет только нечетные комбинации
а, b, с, d, abd, acd, abc, bcd.
Такие полуреплики называют главными полурепликами, так как они обладают наибольшей разрешающей способностью.
Пусть выбраны полуреплики, заданные определяющими контрастами l = +/-X1X2X3X4. Совместные оценки здесь определяются соотношениями:
X1 = +/- X2X3X4; X1X2 = +/- X3X4;
X2 = +/- X1X3X4; X1X3 = +/- X2X4;
X3 = +/- X1X2X4; X1X4 = +/- X2X3.
X4 = +/- X1X2X3;
Такой тип смешивания даст возможность оценивать линейные эффекты совместно с эффектами взаимодействий второго порядка, а взаимодействия первого порядка — совместно друг с другом.
Если полуреплики заданы генерирующими соотношениями X4 = +/- X1X2, то в этом случае определяющими контрастами являются 1 = +/- X1X2X4, следовательно, мы получаем планы с разрешающей способностью III и некоторые основные эффекты cмешиваем с парными взаимодействиями:
X1 = +/- X2X4; X1X3 = +/- X2X3X4;
X2 = +/- X1X4; X2X3 = +/- X1X3X4;
X3 = +/- X1X2X3X4; X3X4 = +/- X1X2X3.
X4 = +/- X1X2;
Разрешающая способность этих полуреплик ниже, чем у планов с разрешающей способностью IV, с помощью которых линейные эффекты определяются независимо от парных взаимодействий.
Эти полуреплики имеют в каждой строке как четные, так и нечетные комбинации букв. Такие полуреплики не являются главными. Разумен выбор такой полуреплики, если имеется априорная информация о большей значимости тройных взаимодействий по сравнению с парными или о незначимости трех парных взаимодействий X2X4, X1X4, X1X2.
Как видите, выбор дробной реплики требует много терпенья и труда. Но другого пути нет. Применяя дробное планирование, нужно точно знать систему смешивания, четко представлять, какую информацию приходится терять.
Полуреплика 2 5-1
При выборе полуреплики 25-1 в распоряжении экспериментатора имеется множество вариантов. Так, X5 можно приравнять к одному из шести парных взаимодействий. В этом случае получим полуреплику с разрешающей способностью III. Очевидно, это будет не лучший выбор полуреплики. Далее, X5 можно приравнять к одному из четырех тройных взаимодействий. Тогда получим план с разрешающей способностью IV, и все линейные эффекты будут смешаны с тройными взаимодействиями. И, наконец, полуреплика может быть задана генерирующими соотношениями X5 = +/- X1X2X3X4. Определяющими контрастами в этом случав будут 1 = +/- X1X2X3X4X5. Такие реплики носят название планов с разрешающей способностью V и обозначаются 25-1V.
Пусть имеется пять факторов и для них нужно выбрать полуреплику с наибольшей разрешающей способностью.
Для полуреплики, заданной генерирующим соотношением X5 = X1X3X4, 1 = X1X3X4X5, следовательно,
b1 = β1 + β345; b14 = β14 + β35; b35 = β35 + β14;
b2 = β2 + β12345; b15 = β15 + β34; b45 = β45 + β13;
b3 = β3 + β145; b23 = β23 + β1245; b123 = β123 + β245;
b4 = β4 + β135; b24 = β24 + β1235; b124 = β124 + β235;
b5 = β5 + β134; b25 = β25 + β1234; b125 = β125 + β234;
b12 = β12 + β2345; b34 = β34 + β15; b134 = β134 + β5 и т.д.;
b13 = β13 + β45;
Смешивание основных эффектов с тройными взаимодействиями, когда существуют эффекты взаимодействия более высокого порядка, нельзя признать наилучшим, если нет специальных соображений.
Если выбрана полуреплика, заданная генерирующим соотношением X5 = X1X2X3X4 и, следовательно, определяющим контрастом l = X1X2X3X4X5, то коэффициенты определяют такие смешанные оценки:
b1 = β1 + β2345; b5 = β5 + β1234; b14 = β14 + β235;
b2 = β2 + β1345; b12 = β12 + β345; b15 = β15 + β234;
b3 = β3 + β1245; b13 = β13 + β245; b23 = β23 + β145 и т.д.
b4 = β4 + β1235;
Получили полуреплику с разрешающей способностью V. В таких планах линейные эффекты смешаны со взаимодействиями третьего порядка, а взаимодействия первого порядка — с взаимодействиями второго порядка. Эта полуреплика имеет преимущества по сравнению с ранее рассмотренной репликой.
Возможны двадцать два решения при выборе плана 25-1:
1) X5 = X1X2; 9) X5 = X2X4; 16) X5 = - X1X3X4;
2) X5 = - X1X2; 10) X5 = - X2X4; 17) X5 = X1X2X4;
3) X5 = X1X3; 11) X5 = X3X4; 18) X5 = - X1X2X4;
4) X5 = X1X4; 12) X5 = - X3X4; 19) X5 = X2X3X4;
5) X5 = X1X4; 13) X5 = X1X2X3; 20) X5 = - X2X3X4;
6) X5 = -X1X4; 14) X5 = - X1X2X3; 21) X5 = X1X2X3X4;
7) X5 = X2X3; 15) X5 = X1X3X4; 22) X5 = - X1X2X3X4;
8) X5 = - X2X3;
Мы не станем рассматривать выбор полуреплик 26-1, 27-1 и т. д. Такими полурепликами редко пользуются на практике.
Ведь полуреплика 26-1 требует 32 опыта, а для экспериментатора выгодны планы 26-2 или 26-3, требующие соответственно 16 и 8 опытов. Поэтому с ростом числа факторов возрастает дробность применяемых реплик.
Заметим, что при построении главных полуреплик в определяющий контраст надо включать наибольшее число факторов.
Выбор 1/4-реплик. Обобщающий определяющий контраст
C увеличением дробности не только возрастают усилия, но и уменьшается число опытов. А ради этого стоит потрудиться и тщательно разобраться в выборе 1/4-реплик.
При исследовании влияния пяти факторов можно поставить не 16 опытов, как в предыдущем примере, а только 8, т. е. воспользоваться репликой 25-2. Здесь возможны двенадцать решений, если X4 приравнять парному взаимодействию, а X5 — тройному:
1) X4 = X1X2 и X5 = X1X2X3;
2) X4 = X1X2 и X5 = -X1X2X3;
3) X4 = -X1X2 и X5 = X1X2X3;
4) X4 = -X1X2 и X5 = -X1X2X3;
5) X4 = X11X3 и X5 = X1X2X3;
6) X4 = X1X3 и X5 = -X1X2X3;
7) X4 = -X1X3 и X5 = X1X2X3;
8) X4 = -X1X3 и X5 = -X1X2X3;
9) X4 = X2X3 и X5 = X1X2X3;
10) X4 = X2X3 и X5 = -X1X2X3;
11) X4 = -X2X3 и X5 = X1X2X3;
12) X4 = -X2X3 и X5 = -X1X2X3
Допустим, выбран пятый вариант: X4 = X1X3 и X5 = X1. Тогда определяющими контрастами являются: l = X1X3X4 и 1 = X1X2X3X5.
Если перемножить эти определяющие контрасты, то получится третье соотношение, задающее элементы столбца 1=X2X4X5. Чтобы полностью охарактеризовать разрешающую способность реплики, необходимо записать обобщающий определяющий контраст 1 = X1X3X4 = X2X4X5 = X1X2X3X5.
Система смешивания определяется умножением обобщающего определяющего контраста последовательно на X1, X2, X3 и т.д.
X1 = X3X4 = X1X2X4X5 = X2X3X5,
X2 = X1X2X3X4 = X4X5 = X1X3X5,
X3 = X1X4 = X2X3X4X5 = X1X2X5,
X4 = X1X3 = X2X5 = X1X2X3X4X5,
X5 = X1X3X4X5 = X2X4 = X1X2X3,
X1X2 = X2X3X4 = X1X4X5 = X3X5,
X1X5 = X3X4X5 = X1X2X4 = X2X3.
Получается довольно сложная система смешивания линейных эффектов с эффектами взаимодействия первого, второго, третьего и четвертого порядков. Если, например, коэффициенты b12 = β12 + β234 + β145 + β35 и b15 = β15 + β345 + β124 + β23 от нуля, то возникают сомнения, можно ли пренебрегать другими парными взаимодействиями, с которыми смешаны линейные эффекты. Тогда следует поставить вторую серию опытов, выбрав нужным образом другую 1/4-реплику.
При этом можно воспользоваться методом «перевала». Смысл этого метода заключается в том, что вторая четверть-реплика получается из первой путем изменения всех знаков матрицы на обратные. Тогда в обобщающем определяющем контрасте тройные произведения имеют знак, противоположный их знаку в первой четверть-реплике. Тройные произведения определяют парные взаимодействия в совместных оценках для линейных эффектов. Усредняя результаты обеих четверть-реплик, можно получить линейные эффекты, не смешанные с парными взаимодействиями.
Вероятно, что дополнение первой 1/4-реплики второй не приведет к улучшению ситуации, а, напротив, осложняет ее, так как линейные эффекты смешиваются с двумя парными взаимодействиями и уничтожают тройные взаимодействия.
Таким образом, для дополнения 1/4-реплики до 1/2-реплики, если есть подозрения, что эффекты взаимодействия деляют парные взаимодействия в совместных оценках для линейных эффектов.
Однако можно представить себе и такой случай, когда целесообразно освободить линейные эффекты от эффектов взаимодействия второго порядка и только часть из линейных эффектов (например, b2 и b5) от парных взаимодействий. Тогда нужно выбрать 1/4-реплику таким образом, чтобы в обобщающем определяющем контрасте произведение четырех членов имело отрицательный знак, так как это произведение определяет тройные взаимодействия в совместных оценках для линейных эффектов.
Реплики большой дробности
При выборе 1/8-реплики 26-3 можно воспользоваться вектор-столбцами трех взаимодействий, например, так:
1) X4 = X1X2, X5 = X1X3, X6 = X2X3;
2) X4 = X1X3, X5 = X2X3, X6 = X1X2X3;
3) X4 = X1X2, X5 = X2X3, X6 = X1X2X3;
4) X4 = X1X2, X5 = X1X3, X6 = X1X2X3.
Для каждого из этих решений можно сделать шесть перестановок.
Итого получается 24 возможности выбора 1/8-реплики. Это при условии, что мы всюду выбираем положительные генерирующие соотношения.
Из четырех приведенных выше решений наименее удачно первое, поскольку все линейные эффекты смешиваются с парными взаимодействиями.
Если априорно известно, что из всех взаимодействий наиболее существенно X1X2, то нужно выбрать второе решение, если X1X3 – третье, X2X3 – четвертое.
Допустим, мы избрали четвертое решение, предполагая, что из факторов X4, X5, X6 наиболее существенным является X4. Приравняем X4 тройному взаимодействию и запишем генерирующие соотношения
X4 =X1X2X3, X5 = X1X2, X6 = X1X3.
Ограничимся парными и тройными взаимодействиями.
Для 1/8-реплики с генерирующими соотношениями
X4 =X1X2X3, X5 = X1X2, X6 = X1X3.
имеем следующие определяющие контрасты:
1 = X1X2X3X4, 1 = X1X2X5, 1 = X1X3X6.
Если попарно перемножить эти определяющие контрасты, то получим
1 = X3X4X5, 1 = X2X4X6, 1 = X2X3X5X6.
Произведение трех определяющих контрастов равно
1 = X1X4X5X6.
Чтобы полностью охарактеризовать разрешающую способность данной 1/8-реплики, запишем обобщающий определяющий контраст
1 = X1X2X3X4 = X1X2X5 = X1X3X6 = X3X4X5 = X2X4X6 = X2X3X5X6 = X1X4X5X6.
Получается следующая система смешивания:
b1 = β1 + β25 + β36 + β234 + β456;
b2 = β2 + β15 + β46 + β134 + β356 ;
b3 = β3 + β16 + β45 + β124 + β256;
b4 = β4 + β35 + β26 + β123 + β156;
b5 = β5 + β12 + β34 + β236 + β146;
b6 = β6 + β13 + β24 + β235 + β145.
Контрольные вопросы
1. Дробный факторный эксперимент (ДФЭ).
2. Оценка коэффициентов уравнений.
3. Принципы сокращения количества опытоа.
4. Понятия о дробных репликах.
5. Выбор полуреплик из различных планов ПФЭ.
6. Генерирующее соотношение.
7. Определяющий контраст.
8. Выбор ¼ полуреплик из различных планов ПФЭ.
9. Обобщающий определяющий контраст.
10. Реплики большей дробности.
ЛЕКЦИЯ 7
Коэффициент конкордации (коэффициент согласия) при экспертной оценке влияния факторов на функцию отклика (параметр оптимизации)
Перед проведением эксперимента необходимо установить влияние факторов на функцию отклика и выбрать те факторы, которые могут оказать какое-либо влияние на нее. Зачастую при таком выборе экспериментаторы пытаются ограничить количество факторов, опасаясь, что их окажется очень много, что скажется на трудоемкости эксперимента и точности результатов. Однако, следует выбрать как можно большее количество факторов, а затем провести их оценку значимости на функцию отклика. Для этого можно применять несколько методов, в том числе, корреляционный анализ, установление физического смысла влияния того или иного фактора в увеличение (+) или уменьшение (-) на функцию отклика.
Одним из существенных эффективных методов отсеивания незначимых факторов является экспертный, заключающийся в том, что экспериментатор выбирает несколько (7-10) известных специалистов в исследуемой области и собирает у них мнение о факторов. Каждый и экспертов должен расположить факторы по степени их влияния на функцию отклика, наиболее значимому присваивается место 1, затем 2 и т.д. до окончания предлагаемого набора факторов. Таким образом, наиболее значимым фактором будет тот, который имеет наименьшее значение средневзвешанного места. Кроме этого простейшего оценочного приема в статистике применяется и строгий подсчет значимости факторов после их оценки экспертами – это расчет коэффициента конкордации (коэффициента согласия) и применение диаграмм Парето. Такую процедуру иногда называют ранжированием факторов от присвоения каждому фактору каждым экспертом своего номера – ранга.
В качестве примера такого ранжированного подхода приведем данные табл. .
Таблица
Матрица рангов для технологического процесса
Исследо-ватели-эксперты
Факторы
X1
X2
X3
X4
X5
X6
X7
1
1
2
6
4
7
3
5
2
1
2
7
6
3
5
4
3
7
1
6
4
2
5
3
4
3
1
5
6
4
7
2
5
1
2
6
4
5
7
3
Сумма рангов
13
8
30
24
21
27
17
Отклонение рангов от среднего
- 7
- 12
10
4
1
7
- 3
Квадрат отклонений
49
144
100
16
1
49
9
Среднее значение суммы рангов - 20
Из табл. можно сделать вывод о том, что факторы по мере убывания их влияния (значимости) на функцию отклика можно расположить в следущем порядке – X2 – X1 -X7 – X5 – X4 – X6 – X3.
Коэффициент конкордации (согласия) вычисляют по следущей зависимости:
W = 12S/[m2(n3 – n)],
где S – сумма квадратов отклонений, m – количество исследователей-экспертов, n – количество факторов.
Коэффициент конкордации изменяется в пределах от 0 до 1.
Коэффициент конкордации для данных табл. равен 0,526, что больше табличного -0,150, вычисленного с уровнем значимости 0,01 (см. Ю.П. Адлер. Введение в поанирование эксперимента. – М.: Металлургия, 1969. 155 с.). Поэтому можно сделать вывод о том, что существует неслучайная согласованность во мнениях 5 экспертов. При этом можно построить кривую средней априорной диаграммы рангов, которая, по сути своей, представляет обратную диаграмму Паррето (рис. 16).
На практике возможно применение экспертного опроса со значительно большим количеством экспертов и факторов. При этом интересен случай, когда экспертами являются представители разных научных и технологических школ. В этом случае эффективность его весьма существенна. Если исследователь не может выбрать предпочтение между двумя факторами, то такому фактору присваивается дробный балл-ранг, например – 2,5. В таком случае коэффициент конкордации вычмсляют по следующей зависимости:
W = S/[ 0,5m2(n3-n) – mΣiTi], где Ti = (1/12) Σ(tj3 - tj), где j – количество одинаковых рангов в i-ом ранжировании.
а
б
Рис. 16. Диаграммы Парето (а), априорная диаграмма рангов (б)
Контрольные вопросы
1. Понятие об экспертной оценке значимости факторов.
2. Методы расчета коэффициента конкордации (согласия) в разных условиях экспертной оценки.
3. Сравнение расчетного и табличного значений коэфффициента конкордации. Формирование выводов об эффективности экспертной оценки.
4. Априорная диаграмма рангов.
ЛЕКЦИЯ 8
Введение в решение по поиску оптимального экстремального
параметра оптимизации в области определения функции двух и
многофакторных уравнений (метод крутого восхождения Бокса-Уилсона и др.)
Каждая функция в области существования (определения) семейства факторов имеет некую поверхность отклика. В двумерном пространстве – эта поверхность имеет вид плоской кривой, в трехмерном – вид различной поверхности, форма которой соответствует виду уравнения, которую оа описывает. Для многомерных, многофакторных зависимостей вид и форму поверхности отклика можно визуально представить в виде проекций или разрезов этой поверхности на различные координатные плоскости. Поверхность отклика зачастую может иметь достаточно сложную конфигурацию с наличием нескольких экстремальных значений – локальных минимумов и максимумов, координаты которых имеют практический интерес для экспериментатора. Поэтому ниже будут рассмотрены методы нахождения таких экстремумов.
На нем рис. 17 изображены кривые равного выхода поверхности отклика для двух независимых переменных. Они подобны линиям равной высоты на географических картах. Поверхность отклика имеет вид холма с вершиной в точке «О». Если попытаться попасть в окрестность этой точки из точки А с помощью одного из вариантов однофакторного эксперимента, то мы сначала должны стабилизировать первый фактор, например X1, и изменять в направлении АС второй фактор до тех пор, пока увеличивается выход. За точкой С выход падает, и поэтому в ней стабилизируем Х2 и изменяем Х1 в направлении CD по такому же правилу и т. д.
Не кажется ли вам, что путь к вершине довольно извилист? Он становится еще более трудоемким при возрастании числа независимых переменных. Наиболее короткий путь к вершине — направление градиента функции отклика. На рис. 17 это направление АВ, перпендикулярное линиям уровня. Градиент непрерывной однозначной функции φ есть вектор
grad φ = (∂φ/∂x1)i + (∂φ/∂x2)j, …, + (∂φ/∂x1)k;
где gradφ = ▼φ - обозначение градиента, ∂φ/∂xi - частная производная функции по i-му фактору, i, j, к — единичные векторы в направлении координатных осей.
Следовательно, составляющие градиента суть частные производные функции отклика, оценками которых являются, как мы уже говорили, коэффициенты регрессии.
Изменяя независимые переменные пропорционально величинам коэффициентов регрессии, мы будем двигаться в направлении градиента функции отклика по самому крутому пути. Поэтому процедура движения к почти стационарной области называется крутым восхождением.
Величины составляющих градиента определяются формой поверхности отклика и теми решениями, которые были приняты при выборе параметра оптимизации, нулевой точки и интервалов варьирования. Знак составляющих градиента зависит только от формы поверхности отклика и положения нулевой точки (рис. 18).
Пусть интервал варьирования некоторого значимого фактора равен 10 единицам. Как вы считаете, изменится ли составляющая градиента, если в качестве единицы из-
Рис. 17. Движение по поверхности Рис. 18. Зависимость знака гради-
отклика методами однофакторного ента от формы поверхности и
эксперимента и градиента положения нулевой точки
мерения воспользоваться вначале миллиметром, а затем дюймом? Переход от ииллиметров к дюймам эквивалентен значительному увеличению интервала варьирования: 1 дюйм, как известно, равен 25,4 мм.
В первом случае интервал варьирования равнялся 10 мм, а во втором - 254 мм. Такое изменение интервала варьирования не может не иметь последствий для значимого фактора. Сильно увеличится коэффициент регрессии и вместе с ним - составляющая градиента.
В большинстве задач выбор размерности не является проблемой. Этот выбор определяется характером задач, традициями и существующей системой мер и измерительных приборов. Когда размерность фиксирована, то все ясно. Однако важно помнить, что размерность влияет на величины составляющих градиента, а их знаки инвариантны относительно изменения масштабов.
Итак, для данной поверхности отклика выбраны нулевая точка и интервалы варьирования, проведен эксперимент и найдены оценки коэффициентов регрессии. После этого направление градиента задается однозначно и является единственным. При этом предполагается, что имеется только один оптимум.
Теперь займемся расчетом направления градиента.
Расчет крутого восхождения
Технику расчета крутого восхождения удобно рассмотреть на простейшем примере в случае одного фактора (рис. 19). Значение коэффициента регрессии равно тангенсу угла между линией регрессии и осью данного фактора. Если его умножить на интервал варьирования, который является прилежащим катетом в прямоугольном треугольнике ОАВ, то получится противолежащий катет АВ, который и дает координаты точки, лежащей на градиенте.
Обобщение на случай k факторов делается механически, так как все эффекты независимы друг от друга. Существенно только соотношение произведений коэффициентов на соответствующие интервалы. Их абсолютные величины могут все
Рис. 19. Расчет координат точек в направлении градиента
одновременно умножаться или делиться на любое положительное число. При этом получаются точки, лежащие на том же градиенте, но с другим шагом.
Эта процедура заключается в том, чтобы к нулевому уровню последовательно алгебраически прибавлять величины, пропорциональные составляющим градиента.
Сразу возникает вопрос: а как выбрать шаг движения по градиенту? Это еще один этап, для которого не существует формализованного решения. Небольшой шаг потребует значительного числа опытов при движении к оптимуму, большой шаг величивает вероятность проскока области оптимума. Во всяком случае, аналогично выбору интервалов варьирования, нижняя граница задается возможностью фиксирования двух соседних опытов, а верхняя - областью определения фактора. Для облегчения работы шаги обычно округляют.
На расчет градиента не оказывает влияние bо. Для качественных факторов на двух уровнях либо фиксируется лучший уровень, либо градиент реализуется дважды для каждого уровня в отдельности. Незначимые факторы стабилизируются на любом уровне в интервале +1. Если нет специальных соображений, то выбирают нулевой уровень. Если же по экономическим соображениям, например, выгодно поддерживать нижний уровень, то выбирают его. В движении по градиенту эти факторы не участвуют.
Рассмотрим пример расчета крутого восхождения для процесса ионообменного разделения смеси редкоземельных элементов.
Пример. В табл. 6 приведены условия, матрица планирования и результаты серии опытов, а также расчет крутого восхождения.
Этапы расчета крутого восхождения.
1. Расчет составляющих градиента.
b1I1 = - 1,0; b2I2 = - 4,5.
Теперь мы должны прибавлять составляющие градиента к основному уровню факторов. Берем условия опыта № 5: X1физ. = 0,5, X2физ. = 2,5. В опыте № 6 факторы имеют уже нереальные значения, следовательно, можно сделать вывод, что шаг" движения велик.
2. Воспользуемся условием: умножение составляющих градиента на любое положительное число дает точки, также лежащие на градиенте. В данной задаче удобно изменять X2физ.на 0,5, т. е. уменьшить составляющую градиента в 9 раз. Во столько же раз уменьшается и составляющая градиента до первому фактору (- 0,11). Изменению составляющих градиента соответствует в табл. 6 строка: шаг при изменении X2физ. на 0,5. Наконец, методы анализа позволяют задавать значение X1физ. с точностью до одного знака после запятой, шаг по этому фактору округляется.
3. Последний этап расчета: последовательное прибавление составляющих градиента к основному уровню. Получаем серию опытов крутого восхождения (в табл. 6 — опыты 5-9). Эти опыты часто называют мысленными.
А если бы мы признали разумным изменить фактор X1физ. на - 0,20, то правильно ли рассчитана серия опытов крутого восхождения?
Опыты X1физ. X2физ.
5 1,3 6,0
6 1,1 5,0
7 0,9 4,0
8 0,7 3,0
9 0,5 2,0
Составляющая градиента уменьшилась по первому фактору в 1,0/0,2 = 5 раз. Во столько же раз уменьшилась составляющая градиента по второму фактору 0 = (-4,5/5 = - 0,9], или, округляя эту величину, имеем шаг по второму фактору -1,0. Опыты 5—9 (см. выше) как раз и получены прибавлением X1физ. = - 0,2 и X2физ. = - 1,0 к основным уровням факторов.
Таким образом, расчет сводится к тому, чтобы выбрать шаг движения по одному из факторов и пропорционально произведениям коэффициентов регрессии на интервалы варьирования рассчитать шаги по другим факторам.
Иногда имеет смысл оценить ожидаемые значения параметра оптимизации в мысленных опытах. Проведем расчет для опыта № 7 крутого восхождения (табл. 6). Мы собираемся для оценки параметра оптимизации использовать уравнение регрессии:
Y = 88,0 - 2,0 X1 - 4,5Х2. Однако в табл. 6 приведены натуральные значения факторов, а в уравнении применяются кодированные значения. Поэтому необходимо перевести натуральные значения в кодированные.
Таблица 6
Матрица планирования, результаты и расчет крутого восхождения
Уровень
X1физ.
X2физ.
Основной
1,5
7,0
Интервал варьирования
0,5
1,0
Верхний
2,0
8,0
Ниэний
1,0
6,0
Опыты
Кодированные значения факторов
X1
X2
Y*
1
-
-
95,0
2
+
-
90,0
3
-
+
85,0
4
+
+
82,0
bj
-2,0
-4,5
bjI
-1,0
-4,5
Шаг при изменении X2физ. на 0,5
-0,11
-0,5
Округление
-0,1
-0,5
Опыты
5
1,4
6,5
6
1,3
6,0
7
1,2
5,5
8
1,1
5,0
9
1,0
4,5
* - Среднее значение из двух параллельных опытов.
Кодированные величины получаются с помощью уже известной вам формулы: Хj = (XJфиз. - Xj0 физ.)Ij, Х1 = -6,0, Х2 = - 1,5. Подставляя эти значения в уравнение регрес-сии, получим Y7расч. = 95,95. Аналогично для опыта № 8 X1 = -0,8; Х2 = -2,0 и Y8расч = 98,6. Экспериментально полученные значения могут не совпадать с расчетными: величины независимых переменных выходят за область эксперимента.
Рассмотрим еще один пример по расчету крутого восхождения с четырьмя факторами.
Таблица 7
Матрица планирования, результаты опытов н крутое восхождение
Уровень
Факторы
X1физ.
X2физ.
X3физ.
X4физ.
Основной
3,0
30
1,5
15
Интервал варьирования
2,0
10
1,0
10
Верхний
5,0
40
2,5
25
Нижний
1,0
20
0,5
5
Опыты
Кодированные значения факторов
Yx102 *
X1
X2
X3
X4
1
-
-
-
-
2,060
2
+
-
+
-
3,400
3
-
-
+
+
3,095
4
-
+
-
+
4,995
5
+
+
-
-
15,150
6
+
-
-
+
9,225
7
-
+
+
-
8,250
8
+
+
+
+
5,995
bj
0,0195
0,0203
-0,0137
-0,0066
bjI
0,039
0,203
-0,0137
-0,066
Шаг при изменении X2физ. на 0,5
0,9605
5
-0,3399
-1,6256
Округление
1,0
5,0
-0,3
-2,0
Опыты
9
4,0
35,0
1,2
13
10
5,0
40,0
0,9
11
11
6,0
45,0
0,6
9
12
7,0
50,0
0,3
7
13
8,0
55,0
5
14
9,0
60,0
-
3
* - Среднее значение из двух параллельных опытов, рандомизированных во времени.
Остались нерассмотренными два момента: как влияют на крутое восхождение соотношения численных значений коэффициентов регрессии и почему движение по градиенту начинается из нулевой точки.
Представим себе, что в адекватном линейном уравнении значим только один коэффициент. Тогда в движении по градиенту будет участвовать только один фактор. Многофакторная задача выродится в однофакторную. А это менее эффективно. Рассмотренный случай является крайним, но в практике довольно часто b-коэффи- циенты существенно различаются между собой, оставаясь значимыми.
Функция, величины коэффициентов которой различаются не существенно, называется симметричной относительно коэффициентов. Движение по градиенту для симметричной функции наиболее эффективно. Удачным выбором интервалов варьирования можно сделать симметричной любую линейную функцию для значимых факторов.
На первом этапе планирования не всегда удается получить симметричную функцию. Если функция резко асимметрична (коэффициенты различаются на порядок), то выгоднее вновь поставить эксперимент, изменив интервалы варьирования, а не двигаться по градиенту. Так, в работе после первой серии опытов получено следующее уравнение регрессии:
Yрасч.103 = 22,48 - l,01X1 +19,46X2 + l,46X3 - l,05X4.
Здесь b2 на порядок превышает остальные коэффициенты, которые статистически незначимы. Это связано скорее с неудачным выбором шпервалов варьирования, чем с отсутствием соответствующих эффектов. Движение по градиенту нецелесообразно. Решение увеличить вдвое интервал варьирования незначимых факто
ров привело к такому результату:
Рис. 20. Движение по градиепту из нулевой и из наилучшей точек плана
Yрасч.103 = 65,5 + 19,5X1 + 20,3X2 – 13,7X3 – 6,6X4.
На этот раз функция оказалась симметричной, и было реализовано крутое восхождение, показанное в табл. 7.
Направление градиента определяется единственным способом, и движение должно начинаться из нулевой точки. На рис. 20 приведена простая геометрическая иллюстрация этого факта.
Хорошо видно, что движение из наилучшей точки плана проходит в стороне от оптимальных условий.
Можно рассуждать иначе. Функция отклика, вид которой нам неизвестен, разлагалась в ряд Тейлора в окрестности нулевой точки. Именно к этой точке и относится оценка градиента.
Контрольные вопросы
1. Принцип поиска оптимальных (экстремальных) значений функции отклика пошаговым методом крутого восхождения Бокса-Уилсона.
2. Движение по градиенту.
3. Расчет крутого восхождения. Три правила.
4. Расчетные – физические и кодированные значения факторов.
5. Получение улучшенных уравнений регрессии.
Список литературы
1. Адлер, Ю.П. Методология и практика планирования эксперимента в России : монография / Ю.П. Адлер, Ю.В. Грановский. — Москва : МИСИС, 2016. — 182 с. — ISBN 978-5-87623-990-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/93686 (дата обращения: 17.12.2019). — Режим доступа: для авториз. пользователей.
2. Адлер, Ю.П. Введение в планирование экспериментом/Ю.П. Адлер. – М.: Металлургия, 1968. 155 с.
3. Адлер, Ю.П. Планирование эксперимента при поиске оптимальных условий/ Ю.П. Адлер, Е.В. Маркова, Ю.В. Грановский. Издание второе переработанное и дополненное. – М.: Наука, 1976. 279 с.
4. Румянцев, М.И. Статистические методы обработки и анализа числовой информации, контроля и управления качеством проката/М.И. Румянцев, С.А. Левандовский, Н.А. Ручинская, К.Е. Черкасов, А.В. Логинов. – Учебное пособие. – Магнитогорск: Изд-во Магнитогорск. гос. техн. ун-та им. Г.И. Носова, 2014. 257 с.