Выбери формат для чтения
Загружаем конспект в формате docx
Это займет всего пару минут! А пока ты можешь прочитать работу в формате Word 👇
Федеральное агентство по образованию
ГОУВПО Тульский государственный университет
Кафедра «ИНСТРУМЕНТАЛЬНЫЕ И МЕТРОЛОГИЧЕСКИЕ СИСТЕМЫ»
И. Э. Аверьянова, к. т. н., доцент каф. ИМС
Э. С. Спиридонов, к. т. н., доцент каф. ИМС
С. И. Соловьев, к. т. н., доцент каф. ИМС
Планирование измерительного эксперимента и обработка результатов измерений
конспект лекций для студентов
направления 200500 «Метрология, стандартизация и сертификация» по специальности 200501 «Метрология и метрологическое обеспечение» (очной формы обучения)
Тула 2005
Авторы конспекта лекций по дисциплине «Планирование измерительного эксперимента и обработка результатов измерений»
Аверьянова Инна Эдуардовна, к. т. н., доцент каф. ИМС
Спиридонов Эдуард Сергеевич, к. т. н., доцент каф. ИМС
Соловьев Сергей Игоревич, к. т. н., доцент каф. ИМС
Кафедра «Инструментальные и метрологические системы»
Телефон 33-25-38
Лекции используются студентами, обучающимися по направлению 200500 «Метрология, стандартизация и сертификация», очной формы обучения по специальности 200501 «Метрология и метрологическое обеспечение» для ВКР, ДП, МД.
Рассмотрены и утверждены на заседании кафедры ИМС
протокол № 12 от 16 мая 2005 г.
Количество файлов 1
Файл, созданный в Microsoft Word
Рассмотрено на заседании кафедры ИМС
протокол № 12 от 16 мая 2005 г.
Зав. каф. ИМС Борискин О. И.
СОДЕРЖАНИЕ
СОДЕРЖАНИЕ 3
Глава первая 5
ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ. 5
Глава вторая 9
ОБОБЩЕННЫЙ ПАРАМЕТР ОПТИМИЗАЦИИ. 9
2.1. Простейшие способы построения обобщенного отклика. 9
2.2. Шкала желательности. 11
2.3. Преобразование частных откликов в частные функции желательности. 14
2.4. Обобщенная функция желательности. 16
Глава третья 18
ФАКТОРЫ. 18
3.1. Определение фактора. 18
3.2. Требования, предъявляемые к факторам при планировании эксперимента. 18
3.3. Требования к совокупности факторов. 19
Глава четвертая. 20
ПОЛНЫЙ ФАКТОРНЫЙ ЭКСПЕРИМЕНТ. 20
4.1. Принятие решений перед планированием эксперимента. 20
4.2. Полный факторный эксперимент типа 2k. 26
4.3. Свойства ПФЭ 2k. 30
4.4. ПФЭ и математическая модель. 31
Глава пятая 36
ДРОБНЫЙ ФАКТОРНЫЙ ЭКСПЕРИМЕНТ. 36
5.1. Минимизация числа опытов. 36
5.2. Дробная реплика. 36
5.3. Выбор полуреплик. Генерирующие соотношения и определяющие контрасты. 37
Глава шестая 39
ПРОВЕДЕНИЕ ЭКСПЕРИМЕНТА. 39
6.1. Анкета для сбора априорной информации. 39
6.2. Ошибки параллельных опытов. 40
6.3. Дисперсия параметра оптимизации. 41
6.4. Проверка однородности дисперсии. 41
6.5. Рандомизация. 42
Глава седьмая 44
ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА. 44
7.1. Метод наименьших квадратов. 44
7.2. Регрессионный анализ. 45
7.3. Проверка адекватности модели. 46
7.4. Проверка значимости коэффициентов. 46
Глава восьмая 48
КРУТОЕ ВОСХОЖДЕНИЕ ПО ПОВЕРХНОСТИ ОТКЛИКА. 48
8.1. Движение по градиенту. 48
8.2. Расчет крутого восхождения. 50
8.3. Реализация мысленных опытов. 52
Глава первая
ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ.
Большинство научных исследований связано с экспериментом. Он проводится в лабораториях, на производстве, на опытных полях и участках, в клиниках и т. д. Эксперимент может быть физическим, психологическим или модельным. Он может непосредственно проводиться на объекте или на его модели. Модель обычно отличается от объекта масштабом, а иногда природой.
Если модель достаточно точно описывает объект, то эксперимент на объекте может быть заменен экспериментом на модели. Последнее время на ряду с физическими моделями все большее распространение получают абстрактные математические модели. Можно получать новые сведения об объекте, экспериментируя на модели, если она достаточно точно описывает объект.
Эксперимент занимает центральное место в науке. Однако возникает вопрос, насколько эффективно он используется. Джон Бернал, например, отмечал, что научные исследования организуются и проводятся настолько хаотично, что их коэффициент полезного действия может быть оценен величиной порядка 2%. Для того, чтобы повысить эффективность исследований, требуется нечто совершенно новое. Одним из возможных путей является применение математических методов, построение математической теории планирования эксперимента.
Планирование эксперимента — это процедура выбора числа и условий проведения опыта, необходимых и достаточных для решения поставленной задачи с требуемой точностью. При этом существенно следующее:
• стремление к минимизации общего числа опытов;
• одновременное варьирование всеми переменными, определяющими процесс по специальным правилам — алгоритмам;
• использование математического аппарата, формализующего многие действия экспериментатора;
• выбор четкой стратегии, позволяющей принимать обоснованные решения после каждой серии экспериментов.
Поиск оптимальных условий, построение интерполяционных формул, выбор существенных факторов, оценка и уточнение констант теоретических моделей, выбор наиболее приемлемых из некоторого множества гипотез о механизме явлений, исследование диаграмм состав свойство — вот примеры задач, при решении которых применяется планирование эксперимента. Можно сказать, что там, где есть эксперимент, имеет место и наука о его проведении — планирование эксперимента.
Поиск оптимальных условий является одной из наиболее распространенных научно-технических задач. Они возникают в тот момент, когда установлена возможность проведения процесса и необходимо найти наилучшие (оптимальные в некотором смысле) условия его реализации.
Выбор оптимального состава многокомпонентных смесей или сплавов, повышение производительности действующих установок, повышение качеств продукции, снижение затрат на ее получение — вот примеры задач оптимизации. Процесс их решения называется процессом оптимизации или просто оптимизацией.
Эксперимент, который ставится для решения задач оптимизации называется экстремальным. Это название связано с глубокой аналогией между оптимизацией и поиском экстремума некоторой функции.
Каждый фактор может принимать в опыте одно из нескольких значений. Такие значения будем называть уровнями.
Фиксированный набор уровней факторов (т. е. установление каждого фактора на некоторый уровень) определяет одно из возможных состояний кибернетической системы.
Планирование эксперимента предполагает активное вмешательство в процесс и возможность выбора в каждом опыте тех уровней факторов, которые представляют интерес.
На практике нет абсолютно управляемых объектов. На реальный объект обычно действуют как управляемые, так и неуправляемые факторы. Неуправляемые факторы влияют на воспроизводимость эксперимента и являются причиной ее нарушения. Если требования воспроизводимости не выполняются, приходится обращаться к активно-пассивному эксперименту.
Планирование экстремального эксперимента — это метод выбора количества и условий проведения опытов, минимально необходимых для отыскания оптимальных условий, т. е. для решения поставленной задачи.
Приступая к знакомству с планированием экстремального эксперимента, надо иметь в виду, что при оптимизации распространен так называемый детерминированный подход, особенно широко используемый в химии.
Можно считать, что основные определения введены, и мы готовы подойти к детальному рассмотрению нашей задачи. Но сначала подведем итог.
В этой главе мы познакомились с основными определениями, которые используются в теории планирования экстремального эксперимента. Прежде чем приступать к эксперименту, необходимо однозначно и непротиворечиво сформулировать его цель и выбрать подходящую количественную характеристику цели, которую мы назвали параметром оптимизации.
Понятие «объект исследования» требует точного формального определения. Для такого определения удалось приспособить кибернетическое понятие «черный ящик» — модель объекта.
Входы «черного ящика» называются факторами. Каждый фактор может принимать некоторое определенное число различных значений, называемых уровнями. Сочетание определенных уровней всех факторов определяет возможное состояние «черного ящика» и условия одного из возможных опытов.
Совокупность всех различных возможных состояний определяет сложность «черного ящика» и общее число различных опытов.
Результаты эксперимента используются для получения математической модели объекта исследования, которая представляет собой уравнение, связывающее параметр оптимизации и факторы. Такое уравнение называется функцией отклика:
.
Использование для получения модели всех возможных опытов приводит к абсурдно большим экспериментам. Задача выбора необходимых для эксперимента опытов, методов математической обработки их результатов и принятия решений — это и есть задача планирования эксперимента.
Глава вторая
ОБОБЩЕННЫЙ ПАРАМЕТР ОПТИМИЗАЦИИ.
Перекликаются звук, запах, форма, цвет, Глубокий, темный смысл обретшие в слиянье.
Ш. Бодлер. Цветы зла.
Путь к единому параметру оптимизации часто лежит через обобщение. Из многих откликов, определяющих объект, очень часто трудно выбрать один, самый важный.
Каждый отклик имеет свой физический смысл и свою размерность. Чтобы объединить различные отклики, прежде всего приходится ввести для каждого из них некоторую безразмерную шкалу. Шкала должна быть однотипной для всех объединяемых откликов — это делает их сравнимыми.
После того как для каждого отклика построена безразмерная шкала, возникает следующая трудность- выбор правила комбинирования исходных частных откликов в обобщенный показатель. Рассмотрим несколько различных способов построения обобщенного показателя.
2.1. Простейшие способы построения обобщенного отклика.
Пусть исследуемый объект характеризует n частных откликов и каждый из этих откликов измеряется в N опытах. Тогда — это значение u-го отклика в i-м опыте . Каждый из откликов имеет свой физический смысл и, чаще всего, разную размерность.
Введем простейшее преобразование: набор данных для каждого поставим в соответствие с самым простым стандартным аналогом — шкалой, на которой имеется только два значения: 0 — брак, 1 — годный продукт. Преобразование значения обозначим так: — преобразованное значение u-го отклика в i-м опыте.
В ситуации, когда каждый преобразованный частный отклик принимает только два значения 0 и 1, естественно желать, чтобы и обобщенный отклик принимал одно из этих двух возможных значений, причем так, чтобы значение 1 имело место, если, и только если, все частные отклики в этом опыте приняли значение 1. А если хотя бы один из откликов обратился в 0, то и обобщенный отклик будет нулем.
При таких рассуждениях для построения обобщенного отклика удобно воспользоваться формулой:
где — обобщенный отклик в i-м опыте;
— произведение частных откликов .
Корень введен для того, чтобы связать эту формулу с другой, более сложной. В данном случае ничего не изменится, если написать
.
Обратим внимание на еще один способ получения обобщенного отклика, который может применяться в тех случаях, когда для каждого из частных откликов известен «ИДЕАЛ», к которому нужно стремиться. Существует много способов введения метрики, задающей «БЛИЗОСТЬ К ИДЕАЛУ». Дополним предыдущие обозначения еще одним: — наилучшее («ИДЕАЛЬНОЕ») значение u-го отклика. Тогда можно рассматривать как некоторую меру близости к «ИДЕАЛУ». Однако использовать разность при построении обобщенного отклика невозможно по двум причинам. Она имеет размерность соответствующего отклика, а у каждого из откликов может быть своя размерность, что препятствует их объединению. Отрицательный или положительный знак разности тоже создает неудобство. Чтобы перейти к безразмерным значениям, достаточно разность поделить на желаемое значение: .
Чтобы нивелировать знаки, можно разность возводить в квадрат. Тогда обобщенный отклик получим по следующей формуле:
.
Если в некотором опыте все частные отклики совпадут с идеалом, то y станет равным нулю. Это и есть то значение, к которому нужно стремиться. Чем ближе к нулю, тем лучше.
Среди недостатков такой оценки выделяется нивелировка, частных откликов. Устранить этот недостаток можно введением некоторого веса а
,
причем и .
Для перехода к более сложным способам нужно научиться фиксировать более тонкие различия на шкале преобразования откликов. Здесь приходится опираться на опыт экспериментатора. Но, чтобы его разумно употребить в рамках формальных процедур, его тоже нужно формализовать. Наиболее естественный путь такой формализации — введение системы предпочтений на множестве значений каждого частного отклика, получение стандартной шкалы и затем обобщение результатов.
Пользуясь системой предпочтений, можно получить более содержательную шкалу вместо шкалы классификации с двумя классами.
2.2. Шкала желательности.
Одним из наиболее удобных способов построения обобщенного отклика является обобщенная функция желательности Харрингтона. В основе построения этой обобщенной функции лежит идея преобразования натуральных значений частных откликов в безразмерную шкалу желательности или предпочтительности. Шкала желательности относится к психофизическим шкалам. Ее назначение — установление соответствия между физическими и психологическими параметрами. Здесь под физическими параметрами понимаются возможные отклики, характеризующие функционирование исследуемого объекта. Чтобы получить шкалу желательности, удобно пользоваться готовыми разработанными таблицами соответствий между отношениями предпочтения в эмпирической и числовой (психологической) схемах (табл. 1)
Таблица 2.1
Желательность
Отметки на шкале желательности
Очень хорошо
Хорошо
Удовлетворительно
Плохо
Очень плохо
1,00 — 0,80
0,80 — 0,63
0,63 — 0,37
0,37 — 0,20
0,20 — 0,00
Значение частного отклика, переведенного в безразмерную шкалу желательности, обозначается через и называется частной желательностью. Она имеет интервал от нуля до единицы. Понятию «очень хорошо» соответствуют значения от , а понятию «очень плохо» — и т. д. Выбор отметок 0,63 и 0,37 объясняется удобством вычислений: , . Значение равно 0.37 соответствует границе допустимых значений.
В табл. 1 представлены числа, соответствующие некоторым точкам кривой (рис. 1), которая задается экспоненциальным уравнением или , где ехр — принятое обозначение экспоненты. На оси ординат нанесены значения желательности, от 0 до 1,0. На оси абсцисс указаны значения отклика. За начала отсчета 0 по этой оси выбрано значение, соответствующее желательности 0,37. Выбор именно данной точки связан с тем, что она является точкой перегиба кривой, что создает удобство при вычислении. То же самое верно и для значения 0,63. Кривая хорошо передает тот факт, что в областях желательностей, близких к 0 и 1,0, «Чувствительность» ее существенно ниже, чем в средней зоне.
Рис. 2.1. Функция желательности.
Симметрично относительно нуля на оси Y' (Y' — кодированная шкала) разложены кодированные значения отклика. Значения на кодированной шкале принято выбирать от 3 до 6 интервалов. Выбор числа интервалов определяет крутизну кривой в средней зоне.
Кривую желательности используют как номограмму, поскольку это легко и оперативно. Так, если получен выход 63%, то ему на рисунке будет соответствовать желательность 0,9. На практике такой простой прием часто оказывается достаточным, но не всегда. Во-первых, потому что точность графического определения желательности может оказаться недостаточной, а, во-вторых, потому что эта точность зависит от положения на шкале у.
На каком же основании устанавливаются границы допустимых значений для частных откликов?
Нужно иметь в виду, что ограничения могут быть односторонними в виде или и двусторонними в виде . Здесь возможны две ситуации. Первая — самая благоприятная, возможна, если экспериментатор располагает инструкцией, в которой четко сформулированы требования ко всем частным откликам. Во второй ситуации спецификация отсутствует, тогда ограничения на шкале и другие отметки делаются весьма субъективно, на основании опыта и интуиции экспериментатора. При обобщении ряда мнений и установлении степени согласованности между различными специалистами можно воспользоваться методом ранговой корреляции.
2.3. Преобразование частных откликов в частные функции желательности.
Представим себе такой случай, когда существует спецификация с одним или двумя ограничивающими пределами и эти пределы являются единственными значениями качества. Тогда вне пределов равно 0, внутри пределов равно 1.
Пусть — нижний предел спецификации и . При таком одностороннем ограничении частная функция желательности будет иметь вид
Аналогично для двустороннего ограничения получаем
Нетрудно видеть, что мы пришли к случаю, рассмотренному в разделе 1: шкала желательности выродилась в простейшую шкалу классификации с двумя классами эквивалентности. Эти два случая показаны на рис. 2. Но такое положение, когда ограничивающие пределы спецификации являются единственными критериями качества, встречаются довольно редко, т. к. трудно разделить результаты твердой границей на две категории: годен, не годен. Поэтому преобразование частных откликов в их стандартные аналоги на шкале желательности осуществляется по более сложным законам. Примером такого более сложного преобразования служит таблица желательности (табл. 1) и соответствующая ей функция желательности.
Рис 2.2. Задание частной функции желательности:
а. а — одностороннее ограничение;
б. б — двустороннее ограничение.
При односторонних ограничениях или на рис. 3 представлена частная функция желательности для свойства, ограниченного с одной стороны.
Рис. 2.3. Функция желательности для свойства, ограниченного с одной стороны.
Другой вид одностороннего ограничения характерен для таких показателей, как содержание различных вредных примесей, влажность, удельный вес, содержание дорогих или дефицитных компонентов и т. п.
Для двустороннего ограничения пример функции желательности показан на рис. 4.
Рис. 2.4. Функция желательности для свойства, ограниченного с двух сторон.
Случай двустороннего ограничения встречается не так часто, как одностороннего, и более сложен для оценки откликов. Примерами могут служить молекулярный вес материалов, предназначенных для переработки литьем или экструзией, насыпной вес, вес утряски, индекс расплава и т. п.
2.4. Обобщенная функция желательности.
После того как выбрана шкала желательности и частные отклики преобразованы в частные функции желательности, можно приступать к основной задаче — построению обобщенного показателя D, названного Харрингтоном обобщенной функцией желательности. Обобщать, то есть переходить от к D, предлагается по формуле
.
Здесь обобщенная функция желательности задается как среднее геометрическое частных желательностей.
Примером может служить установление пригодности материала с данным набором свойств для использования его в данных условиях.
Если хотя бы один частный отклик, входящий в комплекс полимеров качества материала, не удовлетворяет требованиям спецификации, то как бы ни были хороши прочие свойства, этот материал не может быть использован по назначению.
Способ задания обобщенной функции желательности таков, что если хотя бы одна частная желательность , то обобщенная функция тоже будет равна 0, с другой стороны D=1 тогда и только тогда, когда все . Обобщенная функция желательности весьма чувствительна к малым значениям частных желательностей.
Способ задания базовых отметок шкалы желательности представленный в табл. 1, один и тот же как для частных желательностей, так и для обобщенной. Так если , то и D=0,63. Если , то и D=0,37 и т. п. В обобщенную функцию желательности могут входить самые разнообразные отклики: технологические, экономические, и т. п.
Обобщенная функция желательности является некоторым абстрактным построением и поэтому, прежде чем рекомендовать ее в качестве единого критерия оптимизации, представлялось интересным исследовать такие важные свойства, как адекватность, статистическая чувствительность и эффективность.
Обобщенная функция желательности является количественным, однозначным единым и универсальным показателем качества исследуемого объекта, и если добавить еще такие свойства, как адекватность, и статистическая чувствительность, то становится ясным, что ее можно использовать в качестве критерия оптимизации.
Обобщенная функция желательности нашла широкое применение для оценки качества полимерных материалов, резиновых и латексных изделий, а также при разработке различных рецептур. Используется она в последнее время также и в промышленности.
Глава третья
ФАКТОРЫ.
После того, как выбран объект исследования и параметр оптимизации, нужно включить в рассмотрение все существенные факторы, которые могут влиять на процесс.
3.1. Определение фактора.
Фактором называется измеряемая переменная величина, принимающая в некоторый момент времени определенное значение. Факторы соответствуют способам воздействия на объект исследования.
Областью определения фактора называется совокупность всех значений, которые в принципе может принимать данный фактор. Совокупность значений фактора, которая используется в эксперименте, является подмножеством из множества значений, образующих область определения. Факторы разделяются на количественные и качественные. Качественные факторы — это разные вещества, разные технологические способы, аппараты, исполнители и т.д.
3.2. Требования, предъявляемые к факторам при планировании эксперимента.
При планировании эксперимента факторы должны быть управляемыми. Это значит, что экспериментатор, выбрав нужное значение фактора, может его поддерживать постоянным.
Температура воздуха — фактор неуправляемый.
Чтобы точно определить фактор, нужно указать последовательность действий, с помощью которых устанавливаются его конкретные значения. Такое определение фактора будем называть операциональным.
Точность замера факторов должна быть, возможно, более высокой.
Факторы должны быть непосредственными воздействиями на объект.
Факторы должны быть однозначны. Трудно управлять фактором, который является функцией других факторов. Но в планировании могут участвовать сложные факторы, такие, как соотношения между компонентами, их логарифмы и т.п.
3.3. Требования к совокупности факторов.
При планировании эксперимента обычно одновременно изменяется несколько факторов. Поэтому очень важно сформулировать требования, которые предъявляются к совокупности факторов. Прежде всего, выдвигается требование совместимости. Совместимости факторов означает, что все их комбинации осуществимы и безопасны.
При планировании эксперимента важна независимость факторов, т. е. возможность установления фактора на любом уровне вне зависимости от уровней других факторов. Значит второе требование — отсутствие корреляций между факторами. Это не означает, что между значениями нет никакой связи. Достаточно, чтобы связь не была линейной.
Пример фактора.
При оптимизации процесса экстракции циркония и гафния из соляно-кислых растворов в качестве независимых переменных приняты: x1 — концентрации металла, г/л; x2 — концентрация кислоты, моль/л; x3 — концентрация спирта, %; x4 — соотношение объемов фаз, мл/мл.
Глава четвертая.
ПОЛНЫЙ ФАКТОРНЫЙ ЭКСПЕРИМЕНТ.
Здесь мы впервые сталкиваемся с проблемой принятия решений при планировании эксперимента.
Весь процесс исследования можно считать состоящим из последовательности этапов, часть из которых полностью формализована, а «интуитивных» решений.
4.1. Принятие решений перед планированием эксперимента.
При выборе области эксперимента прежде всего надо оценить границы областей определения факторов. При этом должны учитываться ограничения нескольких типов. Первый тип — принципиальные ограничения для значений факторов, которые не могут быть нарушены ни при каких обстоятельствах. Второй тип — ограничения, связанные с технико-экономическими соображениями. Третий тип ограничений, с которым чаще всего приходится иметь дело, определяется конкретными условиями проведения процесса.
Оптимизация обычно начинается в условиях когда объект уже подвергался некоторым исследованиям. Информацию, содержащуюся в результатах предыдущих исследований, будем называть АПРИОРНОЙ (т. е. полученной до начала эксперимента). Априорную информацию можно использовать для получения представления о параметре оптимизации, о факторах, о наилучших условиях ведения процесса и характере поверхности отклика, т. е. о том, как сильно меняется параметр оптимизации при небольших изменениях значений факторов, а также о кривизне поверхности.
Итак, выбор экспериментальной области факторного пространства связан с тщательным анализом априорной информации.
В области определений надо найти локальную подобласть для планировании эксперимента. Процедура выбора этой подобласти включает два этапа: выбор основного уровня и выбор интервалов варьирования.
Выбор основного уровня.
Наилучшим условием, определенным из анализа априорной информации, соответствует комбинация уровней факторов. Каждую комбинацию можно рассматривать как исходную точку для построения плана эксперимента. Назовем ее основным (нулевым) уровнем.
Если имеются сведения о координатах одной наилучшей точки и нет информации о границах определения факторов, то остается рассматривать эту точку в качестве основного уровня.
Положение усложняется, если эта точка лежит на границе (или весьма близко к границе) области. Тогда приходится основной уровень выбирать с некоторым сдвигом от наилучших условий. Может быть, что координаты наилучшей точки неизвестны, но есть сведения о некоторой подобласти в которой процесс идет достаточно хорошо.
Тогда основной уровень выбирается либо в центре, либо в случайной точке этой подобласти.
Возможен случай с несколькими эквивалентными точками, координаты которых различны, когда отсутствуют дополнительные данные и выбор произволен.
Резюмируем наши рассуждения в виде блок-схемы (рис. 1).
Рис. 4.1. Блок-схема принятия решений при выборе основного уровня.
После того, как нулевой уровень выбран, переходим к следующему этапу.
Выбор интервалов варьирования.
Для каждого фактора выбрать два уровня, на которых он будет варьироваться в эксперименте.
ИНТЕРВАЛОМ ВАРЬИРОВАНИЯ ФАКТОРОВ называется некоторое число (свое для каждого фактора), прибавление которого к основному уровню дает верхний, а вычитание — нижний уровень факторов. Другими словами, интервал варьирования — это расстояние на координатной оси между основным и верхним (или нижним) уровнем.
Для упрощения условий эксперимента и обработки экспериментальных данных масштабы по осям выбираются так, чтобы верхний уровень соответствовал +1, а нижний –1, основной — 0. Для факторов с непрерывной областью определения это всегда можно сделать с помощью преобразования:
,
где — кодированное значение фактора,
— натуральное значение фактора,
— натуральное значение основного уровня,
— интервал варьирования,
i — номер фактора.
Для качественных факторов, имеющих два уровня, один уровень обозначается +1, а другой –1; порядок уровней не имеет значения.
На выбор интервалов варьирования накладываются естественные ограничения сверху и снизу. Интервал варьирования не может быть меньше той ошибки, с которой экспериментатор фиксирует уровень фактора. Иначе верхний уровень и нижний уровень оказываются неразличимыми.
При решении задачи оптимизации мы стремимся выбрать для первой серии экспериментов такую подобласть, которая бы давала возможность для шагового движения к оптимуму. В задачах же интерполяции интервал варьирования охватывает всю описываемую область.
Выбор интервалов варьирования — задача трудная, так как она связана с неформализованным этапом планирования эксперимента.
Точность фиксирования факторов определяется точностью приборов и стабильностью уровня в ходе опытов. Для упрощения схемы принятия решений мы введем приближенную классификацию, полагая, что есть низкая, средняя и высокая точности.
Источником сведений о кривизне поверхности отклика могут служить уже упоминавшиеся графики однофакторных зависимостей, а также теоретические соображения. Из графиков сведения о кривизне можно получить визуально. Некоторое представление о кривизне дает анализ табличных данных, так как наличию кривизны соответствует непропорциональное изменение параметра оптимизации при равномерном изменении фактора. Мы будем различать три случая: функция отклика линейна, функция отклика существенно нелинейна, информация о кривизне отсутствует.
Если имеются результаты некоторого множества опытов, то всегда можно найти наибольшее и наименьшее значения параметра оптимизации. Разность между этими значениями будем называть диапазоном изменения параметра оптимизации для данного множества опытов. Условимся различать широкий и узкий диапазоны. Диапазон узкий, если он несущественно отличается от разброса значений параметра оптимизации в повторных опытах. В противном случае будем считать диапазон широким. Учтем также случай, когда информация отсутствует.
При принятых градациях возможна 33=27 различных ситуаций.
Для интервалов также введем градацию. Рассмотрим широкий, средний и узкий интервал варьирования. Размер интервала варьирования составляет некоторую долю от области определения фактора.
Рассмотрим блок-схемы принятия решений. На первой схеме (Рис. 2) представлены 9 ситуаций, имеющих место при низкой точности фиксирования факторов. При выборе решений учитываются информация о кривизне поверхности отклика и о диапазоне изменения параметра оптимизации. Типичное решение — широкий интервал варьирования.
Узкий интервал варьирования совершенно не используется, что вполне понятно при низкой точности.
Средний интервал варьирования в этой схеме выбирается дважды, причем в девятой ситуации как редко применяемая альтернатива. Здесь отсутствует информация об обоих признаках, и выбор широкого интервала представляется более естественным.
Наибольшие трудности возникают, когда поверхность отклика не линейна. Появляется противоречие между низкой точностью фиксирования факторов и кривизной. Первая требует расширения интервала, а вторая — сужения. Решение оказывается неоднозначным.
Рис. 4.2. Принятие решений при низкой точности фиксирования факторов.
На рис. 3 изображена блок-схема для случая средней точности фиксирования факторов.
Характерен выбор среднего интервала варьирования. Лишь в случае нелинейной поверхности и широкого диапазона рекомендуется узкий интервал варьирования. При сочетаниях линейной поверхности с узким диапазоном и отсутствием информации о диапазоне выбирается широкий интервал варьирования. Пунктиром, как и выше, показаны редко применяемые альтернативы. На рис. 4 построена блок-схема для случая высокой точности фиксирования факторов. Сочетание высокой точности всегда приводит к выбору узкого интервала.
Рис. 4.3. Принятие решений при средней точности фиксирования факторов.
Рис. 4.4. Принятие решений при высокой точности фиксирования факторов.
4.2. Полный факторный эксперимент типа 2k.
Первый этап планирования эксперимента для получения линейной модели на варьирование факторов на двух уровнях. В этом случае, если число факторов известно, можно сразу найти число опытов, необходимое для реализации всех возможных сочетаний уровней факторов.
Простая формула, которая для этого используется: , где N — число опытов, k — число факторов, 2 — число уровней.
Эксперимент в котором реализуются все возможные сочетания уровней факторов, называется полным факторным экспериментом. Нетрудно написать все сочетания уровней в эксперименте с двумя факторами. Напомним, что в планировании эксперимента используются кодированные значения факторов: +1 и –1. Условия эксперимента можно записать в виде таблицы, где строки соответствуют различным опытам, а столбцы — значениям факторов. Такие таблицы называются матрицами планирования.
Матрица планирования для двух факторов приведена в табл. 1
Таблица 4.1.
Матрица планирования эксперимента 22.
Номер опыта
y
1
–1
–1
2
+1
–1
3
–1
+1
4
+1
+1
Каждый столбец в матрице планирования называют вектор-столбцом, а каждую стоку — вектор-строкой.
То, что написано в таблице в алгебраической форме, можно изобразить графически. Найти в области факторов точку, соответствующую основному уровню, и проведем через нее новые оси координат, параллельные осям натуральных значений факторов. Выберем Масштабы по новым осям так, чтобы интервал варьирования для каждого фактора равнялся единице. Условия проведения опытов будут соответствовать вершинам квадрата, центром его является основной уровень, а каждая сторона параллельна одной из осей координат и равна двум интервалам (рис. 5).
Рис. 4.5. Геометрическая интерпретация полного факторного эксперимента 22.
Номера вершин квадрата соответствуют номерам опытов в матрице планирования. Площадь, ограниченная квадратом, называется областью эксперимента. В задачах интерполяции область эксперимента есть область предсказываемых значений у.
Запись матрицы планирования можно сократить, если ввести условные буквенные обозначения строк.
Порядковый номер фактора ставится в соответствие строчной букве латинского алфавита: — а, — в,…, и т.д. Если теперь для строки матрицы планирования выписать латинские буквы только для факторов, находящихся в верхних уровнях, то условия опыта будут заданы однозначно. Опыт со всеми факторами на нижних уровнях условимся обозначать (1).
Таблица 2.
Матрица планирования эксперимента 22.
Номер опыта
Буквенные обозначения строк
y
1
–1
–1
(1)
2
+1
–1
а
3
–1
+1
b
4
+1
+1
ab
Ниже приведена запись еще одного плана: c, b, a, abc, (1), bc, ac, ab. Матрица планирования эксперимента приведена в табл. 3.
Таблица 3.
Матрица планирования эксперимента 23.
Номер опыта
Буквенные обозначения строк
y
1
–1
–1
+1
c
2
–1
+1
–1
b
3
+1
–1
–1
a
4
+1
+1
+1
abc
5
–1
–1
–1
(1)
6
–1
+1
+1
bc
7
+1
–1
+1
ac
8
+1
+1
–1
ab
Таким образом, построен полный факторный эксперимент 23.
С ростом числа факторов возникает необходимость в некотором приеме построения матриц.
Рассмотрим первый прием, основанный на переходе от матриц меньшей размерности к матрицам большей размерности.
При добавлении нового фактора каждая комбинация уровней исходного плана встречается дважды: в сочетании с нижним и верхним уровнями нового фактора. Отсюда появляется прием: записать исходный план для одного уровня нового фактора, а затем повторить его для другого уровня. Вот как это выглядит при переходе от эксперимента 22 к 23 (табл. 4).
Таблица 4.
Построение матрицы планирования эксперимента 23.
Номер опыта
y
Номер опыта
y
1
-
-
+
5
-
-
-
2
-
+
+
6
-
+
-
3
+
-
+
7
+
-
-
4
+
+
+
8
+
+
-
Этот прием распространяется на построение матриц любой размерности.
Рассмотрим второй прием. Для этого введем правило перемножения столбцов матрицы. при построчном перемножении двух столбцов матрицы произведение единиц с одноименными знаками дает «+1», а с разноименными — «–1». Воспользовавшись этим правилом, получим вектор-столбец произведения x1∙x2 в исходном плане.
Третий прием основан на чередовании знаков. В первом столбце знаки меняются поочередно, во втором — через два, в третьем — через четыре, в четвертом — через восемь и т.д. по степеням двойки. Если в табл. 4 поменять местами столбцы для и , то получится нужная матрица.
По аналогии с ПФЭ 22 можно дать геометрическую интерпретацию ПФЭ 23. Геометрической интерпретацией ПФЭ 23 служит куб, координаты вершин которого задают условия опытов. В центре куба находится точка основного уровня. Куб задает область эксперимента, а центр куба является ее центром (рис. 6).
Рис. 4.6. Геометрическая интерпретация ПФЭ 23.
Нарисовать картинки для числа факторов больше 3 невозможно — не хватит координатных осей. Но эта фигура является некоторым аналогом куба — гиперкубом.
4.3. Свойства ПФЭ 2k.
Мы научились строить матрицы планирования полных факторных экспериментов с факторами на двух уровнях. Теперь выясним, какими общими свойствами эти матрицы обладают независимо от числа факторов. Говоря о свойствах матриц, мы имеем в виду те из них, которые определяют качество модели.
Два свойства следуют непосредственно из построения матрицы. Первое из них — симметричность относительно центра эксперимента — формулируется следующим образом: алгебраическая сумма элементов вектор-столбца каждого фактора равна нулю или , где j — номер фактора, N — число опытов, .
Второе свойство — так называемое условие нормировки — формулируется следующим образом: сумма квадратов элементов каждого столбца равна числу опытов, или . Это следствие того, что значения факторов в матрице задаются +1 и –1.
Третье свойство — свойство совокупности столбцов. сумма почленных произведений любых двух вектор-столбцов матрицы равны нулю, или , , . Это важное свойство называется ортогональностью матрицы планирования.
Четвертое свойство называется ротатабельностью, т. е. точки в матрице планирования подбираются так, что точность предсказания значений параметра оптимизации одинакова на равных расстояниях от центра эксперимента и не зависит от направления.
4.4. ПФЭ и математическая модель.
Вернемся к матрице 22 (табл. 2). Для движения к точке оптимума нам нужна линейная модель . Наша цель — найти по результатам эксперимента значения неизвестных коэффициентов модели.
Эксперимент, содержащий конечное число опытов, позволяет только получить выборочные оценки для коэффициентов уравнения . Их точность и надежность нуждаются в статистической проверке и зависят от свойств выборки.
Займемся вычислением оценок коэффициентов. Их можно вычислить по простой формуле:
Воспользуемся этой формулой для подсчета коэффициентов и .
Для подсчета используется вектор-столбец , а для — . Остается неясным, как найти .
В силу свойств симметрии . Следовательно .
Значит есть среднее арифметическое значение параметра оптимизации. Чтобы его получить, необходимо сложить все у и разделить на число опытов. Чтобы провести эту процедуру в соответствие с формулой для вычисления коэффициентов, в матрицу планирования удобно ввести вектор-столбец фиктивной переменной , которая принимает во всех опытах значение +1.
.
Коэффициенты при независимых переменных указывают на силу влияния факторов. Чем больше численная величина коэффициентов, тем большее влияние оказывает фактор. Если коэффициент имеет знак (+), то с увеличением значения фактора параметр оптимизации увеличивается, а если (-), то уменьшается.
Иногда удобно оценивать вклад фактора при переходе от нижнего к верхнему уровню. Вклад, определенный таким образом, называется эффектом фактора.
Планируя эксперимент, на первом этапе мы стремимся получить линейную модель. Однако у нас нет гарантии, что в выбранных интервалах варьирования процесс описывается линейной моделью.
А если модель нелинейна, как количественно оценить нелинейность, пользуясь ПФЭ?
Один из часто встречающихся видов нелинейности связан с тем, что эффект одного фактора зависит от уровня, на котором находится другой фактор. ПФЭ позволяет количественно оценивать эффекты взаимодействия. Для этого надо, пользуясь правилом перемножения столбцов, получить столбец произведения двух факторов. Для полного факторного эксперимента 22 матрица планирования с учетом эффекта взаимодействия представлена в табл. 5. Очень важно, что при добавлении столбцов эффектов взаимодействий все рассмотренные свойства матриц планирования сохраняются.
Таблица 5.
Матрица планирования эксперимента 23 с эффектом взаимодействия.
Номер опыта
y
Номер опыта
y
1
+1
+1
+1
+1
3
+1
–1
–1
+1
2
+1
–1
+1
–1
4
+1
+1
–1
–1
Теперь модель выглядит следующим образом:
.
Коэффициент вычисляется обычным путем
.
Столбцы и задают планирование — по ним непосредственно определяются условия опытов, а столбцы и служат только для расчета.
Покажем на примере еще один способ расчета коэффициентов, известный как метод Йетса. Все операции по расчету приведены в табл. 6
Таблица 6.
Расчет коэффициентов регрессии по методу Йетса.
1
2
3
1
2
3
С ростом числа факторов число возможных взаимодействий быстро растет. Матрица планирования 23 с учетом всех возможных взаимодействий приведена в табл. 7.
Таблица 7.
Матрица планирования эксперимента 23 с учетом взаимодействий.
Номер опыта
y
1
+1
–1
–1
+1
+1
–1
–1
+1
2
+1
+1
–1
–1
–1
–1
+1
+1
3
+1
–1
+1
–1
–1
+1
–1
+1
4
+1
+1
+1
+1
+1
+1
+1
+1
5
+1
–1
–1
–1
+1
+1
+1
–1
6
+1
+1
–1
+1
–1
+1
–1
–1
7
+1
–1
+1
+1
–1
–1
+1
–1
8
+1
+1
+1
–1
+1
–1
–1
–1
Полное число всех возможных эффектов, включая , линейные эффекты и взаимодействия всех порядков, равно числу опытов полного факторного эксперимента. Чтобы найти число возможных взаимодействий некоторого порядка, можно воспользоваться обычной формулой числа сочетаний
где k — число факторов, m — число элементов во взаимодействии.
Так для плана 24 число парных взаимодействий равно шести.
.
Ортогональность матрицы планирования позволяет получить независимые друг от друга оценки коэффициентов. Это означает, что величина любого коэффициента не зависит от того, какие величины имеют другие коэффициенты.
Существенными могут оказаться коэффициенты при квадратах факторов, их кубах и т.п. Так для случая существенных квадратичных членов в двухфакторном эксперименте модель можно записать так:
.
Попытка построения вектор-столбцов для и приводит к получению единичных столбцов, совпадающих друг с другом и со столбцом . Так как эти столбцы неразличимы, нельзя сказать, за счет чего получилась величина . Она включает значение свободного члена и вклады квадратичных членов. В этом случае говорят, что имеет место смешанная оценка. Это символически записывается следующим образом:
,
где — вычисленный нами коэффициент, а греческими буквами, как принято в статике, обозначены неизвестные истинные значения свободного члена () и квадратичных коэффициентов ().
По отношению к квадратичной форме модели для двух факторов получается такая система смешивания:
.
Следовательно оценки всех коэффициентов кроме , не смешаны.
Число опытов в полном факторном эксперименте превышает число коэффициентов линейной модели, причем тем больше, чем больше факторов. Разность между числом опытов и числом коэффициентов во многих случаях оказывается очень велика, и возникает естественное желание сократить число необходимых опытов. Этому вопросу посвящена следующая глава.
Глава пятая
ДРОБНЫЙ ФАКТОРНЫЙ ЭКСПЕРИМЕНТ.
5.1. Минимизация числа опытов.
Начнем с самого простого — полного факторного эксперимента. Напишем матрицу:
Номер опыта
x0
x1
x2
x3
(x1 x2)
y
1.
+
–
–
+
y1
2.
+
+
–
–
y2
3.
+
–
+
–
y3
4.
+
+
+
+
y4
Представим результаты эксперимента в виде неполного квадратного уравнения:
Определим три коэффициента: , b1 и b2. Остается одна степень свободы. Употребим ее для минимизации числа опытов. При линейном приближении и вектор столбец можно использовать для нового фактора x3. Поставим этот фактор в скобках над взаимодействием . Мы нашли средство минимизировать число опытов: вместо 8 опытов для изучения трех факторов оказывается можно поставить 4. Чтобы сократить число опытов, нужно новому фактору присвоить вектор-столбец матрицы, принадлежащий взаимодействию, которым можно пренебречь. Тогда значение нового фактора в условиях опытов определяется знаками этого столбца.
5.2. Дробная реплика.
Поставив четыре опыта для оценки влияния трех факторов, мы воспользовались половиной полного факторного эксперимента 23 или «полурепликой». Если бы мы x3 приравняли к , то получили бы вторую половину матрицы 23.
Объединение этих двух полуреплик и есть полный факторный эксперимент 23.
Матрица из восьми опытов для четырехфакторного планирования будет полурепликой от полного факторного эксперимента 24, а для пятифакторного планирования — четверть репликой от 25. Для обозначения дробных реплик, в которых p линейных эффектов приравнены к эффектам взаимодействия, удобно пользоваться условным обозначением . Так полуреплика от 26 запишется в виде , а четверть — реплика от 25 — в виде .
5.3. Выбор полуреплик. Генерирующие соотношения и определяющие контрасты.
При построении полуреплики существует всего две возможности приравнять x3 к или к . Поэтому есть только две полуреплики .
№ опыта
I.
№ опыта
II.
x1
x2
x3
x1 x2 x3
x1
x2
x3
x1 x2 x3
1.
+
+
+
+
1.
+
+
–
–
2.
–
–
+
+
2.
–
–
–
–
3.
+
–
–
+
3.
+
–
+
–
4.
–
+
–
+
4.
–
+
+
–
Для произведения трех столбцов матрицы I выполняется соотношение: , а для матрицы II: .
Символическое обозначение произведения столбцов, равного +1 или –1, называется определяющим контрастом. Контраст помогает определять смешанные эффекты. Для того, чтобы определить какой эффект смешан с данным, нужно помножить обе части определяющего контраста на столбец, соответствующий данному эффекту. Так, если , то для x1 имеем , так как всегда и т.д. для x2 и x3.
Соотношение, показывающее с каким из эффектов смешан данный эффект, называется генерирующим соотношением.
Полуреплики, в которых основные эффекты смешаны с двухфакторными взаимодействиями, носят название планов с разрешающей способностью III.
Разрешающая способность этих полуреплик различна. Так реплики 1-6 имеют по три фактора в определяющем контрасте, а 7-8 по четыре. Реплики 7 и 8 имеют максимальную разрешающую способность и называются главными.
Реплики, в которых нет ни одного главного эффекта, смешанного с другим главным эффектом или парным взаимодействием, а все парные взаимодействия смешаны друг с другом, носят название планов с разрешающей способностью IV.
Эффективность реплики зависит от системы смешивания. Реплики, у которых линейные эффекты смешаны с взаимодействиями наивысшего порядка, являются наиболее эффективными, так как обладают наибольшей разрешающей способностью.
Для освобождения линейных эффектов от взаимодействий первого порядка можно использовать метод «перевала». Смысл метода в добавлении новой реплики, все знаки которой противоположны исходной реплике.
С ростом числа факторов быстро увеличивается число реплик различной дробности. Эти реплики характеризуются обобщающими определяющими контрастами, которые получаются перемножением по два, по три и т.д. исходных определяющих контрастов.
Глава шестая
ПРОВЕДЕНИЕ ЭКСПЕРИМЕНТА.
6.1. Анкета для сбора априорной информации.
Постановка задачи, выбор параметров оптимизации.
1. Краткое описание процесса, объекта.
2. Формулировка цели исследования (если задач несколько — проранжировать их по степени важности).
3. Выбор параметров оптимизации (откликов).
Заполните таблицу:
номер
название
размерность
область определения
точность
примечание
4. Желаемый результат. Число и точность.
5. Какой результат будет считаться отличным, хорошим, удовлетворительным и неудовлетворительным.
Выбор факторов.
1. Список всех «подозреваемых» факторов, которые могут влиять на процесс.
2. Список факторов, включаемых в реальный эксперимент.
номер фактора
название
размерность
область определения
область интереса
примечание
3. Существуют ли возможности установления значения фактора на любом заданном уровне?
4. Сохраняются ли заданные значения уровней в течение опыта?
5. Могут ли некоторые комбинации уровней факторов привести к остановке процесса.
Число опытов.
1. Желаемое число опытов, ограничения на число опытов.
2. Желаемый срок проведения исследования.
3. Примерная длительность одного опыта.
4. Стоимость и затраты труда при проведении одного опыта серии.
5. Желаемое число уровней для одного фактора.
6. Возможность выполнения параллельных опытов и их желаемое число.
7. Желаемая стратегия проведения опытов.
Учет априорной информации.
1. Условия и результаты, достигнутые при изучении аналогичных процессов.
2. Результаты предварительного эксперимента и данные о величине ошибки эксперимента.
3. Взаимодействия факторов.
6.2. Погрешности параллельных опытов.
Каждый эксперимент содержит ошибку. Эту ошибку нужно оценить по параллельным опытам. Среднее арифметическое всех результатов равно сумме всех n отдельных результатов, деленной на количество параллельных опытов n:
.
Отклонение результата опыта можно представить как разность , где — результат отдельного опыта. Для измерения этой изменчивости используют дисперсию. Дисперсией называется среднее значение квадрата отклонений величины от ее среднего значения
,
где (n–1) — число степеней свободы, равное количеству опытов минус единица. Одна степень свободы использована для вычисления среднего.
Корень квадратный из дисперсии, взятый с положительным знаком, называется средним квадратичным отклонением, стандартом
.
Дисперсия и стандарт — это меры рассеяния, изменчивости. Чем больше дисперсия и стандарт, тем больше рассеяны значения параллельных опытов около среднего значения.
Для определения ошибки используют критерий Стьюдента
.
Значение берут из таблицы t-распределения Стьюдента. Опыт считается бракованным, если экспериментальное значение критерия t по модулю больше табличного значения.
6.3. Дисперсия параметра оптимизации.
Матрица планирования состоит из серии опытов, и дисперсия всего эксперимента получается при подсчете дисперсии параметра оптимизации
, где .
Для двух повторных опытов формула принимает совсем простой вид
.
6.4. Проверка однородности дисперсии.
Проверка однородности дисперсии производится с помощью критерия Фишера. Критерий Фишера (F-критерий) представляет собой отношение большей дисперсии к меньшей. Полученная величина сравнивается с табличной величиной F-критерия.
Если полученное значение дисперсного отношения больше приведенного в таблице для соответствующих степеней свободы и выбранного уровня значимости, это означает, что дисперсии значимо отличаются друг от друга, т. е. они неоднородны.
Если сравниваемое количество дисперсий больше двух, и одна дисперсия значительно превышает остальные, можно воспользоваться критерием Кохрена. Этот критерий пригоден для случаев, когда во всех точках имеется одинаковое число повторных опытов. При этом подсчитывается дисперсия в каждой горизонтальной строке матрицы
,
а затем из всех дисперсий находится наибольшая, которая делится на сумму всех дисперсий. Критерий Кохрена — это отношение максимальной дисперсии к сумме всех дисперсий
.
С этим критерием связаны числа степеней свободы и . Гипотеза об однородности дисперсий подтверждается, если экспериментальное значение критерия Кохрена не превышает табличного значения. Тогда можно пользоваться формулой
.
Приступить к расчету ошибки воспроизводимости, к регрессионному анализу можно только после того, как дисперсии выдержали проверку на однородность.
6.5. Рандомизация.
Чтобы исключить влияние систематических ошибок, вызванных внешними условиями, рекомендуется случайная последовательность при постановке опытов, запланированных матрицей. Опыты необходимо рандомизировать во времени.
Приведем простой пример рандомизации условий эксперимента. В полном факторном эксперименте предполагается каждое значение параметра оптимизации определять по двум параллельным опытам. Нужно случайно расположить всего 16 опытов. Присвоим параллельным опытам номера с 9 по 16, и тогда девятый опыт будет повторным по отношению к первому опыту, десятый — ко второму и т.д. Следующий этап рандомизации — использование таблицы случайных чисел (руководство по математической статистике). В случайном месте таблицы выписываются числа с 1 по 16 с отбрасыванием чисел больше 16 и уже выписанных. В нашем случае, начиная с четвертого столбца, можно получить последовательность
2; 15; 9; 5; 12; 14; 8; 13; 16; 1; 3; 7; 4; 6; 11; 10.
Это значит, что первым реализуется опыт №2, вторым — опыт №7 и т.д. Выбранную таким случайным образом последовательность опытов не рекомендуется нарушать.
Глава седьмая
ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА.
7.1. Метод наименьших квадратов.
Разберемся в этом методе. Начнем с простого случая: один фактор, линейная модель. Интересующая нас функция отклика имеет вид
Наша цель — вычисление неизвестных коэффициентов и .
,
где i=1, 2, 3,…, N — номер опыта; — разность между экспериментальным и вычисленным по уравнению регрессии значениями в i-й экспериментальной точке. Эту величину иногда называют невязкой. Невязка возникает по двум причинам: из-за ошибки эксперимента и из-за непригодности модели.
Можно постулировать, что модель пригодна, тогда невязка будет порождаться только ошибкой опыта.
Обычно оценивают независимо ошибку опыта и проверяют пригодность модели, конечно, мы хотим найти такие коэффициенты регрессии, при которых невязки будут минимальны. Это требование можно представить в виде записи
,
которая приводит к методу наименьших квадратов.
Формулы для вычисления коэффициентов регрессии имеют вид
; (1)
. (2)
Можно показать, что для любого числа факторов коэффициенты будут вычисляться по формуле
.
В этой формуле j=1, 2,…, r — номер фактора. Ноль записан для вычисления b0. После сокращения формулы 1 и 2 приобретают вид
; ,
где .
Так как каждый фактор (кроме x0) варьируется на двух уровнях +1 и –1, то вычисления сводятся к приписыванию столбцу знаков соответствующего фактору столбца и алгебраическому сложению полученных значений.
И уравнение регрессии будет иметь вид
.
7.2. Регрессионный анализ.
Регрессионный анализ применим при определенных постулатах.
1 ПОСТУЛАТ. Параметр оптимизации есть случайная величина с нормальным законом распределения. Дисперсия воспроизводимости — одна из характеристик этого закона распределения.
2 ПОСТУЛАТ. Дисперсия не зависит от абсолютной величины. Выполнимость этого постулата проверяется с помощью критериев однородности дисперсий в разных точках факторного пространства. Нарушение этого постулата недопустимо.
3 ПОСТУЛАТ. Значение факторов суть неслучайные величины.
Если с постулатами все в порядке, то можно проверять статические гипотезы.
7.3. Проверка адекватности модели.
Первый вопрос, который нас интересует после вычисления коэффициентов модели, это проверка ее пригодности. Эта проверка называется проверкой адекватности модели.
Числом степеней свободы в статистике называется разность между числом опытов и числом коэффициентов (констант), которые уже вычислены по результатам этих опытов независимо друг от друга.
Если, например, вы провели полный факторный эксперимент и нашли линейное уравнение регрессии, то число степеней свободы
.
Остаточная сумма квадратов, деленная на число степеней свободы, называется дисперсией адекватности ()
.
Запомним правило: в планировании эксперимента число степеней свободы для дисперсии адекватности равно число различных опытов, результаты которых используются при подсчете коэффициентов регрессии, минус число определяемых коэффициентов.
Для проверки гипотезы об адекватности можно использовать F-критерий
.
7.4. Проверка значимости коэффициентов.
Ее можно осуществлять двумя способами: проверкой по t-критерию Стьюдента или построением доверительного интервала. Прежде всего надо найти дисперсию коэффициента регрессии. Она определяется по формуле , если параллельные опыты отсутствуют. Из формулы видно, что дисперсии всех коэффициентов равны друг другу, так как они зависят только от ошибки опыта и числа опытов. Теперь легко построить доверительный интервал
.
Здесь t — табличное значение критерия Стьюдента при числе степеней свободы, с которыми определялась , и выбранном уровне значимости (обычно 0,005); — квадратичная ошибка коэффициента регрессии
.
Формулу для доверительного интервала можно записать в эквивалентной форме:
.
Коэффициент значим, если его абсолютная величина больше доверительного интервала.
Для отыскания значений t-критерия можно воспользоваться таблицей. Запомним рабочее правило: если абсолютная величина коэффициента больше, чем доверительный интервал, то коэффициент значим. Если вам больше нравится проверять значимость коэффициентов по t-критерию, то воспользуйтесь формулой
.
Вычисленное значение t-критерия сравнивается с табличным при заданном и соответствующем числе степеней свободы.
Глава восьмая
КРУТОЕ ВОСХОЖДЕНИЕ ПО ПОВЕРХНОСТИ ОТКЛИКА.
8.1. Движение по градиенту.
Рассмотрим на рис. 1.
Рис. 1. Движение по поверхности отклика методами однофакторного эксперимента и градиента.
На нем изображены кривые равного выхода поверхности отклика для двух независимых переменных. Они подобны линиям равной высоты на графических картах. Поверхность отклика имеет вид холма с вершиной в точке «О». Если попытаться попасть в окрестность этой точки из точки А с помощью одного из вариантов однофакторного эксперимента, то мы сначала должны стабилизировать первый фактор, например Х, и изменять в направлении АС второй фактор до тех пор, пока увеличивается выход. За точкой С выход падает, и поэтому в ней стабилизируем Х и изменяем Х направлении СД по такому же правилу и т.д.
Наиболее короткий путь к вершине — направление градиента функции отклика. На рис.1 это направление АВ, перпендикулярное линиям уровня. Градиент непрерывной однозначной функции есть вектор
,
где — обозначение градиента,
— производное функции по i-му фактору,
i, j, k — единичные векторы в направлении координатных осей.
Следовательно, составляющие градиента суть частные производные функции отклика, оценками которых являются коэффициенты регрессии.
Изменяя независимые переменные пропорционально величинам коэффициентов регрессии, мы будем двигаться в направлении градиента функции отклика по самому крутому пути. Поэтому процедура движения к почти стационарной области называется КРУТЫМ ВОСХОЖДЕНИЕМ.
Величины составляющих градиента определяются формулой поверхности отклика и теми решениями, которые были приняты при выборе параметра оптимизации, нулевой точки и интервалов варьирования.
Знак составляющих градиента зависит только от формы поверхности отклика и положения нулевой точки (рис. 2).
Рис. 2. Зависимость знака градиента от формы поверхности и положения нулевой точки.
В большинстве задач выбор поверхности не является проблемой. Этот выбор определяется характером задач, традициями и существующей системой мер, и измерительных приборов. Когда размерность фиксирована, то все ясно. Однако важно помнить, что размерность влияет на величины составляющих градиента, а их знаки инвариантны относительно изменения масштабов.
Итак, для данной поверхности отклика выбраны нулевая точка и интервалы варьирования, проведен эксперимент и найдены оценки коэффициентов регрессии. После этого направление градиента задается однозначно и является единственным. При этом предполагается, что имеется только один оптимум.
Займемся расчетом направления градиента.
8.2. Расчет крутого восхождения.
Технику расчета крутого восхождения удобно рассмотреть на простейшем примере в случае одного фактора (рис. 3).
Рис. 3. Расчет координат точек в направлении градиента.
Если коэффициент регрессии умножить на интервал варьирования, который является прилежащим к катетам в прямоугольном треугольнике ОАВ, то получится противолежащий катет АВ, который и дает координаты точки, лежащей на градиенте.
Обобщение на случай k факторов делается механически, т.к. все эффекты независимы друг от друга. Существенно только соотношение произведений коэффициентов на соответствующие интервалы. Их абсолютные величины могут все одновременно умножаться или делиться на любое положительное число. При этом получаются точки, лежащие на том же градиенте, но с другим шагом.
Как выбрать шаг движения по градиенту? Это еще один этап, для которого не существует формализованного решения. Небольшой шаг потребует значительного числа опытов при движении к оптимуму, большой шаг увеличивает вероятность проскока области оптимума.
Для облегчения работы шаги обычно округляют.
На расчет градиента не оказывает влияние b0. Для качественных факторов на двух уровнях либо фиксируется лишний уровень, либо градиент реализуется дважды для каждого уровня в отдельности. Незначимые факторы стабилизируются на любом уровне в интервале (–1; +1). Если нет специальных соображений, то выбирают нулевой уровень.
Все расчеты сводятся к тому, чтобы выбрать шаг движения по одному из факторов и пропорционально произведениям коэффициентов регрессии на интервалы варьирования рассчитать шаги по другим факторам.
Иногда имеет смысл оценивать ожидаемые значения параметра оптимизации в мысленных опытах.
Остались два момента: как влияют на крутое восхождение соотношения численных значений коэффициентов регрессии и почему движение по градиенту начинается из нулевой точки.
Представим себе, что в адекватном линейном уравнении значим только один коэффициент. Тогда в движении по градиенту будет участвовать только один фактор. Многофакторная задача выродится в однофакторную. А это менее эффективно. Рассмотренный случай является крайним, но в практике довольно часто коэффициенты b существенно различаются между собой, оставаясь значимыми.
Функция, величины коэффициентов которой различаются не существенно, называется симметричной относительно коэффициентов. Движение по градиенту для симметричной функции наиболее эффективно. Удачным выбором интервалов варьирования можно сделать симметричной любую линейную функцию для значимых факторов.
На первом этапе планирования не всегда удается получить симметричную функцию. Если функция резко асимметрична (коэффициенты различаются на порядок), то выгоднее вновь поставить эксперимент, изменив интервалы варьирования, а не двигаться к градиенту.
Направление градиента определяется единственным способом и движение должно начинаться из нулевой точки. На рис. 4 приведена простая геометрическая иллюстрация этого факта.
Рис. 4 Движение по градиенту из нулевой и из одной из крайних точек.
Хорошо видно, что движение из наилучшей точки плана проходит в стороне от оптимальных условий.
Можно рассуждать иначе. Функция отклика, вид которой нам неизвестен, разлагалась в ряд Тейлора в окрестности нулевой точки. Именно к этой точке и относится оценка градиента.
8.3. Реализация мысленных опытов.
Рассчитав составляющие градиента, мы получим условия мысленных опытов. Число мысленных опытов зависит от задачи. Ограничением сверху служит граница области определения хотя бы по одному из факторов. Иногда по технологическим соображениям нет смысла определять условия многих опытов. Обычно рассчитывается 5–10 мысленных опытов.
Если модель адекватна, то начинают реализацию с тех опытов, условия которых выходят за область эксперимента хотя бы по одному из факторов. Для неадекватной модели часто 1-2 опыта выполняют в области эксперимента.
Условия мысленных опытов следует тщательно обдумать и убедиться, что нет затруднений в их реализации. Если что-то не ладится, можно изменить шаг и рассчитать мысленные опыты заново.
Существует две принципиально различные стратегии реализации мысленных опытов. Все намеченные к реализации опыты ставятся одновременно либо последовательно по некоторой программе. Одновременно могут ставиться все мысленные опыты, через один, через два и т.д. Последовательный принцип заключается в том, что вначале ставится 2 — 3 опыта, анализируются результаты и принимается решение о постановке новых опытов. Выбор стратегий определяется стоимостью опытов, их длительностью и условиями экспериментирования.
Преимущества одновременной реализации опытов в том, что эта стратегия исключает временной дрейф.
Когда опыты быстры и дешевы, эта стратегия вполне пригодна.
А если опыты дороги, приходится пользоваться последовательной стратегией, так как минимизация числа опытов приобретает большую актуальность.
Имеется несколько вариантов последовательной стратегии. Можно реализовать опыты по одному и после каждого анализировать результаты. Другой путь — ставят одновременно 2–3 опыта и затем принимаются решения.
При незначительном изменении параметра оптимизации (поверхность пологая) следующим реализуется далеко отстоящий опыт, при сильном изменении (поверхность крутая) — близлежащий.
Иногда пользуются методом «ножниц»: реализуются два крайних мысленных опыта, а затем прощупывается пространство внутри этого интервала. Минимальное число опытов — 3, т.к. оптимум необходимо захватить «в вилку». Два опыта могут оказаться достаточными, когда координаты оптимума близки к координатам опытов исходного плана или же когда попытка продвинуться по неадекватной модели оказывается неудачной.
Крутое восхождение может считаться эффективным, если хотя бы один из реализованных опытов даст лучший результат по сравнению с наилучшим опытом серии.
Если в одном из реализованных опытов достигнуты оптимальные условия, то эксперимент заканчивается.
Остановимся на некоторых особенностях реализации опытов крутого восхождения.
Рассмотрим следующую ситуацию. При эффективном крутом восхождении достигается граница области определения одного из факторов. По этому фактору дальше двигаться нельзя. Возможны два решения: зафиксировать значение этого фактора и дальше двигаться по остальным или остановиться и поставить новую серию опытов линейного приближения. На практике чаще предпочитают первое решение. В этом случае нужно продолжить расчет мысленных опытов и выбрать стратегию их реализации.
Особого рассмотрения заслуживает постановка повторных опытов. Чаще всего повторные опыты не ставятся, а дублируется только наилучший результат. Будет, конечно, не хуже, если ставить параллельные опыты во всех точках.
Иногда приходится считаться с возможностью временного дрейфа. Ведь между исходной серией опытов и движением по градиенту может пройти значительное время. Здесь можно рекомендовать систематическое повторение нулевых точек исходного плана, рандомизованных с точками крутого восхождения.
При движении по градиенту возможны пять ситуаций, схематично представленных на рис. 5.
Рис. 5. Ситуации при движении по градиенту.
Наиболее благоприятные случаи даны на рис. 5 а, г и д, где движение по градиенту оказалось эффективным. В случае «а» параметр оптимизации все время возрастает, в случае «г» он проходит через максимум. Более сложным является случай «д», где нарушена посылка одноэкстремальности.
Случай «б» иллюстрирует неэффективное крутое восхождение. Вместо ожидаемого увеличения параметра оптимизации наблюдается уменьшение. Здесь либо план эксперимента расположен в области оптимума, либо есть грубые ошибки.
В случае «в» все опыты на градиенте дают одно и то же значение. Поверхность отклика имеет вид постоянного гребня.
В соответствии с шаговым принципом «ползания» по поверхности отклика крутое восхождение может осуществляться многократно, пока не будет достигнута почти стационарная область.