что такое полный факторный эксперимент
Теория Планирования Эксперимента
Главная
Полный факторный эксперимент
Нетрудно написать все сочетания уровней в эксперименте с двумя факторами. Напомним, что в планировании эксперимента используются кодированные значения факторов: +1 и –1 (часто для простоты записи единицы опускают). Условия эксперимента можно записать в виде таблицы, где строки соответствуют различным опытам, а столбцы – значениям факторов. Будем называть такие таблицы матрицами планирования эксперимента.
Матрица планирования для двух факторов приведена ниже
Каждый столбец в матрице планирования называют вектор-столбцом, а каждую строку – вектор-строкой. Таким образом, мы имеем 2 вектор-столбца независимых переменных и один вектор-столбец параметра оптимизации.
Если для двух факторов все возможные комбинации уровней легко найти прямым перебором (или просто запомнить), то с ростом числа факторов возникает необходимость в некотором приеме построения матриц. Из многих возможных обычно используется три приема, основанные на переходе от матриц меньшей размерности к матрицам большей размерности. Рассмотрим первый. При добавлении нового фактора каждая комбинация уровней исходного плана встречается дважды: в сочетании с нижним и верхним уровнями нового фактора. Отсюда естественно появляется прием: записать исходный план для одного уровня нового фактора, а затем повторить его для другого уровня. Вот как это выглядит при переходе от эксперимента 2 2 к 2 3 :
Этот прием распространяется на построение матриц любой размерности.
Рассмотрим второй прием. Для этого введем правило перемножения столбцов матрицы. При построчном перемножении двух столбцов матрицы произведение единиц с одноименными знаками дает +1, а с разноименными –1. Воспользовавшись этим правилом, получим для случая, который мы рассматриваем, вектор-столбец произведения x 1 x 2 в исходном плане. Далее повторим еще раз исходный план, а у столбца произведений знаки поменяем на обратные. Этот прием тоже можно перенести на построение матриц любой размерности, однако он сложнее, тем первый.
Третий прием основан на правиле чередования знаков. В первом столбце знаки меняются поочередно, во втором столбце они чередуются через два, в третьем – через 4, в четвертом – через 8 и т. д. по степеням двойки.
Свойства полного факторного эксперимента типа 2 k
Мы научились строить матрицы планирования полных факторных экспериментов с факторами на двух уровнях. Теперь выясним, какими общими свойствами эти матрицы обладают независимо от числа факторов. Говоря о свойствах матриц, мы имеем в виду те из них, которые определяют качество модели. Ведь эксперимент и планируется для того, чтобы получить модель, обладающую некоторыми оптимальными свойствами. Это значит, что оценки коэффициентов модели должны быть наилучшими и что точность предсказания параметра оптимизации не должна зависеть от направления в факторном пространстве, ибо заранее неясно, куда предстоит двигаться в поисках оптимума.
Второе свойство – так называемое условие нормировки – формулируется следующим образом: сумма квадратов элементов каждого столбца равна числу опытов, или . Это следствие того, что значения факторов в матрице задаются +1 и –1.
Это свойства отдельных столбцов матрицы планирования. Теперь остановимся на свойстве совокупности столбцов. Сумма почленных произведений любых двух вектор-столбцов матрицы равна нулю, или
.
Это важное свойство называется ортогональностью матрицы планирования.
Последнее, четвертое свойство называется ротатабельностью, т. е. точки в матрице планирования подбираются так, что точность предсказания значений параметра оптимизации одинакова на равных расстояниях от центра эксперимента и не зависит от направления.
Полный факторный эксперимент и математическая модель
Для движения к точке оптимума нам нужна линейная модель . Наша цель – найти по результатам эксперимента значения неизвестных коэффициентов модели. До сих пор, говоря о линейной модели, мы не останавливались на важном вопросе о статистической оценке ее коэффициентов. Теперь необходимо сделать ряд замечаний по этому поводу. Можно утверждать, что эксперимент проводится для проверки гипотезы о том, что линейная модель
адекватна. Греческие буквы использованы для обозначения «истинных» генеральных значений соответствующих неизвестных. Эксперимент, содержащий конечное число опытов, позволяет только получить выборочные оценки для коэффициентов уравнения
. Их точность и надежность зависят от свойств выборки и нуждаются в статистической проверке. Как производится такая проверка, будет показано ниже. А пока займемся вычислением оценок коэффициентов. Их можно вычислить по простой формуле
,
обоснование которой будет приведено ниже. Воспользуемся этой формулой для подсчёта коэффициентов и
:
,
.
Теперь у нас есть все необходимое, чтобы найти неизвестные коэффициенты линейной модели
.
Коэффициенты при независимых переменных указывают на силу влияния факторов. Чем больше численная величина коэффициента, тем большее влияние оказывает фактор. Если коэффициент имеет знак плюс, то с увеличением значения фактора параметр оптимизации увеличивается, а если минус, то уменьшается. Величина коэффициента соответствует вкладу данного фактора в величину параметра оптимизации при переходе фактора с нулевого уровня на верхний или нижний.
Иногда у добно оценивать вклад фактора при переходе от нижнего уровня к верхнему уровню. Вклад, определенный таким образом, называется вкладом фактора (иногда его называют основным или главным эффектом). Он численно равен удвоенному коэффициенту. Для качественных факторов, варьируемых на двух уровнях, основной уровень не имеет физического смысла. Поэтому понятие «эффект фактора» является здесь естественным.
Планируя эксперимент, на первом этапе мы стремимся получить линейную модель. Однако у нас нет гарантии, что в выбранных интервалах варьирования процесс описывается линейной моделью. Существуют способы проверки пригодности линейной модели (проверка адекватности). А если модель нелинейна, как количественно оценить нелинейность, пользуясь полным факторным экспериментом?
Один из часто встречающихся видов нелинейности связан с тем, что эффект одного фактора зависит от уровня, на котором находится другой фактор. В этом случае говорят, что имеет место эффект взаимодействия двух факторов. Полный факторный эксперимент позволяет количественно оценивать эффекты взаимодействия. Для этого надо, пользуясь правилом перемножения столбцов, получить столбец произведения двух факторов. При вычислении коэффициента, соответствующего эффекту взаимодействия, с новым вектор-столбцом можно обращаться так же, как с вектор-столбцом любого фактора. Для полного факторного эксперимента 2 2 матрица планирования с учетом эффекта взаимодействия будет иметь вид
Полный факторный эксперимент
Полный факторный эксперимент (ПФЭ) – совокупность нескольких измерений, удовлетворяющих следующим условиям:
Преимуществами полного факторного эксперимента являются
Содержание
Предварительные сведения
Оценка параметров системы
В практической деятельности часто требуется оценить параметры некоторой системы, то есть построить её математическую модель и найти численные значения параметров этой модели. В качестве исходных данных для построения модели служат результаты эксперимента, который представляет собой совокупность нескольких измерений, выполненных по определённому плану. В простейшем случае план является описанием условий проведения измерений, то есть значения входных параметров (факторов) во время измерения.
В качестве примера систем, оценка параметров которых актуальна с практической точки зрения, могут служить различные технологические процессы. Для иллюстрации рассмотрим процесс фотолитографии.
Фотолитография представляет собой нанесение рисунка на поверхность фотографическим методом. Она состоит из следующих этапов: подготовка поверхности, нанесение фоточувствительной эмульсии (фоторезиста), сушка, установка трафарета или пластины с негативным рисунком, экспозиция (засвечивание) ультрафиолетовыми лучами, травление (проявление). Поскольку технологические тонкости фотолитографии в данном контексте не важны, в качестве основных факторов, влияющих на процесс литографии, будем считать толщину фоточувствительной эмульсии d(в микронах) и время экспозиции t(в секундах). Выходным параметром (откликом) процесса будем считать его разрешение R, то есть максимальное количество различимых линий, которые возможно провести на одном миллиметре поверхности. Эта величина определяется путём нанесения на поверхность специального тестового изображения.
Итак, технологический процесс фотолитографии описывается некоторой функцией вида
Построение модели технологического процесса позволяет выявить поведение отклика системы в зависимости от изменения факторов и тем самый найти пути для оптимизации технологии. Для данного конкретного случая — выбрать такую толщину эмульсии и время экспозиции, которые обеспечат наилучшее качество изображения.
В общем случае отклик системы описывается некоторой функцией переменных
Математическая модель системы получается в результате апроксимации этой функции какой-либо другой функцией, например линейной
,
где – искомые параметры модели.
На рисунке в графическом виде представлен процесс построения линейной модели процесса фотолитографии, где – толщина плёнки фотоэмульсии,
– время экспонирования,
— разрешение, полученное в данных условиях. Функция
нелинейна, однако в достаточной близости от точки
её можно заменить касательной плоскостью
. В показанной на рисунке области максимальная ошибка модели составляет
.
Зная коэффициенты модели , можно с определённой точностью предсказывать значение функции (а значит и поведение системы) в окрестностях точки
. В определении значений коэффициентов
и состоит цель эксперимента.
Матрица эксперимента
Предположим, исходные параметры технологического процесса составляют: толщина плёнки 55 мкм, время экспозиции – 30 с, то есть
Возьмём верхние и нижние значения обоих факторов так, чтобы они располагались симметрично относительно текущего значения, например
Составим таблицу, в которой значения обоих факторов находятся во всех возможных сочетаниях и проведём измерения в этих точках (значения отклика даны условно):
Полагая, что линейная модель процесса имеет вид
,
на основании полученных результатов можно составить систему четырёх уравнений с двумя переменными. Ниже показана эта система, а также её сокращённая запись в виде матрицы. Матрицу данного вида назовём матрицей эксперимента.
В матрице эксперимента второй и третий столбцы представляют собой значения факторов, четвёртый столбец – значения отклика системы, а первый столбец содержит единицы, соответствующие единичным коэффициентам свободного члена модели . Будем считать этот столбец некоторым виртуальным фактором
, который всегда принимает единичные значения.
Решение системы
Чтобы облегчить решение системы, проведём нормировку факторов. Верхним значениям факторов присвоим нормированное значение +1, нижним значениям – нормированное значение –1, среднему значению – нормированное значение 0. В общем виде нормировка фактора выражается формулой
С учётом нормировки факторов система уравнений и матрица эксперимента примут следующий вид:
Поскольку сумма членов во втором и третьем столбце матрицы равны нулю, свободный член модели можно найти, сложив все четыре уравнения:
Чтобы найти какой-либо другой коэффициент модели, нужно изменить знаки в уравнениях таким образом, чтобы в соответствующем столбце оказались одни единицы, после чего сложить все четыре уравнения:
Таким образом, линейная модель технологического процесса в окрестностях точки (55, 30) имеет вид
В общем случае решение системы будет выглядеть как
Возврат к ненормированным факторам
Переход от нормированных к ненормированным факторам осуществляется обратным преобразованием
Чтобы найти параметры модели для ненормированных координат, подставим выражения для нормированных координат в уравнение модели:
Cравнивая последнее выражение с выражением для линейной модели в ненормированных координатах
,
получим выражения для параметров модели:
Для приведённого выше примера
Окончательно получаем модель в естественных координатах:
.
Полный факторный эксперимент
Матрица ПФЭ в общем виде
В общем виде матрица полного факторного эксперимента с n факторами имеет вид
Свойства матрицы ПФЭ
Матрица ПФЭ обладает следующими свойствами:
где – единичная матрица,
;
Вычисление коэффициентов линейной модели
Коэффициенты линейной модели в нормированных координатах вычисляются по формулам:
Коэффициенты линейной модели в естественных (ненормированных) координатах вычисляются по формулам:
Полный факторный эксперимент
; (3.15)
это дает возможность легко построить ортогональную МП и значительно облегчает дальнейшие расчеты, так как в этом случае верхние и нижние уровни варьирования ziв и ziн в относительных единицах равны соответственно +1 и —1 независимо от физической природы факторов, значений основных уровней и интервалов варьирования факторов Dхi.
Если для трехфакторной задачи теоретическое уравнение регрессии относительно нормированных факторов имеет вид
(3.16)
(т. е. степенями факторов выше первой можно пренебречь), то ПФЭ дает возможность найти раздельные оценки коэффициентов bi. Так как изменение выходной величины у носит случайный характер, то имеется возможность определить лишь выборочные коэффициенты регрессии bi,bil для оценивания теоретических коэффициентов bi,bil. Процесс нахождения модели (идентификации) методом ПФЭ состоит из: 1) планирования эксперимента; 2) проведения эксперимента на объекте исследования; 3) проверки воспроизводимости (однородности выборочных дисперсий эксперимента; 4) получения математической модели объекта с проверкой статистической значимости выборочных коэффициентов регрессии; 5) проверки адекватности математического описания.
1.1 Планирование эксперимента. Матрицу планирования ПФЭ можно представить в виде табл. 3.2. Ее составляют по следующим правилам:
Таблица3.2
1. Каждая g-я строка матрицы содержит набор координат zigточки, в которой проводится g-й опыт (i= 1,2. п; g= 1,2. N).
2. Как указывалось выше, вводят фиктивную переменную zo=+1.
1.2 Проведение эксперимента на объекте исследования.Так как изменение отклика у носит случайный характер, то в каждой точке приходится проводить т параллельных опытов и результаты наблюдений yg1, yg2. ygm осреднять:
. (3.17)
Пусть в рассматриваемом случае m=3. Перед реализацией плана на объекте необходимо рандомизировать варианты варьирования факторов, т.е. с помощью таблицы равномерно распределенных случайных чисел (литерат) или компьютерной программы для реализации процесса рандомизации определить последовательность реализации вариантов варьирования плана в Nm опытах. Пример рандомизации (g=8, m=3), приведен в таблице 3.1. Пусть, например, k1=8 при g=3; это значит, что третий вариант варьирования реализуется в эксперименте восьмым по порядку. Результаты наблюдений эксперимента соответственно вариантам варьирования плана записывают в столбцы
.
1.3 Проверка воспроизводимости эксперимента есть не что иное, как проверка выполнения второй предпосылки регрессионного анализа об однородности выборочных дисперсий . Задача состоит в проверке гипотезы о равенстве генеральных дисперсий
при опытах соответственно в точках
. Оценки дисперсий находят по известной формуле:
. (3.18)
Так как все оценки дисперсий получены по выборкам одинакового объема т =3, то число степеней свободы для всех них одинаково и составляет
В этом случае для проверки гипотезы об однородности оценок дисперсий следует пользоваться критерием Koxpэнa, который основан на законе распределения отношения максимальной оценки дисперсии к сумме всех сравниваемых оценок дисперсий, т.е.;
. (3.20)
Если вычисленное по данным эксперимента (эмпирическое) значение критерия G окажется меньше критического значения Gкр, найденного по таблице (литерат) для n1вос=m-1 и n2вос=N (в данном случае n1вос =2 и n2вос=8) и выбранного уровня значимости qвос [%] (обычно 5 %), то гипотеза об однородности выборочных дисперсий отвечает результатам наблюдений. При этом всю группу выборочных дисперсий можно считать оценками для одной и той же генеральной дисперсии s 2 воспроизводимости эксперимента, откуда наилучшая ее оценка имеет вид
(3.21)
с числом степеней свободы
Если проверка воспроизводимости эксперимента дала отрицательный результат, то остается признать его невоспроизводимость относительно управляемых факторов вследствие наличия неблагоприятных флуктуаций неуправляемых и неконтролируемых факторов. При этом следует либо увеличить число параллельных опытов для вариантов варьирования с большими значениями выборочных дисперсий , либо использовать в дальнейшем модификацию метода наименьших квадратов, пригодную при невыполнении предпосылки о воспроизводимости эксперимента.
1.4 Получение математический модели объекта. При ПФЭ получаются независимые оценки bo, bi, bil соответствующих коэффициентов bo, bi, bil, т. е. bo®bo, bi®bi, bil®bil. Эти оценки легко найти по формулам
, (3.23)
(i;l=1,2. n;i¹l).
После определения оценок b коэффициентов регрессии необходимо проверить гипотезы об их значимости, т. е. проверить соответствующие нуль-гипотезы b=0. Проверку таких гипотез производят с помощью критерия Стьюдента, эмпирическое значение которого
, (3.24)
(3.25)
—дисперсия оценки b коэффициента; N— число точек факторного пространства, в которых проводится эксперимент; т— число параллельных опытов в этих точках. Если найденная величина параметра t превышает значение tкр, определенное из Приложения V для числа степеней свободы nзи=N(m-1), при заданном уровне значимости qзи (обычно 5’%), т. е. sign (t-tкр) = +1, то проверяемую нуль-гипотезу Но:b=0 отвергают и соответствующую оценку b коэффициента признают значимой.
Статистическая незначимость оценки bi коэффициента регрессии может быть обусловлена следующими причинами:
1) данный i-й фактор не имеет функциональной связи с откликом у, т. е. bi=0;
2) уровень хio базового режима находится в точке частного экстремума функции отклика по фактору хi и тогда
;
3) интервал варьирования Dxi выбран малым;
4) вследствие влияния неуправляемых и неконтролируемых факторов велика ошибка воспроизводимости эксперимента.
Ортогональное планирование позволяет определять доверительные границы независимо для каждого из коэффициентов регрессии. Потому если какая-либо из оценок коэффициентов окажется незначимой, то ее можно отбросить без пересчета всех остальных. После этого математическую модель объекта составляют в виде, уравнения связи отклика у и факторов г„ включающего только значимые оценки коэффициентов.
1.5 Проверка адекватности математического описания. Чтобы проверить гипотезу об адекватности математического описания опытным данным, достаточно оценить отклонение предсказанной по полученному уравнению регрессии величины отклика от результатов наблюдений
в одних и тех же g-х точках факторного пространства. Рассеяние результатов наблюдений вблизи уравнения регрессии, оценивающего истинную функцию отклика, можно охарактеризовать с помощью дисперсии адекватности
, (3.26)
где d — число членов аппроксимирующего полинома. Дисперсия адекватности определяется с числом степеней свободы
Проверка гипотезы об адекватности состоит, по сути дела. в выяснении соотношения между дисперсией адекватности и оценкой дисперсии воспроизводимости отклика
. Если эти оценки дисперсий однородны, то математическое описание адекватно представляет результаты опыта; если же нет, то описание считается неадекватным. Проверку гипотезы об адекватности производят с использованием F-критерия Фишера. Критерий Фишера позволяет проверить гипотезу об однородности двух выборочных дисперсий
и
<у>— В том случае, если
, F-критерий характеризуется отношением
(3.28)
Если вычисленное по результатам наблюдений эмпирическое значение критерия F меньше критического Fкр, найденного из (литерат) для соответствующих степеней свободы
при заданном уровне значимости qад, то гипотезу об адекватности не отвергают. В противном случае гипотезу отвергают и математическое описание признается неадекватным.
Проверка адекватности возможна при n1ад> 0. Если число N вариантов варьирования плана ПФЭ равно числу всех значимых оценок коэффициентов регрессии (N =d), то для проверки гипотезы об адекватности математического описания степеней свободы не остается (n1ад= 0). Если же некоторые оценки коэффициентов регрессии оказались незначимыми, то число d членов проверяемого уравнения в этом случае меньше числа N вариантов варьирования
В том случае, когда гипотеза об адекватности отвергается, необходимо переходить к более сложной форме математического описания либо, если это возможно, проводить эксперимент с меньшим интервалом варьирования Dхi. Следует отметить, что максимальная величина интервала варьирования определяется условием адекватного описания объекта в области варьирования. Если при больших интервалах варьирования математическая модель неадекватна, то возникают систематические ошибки в определении коэффициентов, для уменьшения которых следует сузить область варьирования. Однако с уменьшением интервала варьирования появляется целый ряд новых трудностей: растет отношение помехи к полезному сигналу, что приводит к необходимости увеличивать число параллельных опытов для выделения полезного сигнала на фоне шума, т. е. уменьшаются абсолютные значения оценок bi, коэффициентов, величины которых непосредственно зависят от Dxi;(для уравнения c нормированными факторами zi), и оценки коэффициентов могут стать статистически незначимыми.
Для выбора интервала варьирования проводят предварительные эксперименты. Интервал варьирования можно выбирать равным 0,05—0,3 от допустимого диапазона варьирования факторов, т.е. область варьирования составляет примерно 10—60% от всего диапазона. Начальную точку варьирования (базовую точку) выбирают возможно ближе к центру области факторного пространства, в которой ищется математическое описание объекта (или области ограничений).