Список критериев

Предположим, что модель выбрана правильно, т. е. в измерениях отсутствует систематическая ошибка относительно данной модели. Это значит, что при выборе критерия оптимальности основное внимание следует обратить на случайную ошибку. Нас интересует точность самих оценок параметров, которая полностью описывается их ковариационной матрицей, а также точность оценки модели в интересующей нас области, которая представляет собой функцию, зависящую от ковариационной матрицы оценок. Поэтому критерии оптимальности плана должны определять некоторые желательные свойства ковариационной (или обратной информационной) матрицы. Здесь можно обратиться к свойствам лучших линейных оценок и потребовать, чтобы выбираемый нами план был «лучше» других планов, т. е. чтобы ему соответствовала «наименьшая» ковариационная матрица. Но, как правило, ие удается найти планов, имеющих «минимальную» ковариационную матрицу, поэтому план приходится характеризовать некоторым функционалом матрицы.

Разобьем все статистические критерии на две большие группы. К первой группе отнесем критерии, связанные с точностью оценок параметров, ко второй — критерии и свойства планов, связанные с ошибкой в оценке модели.

Свойствам оценок параметров можно дать наглядное геометрическое истолкование, связав эти свойства со свойствами их эллипсоида рассеяния. Пусть величины 9г, ...,9к имеют распределение с математическим ожиданием в и центральными моментами второго порядка cit(i,j = Рассмотрим к-

мерный эллипсоид, центр которого совпадает с 9. Допустим, что плотность распределения вероятности в этой области постоянна. Моменты второго порядка этого распределения можно подобрать таким образом, чтобы они совпадали с Сц. Величины 9 и Сц(і,] = 1,./с) определяют параметры эллипсоида, который называется эллипсоидом рассеяния. Для данного метода оценки ориентировки форма и объем этого эллипсоида будут полностью зависеть от плана. Сначала остановимся на критериях первой группы.

D-оптималыюсть. В теоретических исследованиях по планированию эксперимента большое внимание уделяется критерию D-оптимальности (по начальной букве слова determinant). Планам ?*, оптимальным по этому критерию, соответствует наименьший на множестве планов определитель ковариационной матрицы, вычисляют по формуле

D (є*)| = тт|?)(є)| (1.19)

Эллипсоид рассеяния оценок параметров для D-оптимального плана имеет минимальный объем. Для некоторых типов моделей разработаны методы построения D-оптимальных планов. Критерию D-оптимальности уделено особое внимание в работах американского математика Кифера и его школы. Кифер доказал наиболее общие положения, касающиеся связи критерия D-оптимальности с некоторыми другими критериями и разработал отдельные способы построения D-оптимальных планов. А-оптимальность. Планам, отвечающим критерию А-оптимальности (название происходит от выражения average variance, т. е. средняя дисперсия оценок), соответствует эллипсоид рассеяния с наименьшей суммой квадратов длин осей. В этом случае параллелепипед, описанный около эллипсоида рассеяния, имеет наименьшую длину диагонали [7, 12, 13]. Этому критерию отвечают планы с минимальной средней дисперсией оценок коэффициентов или с наименьшим значением следа (trace) ковариационной матрицы, вычисляют по формуле

tr ?>(?*) = min tr 0(f) (1.20)

Е-оптимальность. Е-оптимальным планам соответствует наименьшее максимальное собственное значение (eigen value) ковариационной матрицы е*, вычисляют по формуле

Лтах(^ (е*)) = тштахЛДО(е)), (1.21)

где Л/ — собственное значение матрицы D(s).

Выбирая этот критерий, мы как бы не допускаем, чтобы отдельные оценки параметров имели слишком большие дисперсии и ковариации. Геометрически таким планам соответствует эллипсоид рассеяния с наименьшей максимальной осью.

Ортогональность. К критериям можно отнести также такой критерий, как ортогональность плана. План называется ортогональным, если ему соответствует диагональная ковариационная (информационная) матрица оценок. Для ортогональных планов все оценки параметров независимы.

Этот критерий не требует минимизации какого-либо функционала, однако он связан со свойствами эллипсоида рассеяния: для ортогональных планов эллипсоид ориентирован в пространстве параметров таким образом, что направления его главных осей совпадают с направлениями координатных осей в пространстве параметров. Можно попытаться количественно оценить близость заданного плана к ортогональному с помощью некоторой скалярной функции матрицы D(e). В качестве такой функции можно было бы выбрать, как об этом уже говорилось выше, величину Пі=і Сц/1D | (где Сц - диагональные элементы D(e)).

Для ортогональных планов эта величина равна единице. Но такая функция не позволяет различать планы, дающие, например, малую закоррелированность оценкам многих параметров и значительную закоррелированность оценкам двух или трех параметров. Практически, для оценки ортогональности можно пользоваться, например, функцией max |pi7|(i #= у), где ptj — коэффициент корреляции оценок параметров регрессии, т. е. характеризовать отличие плана от ортогонального максимальным коэффициентом корреляции или функцией (? pfj:/к(к — 1)). Но ни одна из этих функций, конечно, не позволяет дать представление о структуре корреляционной матрицы оценок параметров. Рассмотрим теперь критерии оптимальности второй группы, связанные с ошибкой оценки поверхности отклика.

G-оптимальность. G-оптимальные планы минимизируют на множестве планов максимальное значение дисперсии оценки модели, или величины d (х, е); план є* G-оптимален, если выдерживается следующее равенство, вычисляют по формуле max d (x, ? *) = min max d (x, г).

(1.22)

X EX

Применение G-оптимального плана как бы дает экспериментатору гарантию, что в области планирования не окажется точек, в которых точность оценки поверхности отклика слишком низкая.

Q-оптимальность. Можно требовать от плана минимизации средней дисперсии оценки модели. План є* называется Q-оптимальным, если выдерживается следующее равенство, вычисляют по формуле

d (х, ? *) d х = min

Е

d (х, ?)dx

(1.23)

Ротатабельность. План называется ротатабельным, если дисперсия оценки модели может быть представлена как функция расстояния до центра эксперимента, т. е. можно записать следующее равенство, вычисляют по формуле

d (х, є) = (^(г, є), (1.24)

где г = хі ~ обобщенный параметр.

Выполнение этого условия делает любое направление от центра эксперимента равнозначным в смысле точности оценки поверхности отклика. Если «информационные контуры» плана представить как поверхности с равными значениями дисперсии оценки модели, то для ротатабелыюго плана эти поверхности будут представлять собой сферы.

Максимальная точность оценки координат экстремума. Иногда выдвигается такое требование, как максимальная точность оценки координат точки экстремума ? *, вычисляют по формуле

dэ, ? *) = min d (x„ e)

(1.25) где хэ координаты экстремума оценки поверхности отклика.

Как правило, при изучении поверхности отклика необходимыми этапами бывают и построение модели, и ее последующее исследование, в частности определение или уточнение положения точек экстремума. Для построения планов, минимизирующих дисперсию оценки поверхности отклика в области экстремума, необходимо иметь предварительную грубую оценку его положения.

Униформность. Это критерий, требующий, чтобы дисперсия оценки модели в некоторой области вокруг центра эксперимента была практически постоянной.

Оптимальность планирования для проверки гипотезы о неадекватности модели. Иногда же, наоборот, план может выбираться так, чтобы по возможности в лучших условиях проверить гипотезу о неадекватности модели, если мы предполагаем, что в области планирования верна некоторая более сложная модель.

Почти всегда можно предполагать, что на изучаемое явление влияют некоторые факторы, которые мы не регистрируем в процессе исследования. Как правило, изменение уровней этих «мешающих» факторов в течение всего эксперимента имеет некоторый систематический характер. Допустим, опыт в эксперименте поставлен так, что характер изменения независимых переменных также будет иметь некоторый неслучайный характер, например в первой половине всех измерений один из факторов хг будет зафиксирован на верхнем уровне, а во второй половине — на нижнем. В этом случае мы рискуем получить некоторый ложный эффект, который будет фактически обусловлен влиянием «мешающих» факторов, но будет отнесен нами к эффекту фактора хг. Если же мы сознательно будем вносить элемент случайности в очередность измерений, то влияние неконтролируемых факторов сведется к некоторому увеличению случайного разброса, т. е. к увеличению дисперсии одного наблюдения. Поэтому можно записать еще один критерий оптимальности планирования.

Рандомизация. Это случайный порядок проведения измерений. Решение о необходимости рандомизации может повлиять и собственно на выбор точек плана, так как иногда может оказаться, что выбор определенных условий измерений ограничивает возможность рандомизации. Рандомизация может производиться не только для исключения влияния переменных, неконтролируемым образом изменяющихся во времени, но также и для исключения влияния переменных, изменяющихся неконтролируемым образом в пространстве (например, неоднородности материала, подлежащего исследованию).

Насыщенность. Очень часто существенным является требование, чтобы план содержал небольшое число измерений. Если число измерений равно числу неизвестных параметров, которые нужно оценить, то план называется насыщенным; планы с меньшим числом измерений не позволяют найти единственные оценки всех параметров. Обычно на практике используются планы, по числу измерений близкие к насыщенным.

Композиционность. Это свойство, позволяющее разделить эксперимент на несколько этапов и постепенно переходить от простых моделей к более сложным, используя предыдущие наблюдения. Например, сначала ставится план для оценки коэффициентов полинома первого порядка; при этом желательно, чтобы, кроме невырожденности, план обладал и другими оптимальными свойствами. В случае необходимости на втором этапе к имеющемуся плану добавляется несколько наблюдений, так что все вместе они дают возможность оценить все коэффициенты полиномиальной модели второго порядка и т.д.

Простота обработки. Практически важным оказывается требование простоты вычислений. Для других планов, использующихся на практике, вся обработка результатов эксперимента может проводиться вручную по простейшим формулам. Если выбранная модель — полином второго порядка, то большинству планов, удовлетворяющих приведенным здесь критериям оптимальности, соответствуют информационные матрицы блочной структуры с большим числом нулевых элементов. Это, как правило, позволяет записать удобные для ручного счета формулы для получения оценок параметров.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >