Формализация результатов эксперимента

Для того, чтобы провести разграничение между хорошо и плохо поставленными экспериментами, построить теорию эксперимента, необходимо формализовать представления о хорошем эксперименте. Для этого разобьем все возможные эксперименты на две группы. К одной из них отнесем те задачи, в которых нужно решить вопрос о том, как наилучшим образом расположить экспериментальные точки в пространстве независимых переменных. Такие задачи будем несколько условно называть пространственно локализованными или статическими [7, 12,13].

Ко второй группе отнесем динамические задачи, в которых приходится заботиться о стратегии исследования в целом, полагая, что в этом случае исследование распадается на серию последовательно проводимых локальных экспериментов.

Формализация представления о хорошем статическом эксперименте начинается с рассмотрения свойства всех возможных матриц планирования эксперимента в некоторой, заранее заданной, области пространства независимых переменных. Этому предшествует задание той модели, ради оценки параметров которой ставится эксперимент.

Таким образом, формализация представлений о хорошем эксперименте начинается с записи модели. Модель можно записать в виде полинома первой степени для трех независимых переменных и для оценки ее параметров можно составить матрицу планирования эксперимента, таблица 1.1.

Таблица 1.1 — Матрица планирования эксперимента для линейной

модели с тремя независимыми переменными

Номер опыта

Матрица коэффициентов X

Результаты эксперимента

х0

План эксперимента

*2

*3

1

+ 1

+ 1

-1

-1

Уі

2

+ 1

-1

+ 1

-1

У2

3

+ 1

-1

-1

+ 1

Уз

4

+ 1

+ 1

+ 1

+ 1

______Уа______

Запишем модель в виде неполного полинома второй степени г], для двух независимых переменных, вычисляют по формуле

  • 7/ — 0о + OjX-L + 02Х2 3" ®12Х1Х2-
  • (1.1)

где х — независимая переменная.

Для оценки параметров здесь можно предложить план эксперимента, представленный в таблице 1.2.

Таблица 1.2 — Планирование эксперимента для модели с двумя независимыми переменными, включающей эффект взаимодействия между переменными

Номер опыта

Матрица коэффициентов

Результаты эксперимента

х0

Х2

Х2

1

+ 1

+1

-1

-1

У1

2

+ 1

-1

+1

-1

У2

3

+ 1

-1

-1

+1

Уз

4

+ 1

+1

+1

+1

______Уа______

Сама матрица X здесь выглядит так же, как и матрица, приведенная в таблице 1.1: по строчкам и столбцам в одном и том же порядке расставлены одни и те же элементы. Но во втором случае, над последним столбцом указано, что он относится к произведению хгх2, т. е. служит для оценки параметра 012. Если мы пользуемся моделью без взаимодействия в случае, когда коэффициенты регрессии для эффектов взаимодействия не равны нулю, то в этом случае оценки 0^,02, Оз, полученные методом наименьших квадратов, должны будут интерпретироваться так как они являются оценками для сумм некоторых параметров. Здесь мы имеем дело уже со смешанными оценками: четыре опыта не дают нам возможности сделать больше, чем оценить раздельно четыре коэффициента регрессии:0о,0і,02, 03, вычисляют по формуле

01 -> 01 + 023,02 -> 02 + 013,03 -> 03 + 0І2, (1.2)

Разделить оценки на их парные составляющие мы здесь не можем. Таким образом, матрица X приобретает истолкование в терминах эксперимента тогда, когда она связывается с какой-либо моделью. Рассматривая план хорошего эксперимента для взвешивания трех объектов А, В. С, не приводя при этом модели, такой план можно было построить, только имея хотя бы в уме модель процесса взвешивания ту, вычисляют по формуле.

0 = 0О + 0і%і + 02х2 + 03х3, (1.3)

где Xj — переменные, принимающие только два значения «+1» и «-1» в зависимости от того, помещен или не помещен взвешиваемый объект на (весы);

0 - коэффициент регрессии.

Смысл формулы 1.3 заключается в том, что мы признаем аддитивность процедуры взвешивания, не допуская в ней существования эффектов взаимодействия. При интерпретации этой модели 0, вычисляют по формуле

  • -;02
  • 2 z 2

ИЛИ

(1.4)

А + В + С Оо -----э--Ь Во ?

где ц0- возможное смещение нулевой точки;

А, В, С - рассматриваемые объекты.

Коэффициент в0 при процедуре взвешивания нам практически вычислять не нужно; в матрице, приведенной в таблице 1.2 мы записали столбец, состоящий только из «+1», ио в модели коэффициент 0О должен быть записан, чтобы она адекватно отражала результаты взвешивания по каждой строке 1. Допустим, что мы имеем дело с моделью, нелинейной по параметрам, скажем, с экспонентой или суммой экспонент. В общем виде запишем модели такого типа следующим образом 77, вычисляют по формуле

т) = (р (х, в), (1-5)

гдех — вектор независимых переменных;

в - вектор параметров модели.

Если мы хотим оценить методом наименьших квадратов параметры по результатам наблюдений, то нам надо будет линеаризовать нелинейную по параметрам функцию, разлагая ее в ряд Тайлора в окрестности некоторой точки 0О. В результате мы приходим к рассмотрению информационной матрицы Хт X, полученной из матрицы независимых переменных X размера N х к, вычисляют по формуле

Х={х„),

[д<р(хи,0)1 Q Q а

где хги = ——— у = 80 - есть частная производная по параметру Угв L двг J

точке в = в0 при значениях х, ??? >хпи, соответствующих условиям некоторого опыта.

Мы видим, что если модель задана нелинейно, то для оценки ее параметров нам надо опять находить матрицур^Х)'1. Однако это можно сделать только в том случае, если нам известен не только вид функции, но и еще какие-то, хотя бы очень грубые оценки ее параметров. Оценки параметров в процессе эксперимента улучшаются и в соответствии с этим, естественно, должен изменяться оптимальный план эксперимента. В этой ситуации исследование разбивается на ряд последовательных шагов. На каждом шаге ставится некоторое число опытов и после этого происходят переоценка коэффициентов и изменение плана. Такая стратегия планирования называется последовательной.

Итак, мы видим, что, как только оказываются заданными модель изучаемого явления и план, сразу же появляется возможность написать матрицу независимых переменных X, а затем и ковариационную матрицу (ХТХ)-1. Последняя позволяет нам высказывать суждения о качестве оценок параметров изучаемой модели по результатам эксперимента [12]. Если мы хотим изменить в том или ином направлении качество оценок параметров или модели в целом, то мы должны каким-то специальным образом задавать матрицу X.

Планирование локального эксперимента, безусловно, возможно во всех тех случаях, когда еще перед началом исследования можно сформулировать предварительные знания в виде математической модели. Практически это возможно сделать во всех случаях, когда исследователь изучает что-то, о чем он имеет хотя бы весьма смутное представление общетеоретического характера. Даже работы вспомогательного, чисто препараторского характера, требующие, прежде всего необычайного искусства от исследователя, могут быть представлены моделями хотя бы такого типа, как рассмотренная выше модель взвешивания. Для этого надо уметь выделить те факторы, которыми реально может управлять, и записать предлагаемые взаимоотношения. Явно невозможно записать модели для открытий, скажем, для открытия такого типа, каким было открытие радиоактивности, сделанное Беккерелем. Таким образом, мы видим, что логически продуманная постановка исследования включает в себя выбор модели, с одной стороны, и выбор плана эксперимента, оптимального в каком-то смысле для этой модели, с другой. Решение плана связано с глубоким знанием объекта исследования; решение оптимизационной задачи совершенно не зависит от объекта исследования.

Запись изучаемой проблемы в виде математической модели позволяет достичь такого уровня формализации, при котором мы можем полностью абстрагироваться от физического содержания задачи. К миру физической реальности исследователь должен возвращаться только на последнем этапе своего исследования — при интерпретации модели. Далее будем рассматривать только решение оптимизационной задачи. Это позволит вести изложение в достаточно абстрактном плане, отвлекаясь почти полностью от обсуждения физического смысла при постановке задач в той или иной конкретной области знания.

Допустим, что дана модель изучаемого явления. Задача построения оптимальных планов эксперимента сводится к тому, что нужно сначала на чисто логическом уровне рассмотреть те требования, которыми может характеризоваться «хорошая оценка модели»; далее необходимо связать эти требования со свойствами ковариационной или информационной матрицы и в соответствии с этим найти отвечающую этим требованиям матрицу плана эксперимента. При этом, конечно, заранее должна быть задана та область пространства независимых переменных, где будет ставиться эксперимент. Это может быть многомерный куб, шар, правильный симплекс или какая-нибудь совсем несимметричная область. Во многих случаях задача сводится просто к заданию свойств матриц некоторыми скалярными характеристиками и попытке найти связь между этими характеристиками и статистическими свойствами моделей.

В такой постановке появляется потребность минимизации объема эллипсоида рассеяния оценок параметров уравнения регрессии. Это требование будет выполнено, если мы найдем на множестве планов с заданным числом измерении план с такой матрицей независимых переменных X, что детерминант матрицы (ХГХ) будет максимален или, что то же, минимален детерминант ковариационной матрицы (ХТХ)-1. Такие планы называются D-оптимальными. Таким образом, одно из важнейших статистических свойств модели задается всего одним числом — детерминантом матрицы. Однако такое число полностью не определяет характера рассеяния оценок коэффициентов регрессии — объем эллипсоида рассеяния может быть минимальным, но сам эллипсоид может оказаться слишком вытянутым по одной из своих осей. Если исследователь хочет минимизировать максимальную ось эллипсоида рассеяния, то он должен суметь построить такую матрицу плана, которой бы соответствовала ковариационная матрица с минимальным значением максимального характеристического числа. Это будет так называемый Е-оптимальный план.

Например, необходимо, чтобы минимальной была средняя дисперсия оценок коэффициентов регрессии. Этому требованию удовлетворяют эллипсоиды рассеяния с наименьшей суммой квадратов длин осей. Соответствующие планы называются А-оптимальными; относящиеся к ним ковариационные матрицы имеют наименьшие значения следа. Здесь необходимо отметить только, что, как правило, за исключением некоторых очень простых моделей, нельзя предложить плана, который бы отвечал одновременно всем или хотя бы нескольким важнейшим критериям оптимальности. Нужно искать компромиссное решение. В этом и состоит важнейшая задача планирования эксперимента.

Чтобы выполнить задачу планирования эксперимента, приходится, пользуясь численными методами, строить планы, соответствующие какому-нибудь одному критерию, а затем оценивать для этих планов численные характеристики, соответствующие другим критериям, и в завершение выбирать на множестве всех планов наилучшее компромиссное решение. Такую задачу оказалось возможным решить только частично. Трудность здесь состоит в том, что далеко не все желательные нам свойства планов можно хорошо оценить численно. Если мы, например, имеем дело с D-оптимальностью, то здесь все обстоит вполне благополучно [13]. Достаточно найти для некоторых заданных условий D-оптимальный план и тогда для любого другого плана, построенного в той же области значений независимых переменных, мы можем оценить отклонение от D-оптималыюсти (отклонение от минимального значения определителя |(ХГ Х)-1Л/|), и эта оценка даст вполне четкое представление о том, насколько увеличился объем эллипсоида рассеяния.

Тогда появляется возможность оценивать с позиций D-оптимальности планы, построенные в соответствии с какими-нибудь другими требованиями. Ничего подобного нельзя сделать с критерием ортогональности. Для ортогонального плана мы можем задать числовую меру: отношение Псіі/|тХ)“11, где Сц это диагональные элементы матрицы тХ)~г, должно быть равно единице. Отклонение значения этого отношения от единицы для неортогональных планов недостаточно, так как одно и то же числовое значение отклонения может характеризовать планы, в которых один раз какой-нибудь один коэффициент регрессии (окажем, 0О) будет сильно закоррелирован только со всеми коэффициентами типа 0ц, в другой раз план, в котором все коэффициенты регрессии, хотя и в меньшей степени, будут закоррелираваны друг с другом. При интерпретации модели мы будем иметь дело с существенноразличными ситуациями. Не удается придумать такую компактную меру неортогональности, которая бы отчетливо характеризовала степень коррелированности различных параметров в модели.

Планирование эксперимента может использоваться для дискриминации конкурирующих гипотез, т.е. для выбора лучшей из нескольких предложенных априори. Здесь можно говорить о том, что ведется поиск модели, задающей механизм явления, на самом деле с помощью планирования эксперимента отбирается только та модель, которая обладает наилучшей интерполяционной силой в области, отведенной для исследования. Формализация наших представлений об эксперименте и введение в обиход таких понятий, как «эффективность плана», «выбор оптимальной модели», не должны искажать реальный физический смысл того, что мы при этом имеем в виду.

Когда речь идет о динамических задачах — о стратегии всего исследования, таких возможностей в планировании нет. Приходится каждый раз придумывать какую-то новую, подходящую для данного конкретного случая систему действия, записывать ее на математическом языке. С другой стороны сейчас накопилось много хорошо продуманных высказываний о стратегиях исследования в широкой постановке задачи.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >