Критерии оптимальности плана экспериментального исследования
Оптимальность планов
Введем допущение, что наши знания об изучаемом явлении оказались формализованы в такой степени, что появилась возможность записать математическую модель. Тогда задача эксперимента сведется к оценке параметров модели. Эксперимент надо поставить так, чтобы параметры можно было оценить некоторым наилучшим способом. Мы хотим получить «хорошую» модель в статистическом смысле этого слова. Свойство модели быть «хорошей» нельзя задавать одним требованием. Формируемые требования будем называть критериями оптимальности плана [12, 13].
Предположим, что связь между измеряемой величиной у(х) и контролируемыми переменными х1(х2, ...,хп (факторами) может быть записана в виде математической модели Е {у (х)} - функции, вычисляют по формуле
Е {у (*)} = Л (х>
где Е {у (х)} - математическое ожидание величины у(х), измеренной в точке с координатами Хт = (х1л..., хп).
Ошибки измерений независимы и имеют нулевое математическое ожидание. Функция г] (х, 0), зависит от неизвестных параметров (01,... ,0п~). Выбранная модель должна в заданной области изменения факторов х1,х2, ...,хп давать удовлетворительное представление о функции отклика — некоторой истинной зависимости изучаемого явления от этих факторов.
Основное внимание здесь уделим моделям, представляющим собой линейные функции неизвестных параметров 0^; будем называть их линейными моделями. Такую модель запишем в следующем виде Е {у (х)}, вычисляют по формуле
Е {у (х)} = т] (х, 0) = Д (х)0і+ ... + /к(х)0к = fT(x)9,
(1.8)
где /г(х) = (Д (х),..., Д (х)) - вектор известных функций от независимых переменных.
Частным случаем линейных моделей являются также модели, которые обычно принято использовать при изучении влияния факторов качественного характера. Это так называемые модели эффектов уровней, которые обычно записываются в виде системы равенств. Для двух факторов, например, с и S2 уровнями соответственно эта модель Y]ij, вычисляют по формуле
9ij = ц + at+ (3j + Yij(i = U-9)
где |i - истинное среднее;
- эффект z-того уровня первого фактора;
Д - эффект j-того уровня второго фактора;
Yij - эффект взаимодействия этих уровней.
Область в пространстве переменных х1,...,хп в которой мы считаем модель справедливой и в точках которой возможно экспериментально получить отклик у, будем называть областью планирования.
Предположим, что мы имеем N результатов измерений величины у для тех значений независимых переменных xt которые не выходят за пределы области планирования гё. Для получения оценок неизвестных параметров 9L модели (2.2) используем метод наименьших квадратов. Этот метод можно предпочесть другим, так как он позволяет получить лучшие линейные оценки параметров.
Обозначим через 9 вектор оценок параметров по методу наименьших квадратов, а через 9 — вектор линейных несмещенных оценок, полученных любым методом. Линейными оценками называются оценки, представляющие собой линейные функции наблюдений у, оценки в[ называются несмещенными, если их математические ожидания равны истинным значениям параметров Пусть матрица De будет ковариационной матрицей оценок параметров. При заданном плане измерений наилучшие линейные оценки параметров обладают среди всех линейных несмещенных оценок наименьшей ковариационной матрицей Dg, вычисляют по формуле
Dd=Dd-d (1-Ю)
где d - некоторая неотрицательно определенная матрица.
Более кратко формулу 1.10 можно записать в следующем виде Dg, вычисляют по формуле
Dd < D-e (l.H)
Вследствие этого наилучшие линейные оценки имеют наименьшую обобщенную дисперсию, или определитель ковариационной матрицы ?>g, вычисляют по формуле
Раї < ЮаІ (1|2)
А также наименьшую среднюю дисперсию или след этой матрицы ~tr D-q, вычисляют по формуле
±trDs < ytrDg <113>
к 0 к 0
где к — зависимая переменная;
t - величина дисперсии;
г - след матрицы.
Теперь предположим, что можно выбирать не только метод обработки, но и координаты точек, в которых могут быть поставлены наблюдения, т. е. планировать измерения. Имеющиеся в нашем распоряжении N измерений осуществляем в любых точках области гё; в некоторых точках можно поставить ие одно, а несколько наблюдений. Планом будем называть множество точек Xi(i = 1, ...,т) в области аё, в которых производятся наблюдения (спектр плана), и соответствующие им значения їщ — число наблюдений в каждой из этих точек. Общее число наблюдений есть N = План будем
обозначать через Е, вычисляют по формуле
т

І-1
(1.14)
Введем понятие нормированного плана. Нормированный план е — это совокупность спектра плана и относительных весов, долей наблюдения в каждом из точек спектра, вычисляют по формуле

(1.15)
Введем некоторые обозначения. Можно показать, что при заданном плане метод наименьших квадратов приводит к получению лучших линейных оценок в вектора параметров 0, вычисляют по формуле
= (ХГХ)-1 XTY
(1.16)
где Y - вектор наблюдений в точках плана;
X - матрица значений функций ^(х) в точках плана, т. е. матрица с элементами.
Матрица X называется матрицей коэффициентов, или матрицей независимых переменных. Особую роль в планировании эксперимента играет информационная матрица плана А = ХТХ с элементами а^, вычисляют по формуле
m
an = (1.17)
1-і
і
Матрица М = —А называется нормированной информационной матрицей. Ковариационная матрица лучших линейных оценок параметров записывается как <т2Л-1, где <т2 — дисперсия ошибки опыта. Нормированная ковариационная матрица — это матрица обозначим её через a2D.
Дисперсию оценки модели г/, вычисляют по формуле
сг2{?7} = cr27V-1cZ(x) (1-18)
Таким образом, дисперсия оценки модели с точностью до константы равна с/(х). Для линейных моделей информационная и ковариационная матрицы зависят только от выбора координат точек плана и не зависят от истинных значений оцениваемые параметров.