Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Вычислительные и экспериментальные методы научного эксперимента
Посмотреть оригинал

Эффективность и робастность оценок

Теорема Маркова гласит [52, 80] о том, что эффективной (с минимальной дисперсией) линейной оценкой математического ожидания

1 п

является выборочное среднее х =—Ух,- элементов независимой вы-

Л|=1

борки, напрашивается вопрос, а не существует ли более эффективная нелинейная оценка. Ответ на этот вопрос предопределен теоремой (неравенством) Рао — Крамера [52J о нижней границе дисперсии оценки.

Если плотность распределения случайной величины f(x, а) имеет

первый момент vj (а) и конечный второй момент, а также существует

df df , ч „ / ч

частная производная — по параметру а и —гЛх) и

да да

xF0(x) — функции, интегрируемые на (-оо,оо), то нижняя граница дисперсии оценки есть

где математическое ожидание квадрата производной от логарифма по параметру равно

Если имеются две оценки а и а*, причем /)[а*]

Щ а*|

дисперсией. Величина с(а) = —-—0<е(а)<1, называется эффекта]

тивностью оценки а. Если е(а)= 1, то обе оценки имеют одинаковую эффективность. Доказано [52J, что две оценки с дисперсией, достигающей нижней границы, «почти наверное» совпадают. Поэтому коэффициент корреляции между ними р = 1 и получить более эффективную оценку за счет усреднения двух эффективных оценок невозможно, так как в случае р = 1 и D[al ] = Z)[a2] = Z)|^a* J имеем

Известно также [52], что в случае двух неизвестных оцениваемых параметров а, [3 дисперсии и коэффициент корреляции совместно эффективных оценок а*, (3 * равны:

Если р2(а*, (3*) ф 0, то дисперсия а* ф*) превышает дисперсию эффективной оценки а0*(Ро*) для случая, когда а((3) — единственный параметр.

В случае нормального закона оценки а* и (3* некоррелированы, и следовательно, дисперсии совместных эффективных оценок обоих параметров совпадают с дисперсиями для случая, когда а или (3 — единственный параметр.

В случае нормального закона с одним неизвестным параметром (ц или а2) оценками, дисперсия которых достигает нижней грани-

1 п

цы, являются выборочное среднее х = -Ух., или дисперсия

л м

1 п о2

s2 =—V(jc.-р)2. При этом нижние границы равны /)[х] =—; п /=1 п

п

Если оба параметра нормального закона неизвестны, то, как было отмечено, нижние границы дисперсий совместных эффективных оценок совпадают с нижними границами для случая одного неизвестного параметра.

Выборочная дисперсия в случае неизвестного среднего значения

1 п4

s2 =-V(x(-x)2 имеет дисперсию D[s2 =-, недостигающую

Я-1ы л-1

нижней границы. Таким образом, в случае неизвестного среднего выборочная дисперсия не является эффективной оценкой и возможен поиск эффективной оценки дисперсии с минимальной дисперсией.

Эффективность оценки по выборочной дисперсии равна e(s2) = -—

V 1 п

и асимптотически стремится к единице при я ^ оо.

Аналогичная ситуация с законами модуля центрированной нормальной СВ, законом Релея (радиус-вектора в случае кругового нормального закона), законом Лапласа, модуля центрированной СВ с законом Лапласа (экспоненциального закона).

Если плотность распределения не удовлетворяет условиям теоремы, т.е. не является регулярной и, в частности, имеет скачок в точке x=a, то возможна сверхточная оценка. Примером такого распределения является равномерное распределение. Интуитивно понятно, что крайние члены при увеличении объема выборки «прижимаются» к границам распределения и среднее арифметическое крайних значений выборки оказывается более эффективной оценкой математического ожидания по сравнению с выборочным средним [37], что пояснено в п. 2.6.

Перейдем к робастности оценок. В литературе по теории вероятностей и математической статистике первоначально под робастностью понималась малая чувствительность к оцениванию параметров (в частности, малое изменение эффективности оценки), когда закон распределения случайной величины отличается от закона, для которого оценка получена. Мы отмечали, например, что в случае равномерного закона при достаточно большом объеме выборки сверхточной оценкой математического ожидания является среднее арифметическое крайних членов выборки (наименьшего и наибольшего значений, т.е. крайних /--статистик). Но если эту оценку использовать, например, в случае нормального закона, то ее эффективность будет меньше выборочного среднего. Если, например, распределение несимметрично, то среднее арифметическое крайних членов выборки будет смещенной оценкой. Выборочное среднее является несмещенной оценкой в случае любого закона распределения и в этом смысле является робастной оценкой.

Очевидно, что аномальные измерения искажают закон распределения, и нечувствительность к ним имеет такой же смысл, как робастность в исходном значении, тем более что в этом смысле термин распространился, например, в теории управления. В реальных условиях в выборке возможны аномальные результаты (измерения), причинами которых могут быть ошибки испытателя, сбой аппаратуры, помехи по сети питания аппаратуры и другие несоответствующие природе исследуемой величины факторы [72]. Аномальные измерения приводят к искажению оцениваемых параметров.

В пункте 2.11 рассматриваются критерии исключения аномальных результатов из выборки. Тем не менее актуальна задача разработки и применения в практике испытаний оценок, мало чувствительных к аномальным измерениям (робастных). В этом случае мы сознательно идем на применение менее эффективной оценки, менее чувствительной (робастной) по отношению к аномальным результатам. Примером такой оценки является выборочная медиана (средний член упорядоченной выборки нечетного объема или среднее значение средних членов в случае четного объема выборки). Очевидно, что эта оценка математического ожидания не зависит от грубых ошибок — аномальных результатов. Но если таковые отсутствуют, то ее эффективность ниже по сравнению с эффективностью выборочного среднего. Если распределение несимметрично, то выборочная медиана будет смещенной оценкой математического ожидания.

Проиллюстрируем получение робастных оценок сдвига и масштаба в случае независимой выборки из объема п = 8 закона 7V(p, о2). Для получения робастных оценок используем МНК для /--статистик (п. 2.6). Весовые коэффициенты оценок ц, а и ковариационная матрица оценок определяются соотношениями (2.6.9) и (2.6.11).

Для получения робастных оценок по отношению к аномальным результатам (большим отклонениям х(1) или х(л)) уменьшим весовые коэффициенты первого и последнего условных уравнений. Для этого умножим первый, я-й, столбец и первую, я-ю, строчку корреляционной матрицы на а> 1. При этом угловые коэффициенты матрицы увеличатся в а2 раз.

В случае выборки объема я = 8 из нормального закона А^(ц, 1) получим:

где 51, С1 соответствуют робастным оценкам в случае а = 1,5.

Анализируя результаты вычислений, можно сделать следующие выводы:

1. По МНКдля/-статистик коэффициенты Рг = — = 0,125, т.е. оцен-

я

ка математического ожидания в случае нормального закона совпадает с выборочным среднем х = — и имеет такую же эффективность

(ox = -j= = 0,354). То есть индивидуальные свойства г-статистик у]п

не проявляются.

2. По МНК для r-статистик оценка с.к.о. равна

и имеет эффективность, совпадающую с эффективностью выборочного с.к.о. (as = у]к% -1 = 0,273). Однако каждая г-статистика учитывается индивидуально. При этом вместо суммирования квадратов отклонений (как в случае выборочного с.к.о.) суммируются отклонения. Соответственно аномальные значения х(1), х(л) сказываются меньше на результат оценки с.к.о. Этот эффект несколько уменьшается за счет больших весов.

3. Ковариационная матрица С практически диагональная, т.е. МНК-оценки математического ожидания и с.к.о. некоррелированы. Следовательно, согласно теории нижние границы дисперсий совместных оценок совпадают с границами для отдельных оценок ц и a при известном значении другого параметра. Но в случае нормального закона при известном значении математического ожидания нижняя

а2 а2

граница оценки дисперсии —, а дисперсия МНК-оценки -,

п д-1

как и у выборочной дисперсии. Следовательно, нижняя граница

ни в том, ни в другом случае не достигнута.

4. В случае учета х(1) и х) с меньшими весами аномальные результаты меньше влияют на результат оценок среднего и с.к.о. Однако робастность оценок достигается за счет снижения их эффективности (alp =0,36 против ар =0,354 и als =0,304 против ай =0,273).

Отметим, что платой за робастность является снижение эффективности. При определении весовых коэффициентов в оценках используется априорная информация о законе распределения. Выборочное среднее и выборочная дисперсия являются несмещенными оценками в случае любого закона распределения. В случае МНК-оценок по r-статистикам при изменении закона распределения возникает смещение оценки. Например, если МНК-оценка получена для симметричного распределения (например, нормального или равномерного), то при несимметричном распределении появляется смещение оценки математического ожидания. То есть МНК-оценка менее робастна по отношению к изменению закона распределения.

 
Посмотреть оригинал
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 
Популярные страницы