НЕПАРАМЕТРИЧЕСКОЕ ОЦЕНИВАНИЕ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ

В непараметрической постановке оценивают либо характеристики случайной величины (математическое ожидание, дисперсию, коэффициент вариации), либо ее функцию распределения, плотность и т.п. Так, в силу закона больших чисел выборочное среднее арифметическое х является состоятельной оценкой математического ожидания М(Х) (при любой функции распределения F(x) результатов наблюдений, для которой математическое ожидание существует). С помощью центральной предельной теоремы определяют асимптотические доверительные границы

где у — доверительная вероятность; — квантиль порядка стандартного нормального распределения N(0; 1)

с нулевым математическим ожиданием и единичной дисперсией; х — выборочное среднее арифметическое; s — выборочное среднее квадратическое отклонение.

Термин «асимптотические доверительные границы» означает, что вероятности

стремятся к и у соответственно при п —> оо, но, вообще говоря, не равны этим значениям при конечных п. Практически асимптотические доверительные границы дают достаточную точность при п порядка 10.

НЕПАРАМЕТРИЧЕСКОЕ ОЦЕНИВАНИЕ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ

Второй пример непараметрического оценивания — оценивание функции распределения. По теореме Гливенко эмпирическая функция распределения Fn{x) является состоятельной оценкой функции распределения F{x). Если F(x) — непрерывная функция, то на основе теоремы Колмогорова доверительные границы для функции распределения F(x) задают в виде

»

где /:(уп) — квантиль порядка у распределения статистики Колмогорова при объеме выборки п (напомним, что распределение этой статистики не зависит от F(x)).

Правила определения оценок и доверительных границ в параметрическом случае строятся на основе параметрического семейства распределений F{x 0). При обработке реальных данных возникает вопрос — соответствуют ли эти данные принятой вероятностной модели? То есть статистической гипотезе: результа- 152

ты наблюдений имеют функцию распределения из семейства {F(x; 0), 0 6 0} при некотором 0 = 0о. Такие гипотезы называют гипотезами согласия, а критерии их проверки — критериями согласия.

Если истинное значение параметра 0 = 0О известно, функция распределения F(x; 0О) непрерывна, то для проверки гипотезы согласия часто применяют критерий Колмогорова, основанный на статистике

где F„(x) — эмпирическая функция распределения.

Если истинное значение параметра 0о неизвестно, например при проверке гипотезы о нормальности распределения результатов наблюдения (т.е. при проверке принадлежности этого распределения к семейству нормальных распределений), то иногда используют статистику

Она отличается от статистики Колмогорова Д тем, что вместо истинного значения параметра 0О подставлена его оценка 0*.

Распределение статистики Д(0*) сильно отличается от распределения статистики Д. В качестве примера рассмотрим проверку нормальности, когда 0 = (m, a2), a 0* = (I, s2). Для этого случая квантили распределений статистик Д, и Д(0*) приведены в табл. 1 (см., например, [15]). Таким образом, квантили отличаются примерно в 1,5 раза.

В ряде литературных источников при описании критериев согласия допускается ошибка: при проверке нормальности вместо критических значений статистики Д(0*) применяют критические значения статистики Д. В результате гипотеза нормальности принимается гораздо чаще, чем следует (табл. 6.1). Подробнее эта ошибка рассмотрена в статье [15].

Таблица 6.1

Квантили статистик Д, и DJQ*) при проверке нормальности

Порядок р квантиля

0,85

0,90

0,95

0,975

0,99

Квантили порядка р для Д,

1,138

1,224

1,358

1,480

1,626

Квантили порядка р для А,(9*)

0,775

0,819

0,895

0,955

1,035

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >