Метод проверки статистических гипотез

В соответствии с поставленной задачей и на основании имеющихся выборочных данных формулируется (выдвигается) гипотеза Н(], которая называется основной или нулевой.

Одновременно с выдвинутой рассматривается и противоречащая ей гипотеза Ну Эта гипотеза называется конкурирующей или альтернативной.

Различают гипотезы, содержащие только одно предположение (простая гипотеза), и более одного предположения (сложная гипотеза).

Примеры простой и сложной гипотез:

  • 1) рассматривается нормально распределенная случайная величина, а — среднее квадратическое отклонение этой величины. Гипотеза Н0: а = 7 — простая.
  • 2) X — параметр показательного распределения. Гипотеза Н0 X = Ь. — сложная, потому что она состоит из множества простых гипотез вида X = Ьр где — любое действительное число.

Поскольку решение о соответствии высказывания Н0 для генеральной совокупности принимается по выборочным данным, то это решение может быть ошибочным. При этом может возникать два рода ошибок.

Если отвергается гипотеза Н0 и принимается альтернативная гипотеза Нр тогда как на самом деле гипотеза Н0 верна, то совершается ошибка первого рода.

Если принимается гипотеза Н0, тогда как на самом деле высказывание HQ неверно (т.е. верной является гипотеза //,), то совершается ошибка второго рода.

Для определения вероятности ошибки первого рода вводится параметр а по следующей формуле

Здесь Рщ(Н^) — вероятность того, что будет принята гипотеза Hv в то время как верной является гипотеза HQ. Величину а называют уровнем значимости. Обычно значения уровня значимости выбираются в пределах 0,001—0,1.

Вероятность ошибки второго рода определяется параметром р по формуле

Здесь Рн^(Н0) — вероятность того, что будет принята гипотеза Н0, в то время как верной является гипотеза Нг

Для проверки нулевой гипотезы вводят специально подобранную случайную величину К, распределение которой известно. Величину К принято называть статистическим критерием или статистикой. Наиболее часто используются критерии, имеющие следующие законы распределения (см. п. 8.3.2): стандартное нормальное распределение, распределения Стьюдента, Фишера—Снедекора и хи-квадрат.

Рассмотрим далее область допустимых значений критерия. Выделим из нее подобласть ю значений, которые свидетельствуют о невозможности принятия гипотезы Н0 (т.е. расхождение результата, полученного с помощью выборочных данных, с гипотезой существенно). Эту подобласть ю будем называть критической областью. Если вычисленное по выборке значение критерия К попадет в критическую область, то гипотеза Н0 отвергается и принимается гипотеза Ну

В этом случае можно совершить ошибку первого рода, вероятность которой равна а:

Возможны три случая расположения критической области со: правосторонняя критическая область, левосторонняя критическая область и двухсторонняя критическая область. Конфигурация критической области определяется видом нулевой и альтернативной гипотез и законом распределения критерия К.

Правосторонняя критическая область (рис. 9.1, а), представляет собой интервал (&*р а, +°°), где значение критерия kK^pa определяется из условия Р(К > kK^a) = а и называется правосторонней критической точкой, отвечающей уровню значимости а.

Левосторонняя критическая область (рис. 9.1, б), состоит из интервала (—°°, &*pa), где значение критерия kK^a определяется из условия Р(К > kK^a) = а и называется левосторонней критической точкой, отвечающей уровню значимости а.

Двусторонняя критическая область (рис. 9.1, в), состоит из двух интервалов: (-°°, k^a/2) И (kfa/2, +°°), где значения критерия &«ра/2 и Га/2 определяются из условий Р(К > &*ра/2) = а/2 и Р(К > kK^pa/2) = а/2 и называются двусторонними критическими точками.

Критические области

Рис. 9.1. Критические области

План проверки статистической гипотезы

  • 1. Формулируется основная Н0 и альтернативная Н[ гипотезы.
  • 2. Задается уровень значимости а.
  • 3. Выбирается статистический критерий К, зависящий от выборочных данных и условий решаемой задачи.
  • 4. Вычисляется значение статистического критерия К по выборке.
  • 5. Определяются критические точки и критические области.
  • 6. Нулевую гипотезу принимают, если вычисленное значение критерия попадает в область допустимых значений, и отвергают, если оно попадает в критическую область.

Статистические гипотезы могут иметь разное содержание. Среди них можно выделить три вида гипотез:

  • 1) о числовых значениях параметров распределений;
  • 2) о равенстве числовых характеристик;
  • 3) о виде закона распределения.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >