Стандартная ошибка оценки

Термин «стандартная ошибка среднего» был впервые введён Юлом (Yule 1897: 812-821). Эта величина характеризует стандартное отклонение выборочного среднего, рассчитанное по выборке размера п из генеральной совокупности, и зависит от дисперсии генеральной совокупности а (сигма) и объёма выборки (п):

где с? — дисперсия генеральной совокупности; п — число наблюдений в выборке.

Поскольку дисперсия генеральной совокупности, как правило, неизвестна, то оценку стандартной ошибки вычисляют по Формуле

где s2 — выборочная дисперсия (наилучшая оценка дисперсии популяции); п — объём выборки.

Расстояние Кука

Расстояние Кука — это мера влияния соответствующего наблюдения на уравнение регрессии. Эта величина показывает разницу между вычисленными S-коэффициентами и значениями, которые получились бы при исключении соответствующего наблюдения. В адекватной модели все расстояния Кука должны быть примерно одинаковыми; если это не так, то есть основания считать, что соответствующее наблюдение (или наблюдения) смещает (смещают) оценки коэффициентов регрессии.

Расстояние Махаланобиса

Независимые переменные в уравнении регрессии можно представлять точками в многомерном пространстве (каждое наблюдение изображается точкой). В этом пространстве можно построить точку центра. Такая «средняя точка» в многомерном пространстве называется центроидом, то есть центром тяжести. Расстояние Махаланобиса рассчитывается как расстояние от наблюдаемой точки до центра тяжести в многомерном пространстве, определяемом коррелированными (неортогональными) независимыми переменными. Если же независимые переменные некоррелироваиы, расстояние Махаланобиса совпадает с обычным евклидовым расстоянием. Эта мера позволяет, в частности, определить, является ли данное наблюдение выбросом по отношению к остальным значениям независимых переменных.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >