Основные предпосылки применения корреляци онно-регрессионного анализа

Не ко всем статистическим данным можно применить методы корреляционно-регрессионного анализа. Основные требования, предъявляемые к анализируемой информации, следующие.

  • 1. Наблюдения должны являться случайно выбранными из генеральной совокупности объектов. В противном случае исходные данные, представляющие собой определенную выборку из генеральной совокупности, не будут отражать ее характер, полученные по ним выводы о закономерностях развития окажутся бессмысленными и не имеющими никакой практической ценности.
  • 2. Требование независимости наблюдений друг от друга.

Зависимость наблюдений друг от друга называется автокорреляцией, для ее устранения в теории корреляционно-регрессионного анализа созданы специальные методы.

  • 3. Исходная совокупность данных должна быть однородной, без аномальных наблюдений (аномальные наблюдения - это очень «большие» или «маленькие» по отношению к основному массиву данных значения признака).
  • 4. Желательно, чтобы исходные для анализа данные подчинялись + /^-мерному нормальному закону распределения (совместное (к + Iу-мсрное нормальное распределение результативного и факторных признаков, где к - количество факторных переменных^7).

Нормальный закон распределения необходим для того, чтобы при проверке значимости коэффициентов корреляции и построении для них интервальных границ, можно было использовать определенные критерии. Если же проверять значимость и строить интервальные оценки не требуется, переменные могут иметь любой закон распределения.

В регрессионном анализе, при построении уравнения регрессии, требование нормальной распределенности исходных данных предъявляется лишь к результативной переменной Y, независимые факторы рассматриваются как неслучайные величины и могут в действительности иметь любой закон распределения. Как и в случае корреляционного анализа, требование нормальности распределения нужно для проверки значимости регрессионного уравнения, его коэффициентов и нахождения доверительных интервалов.

5. Число наблюдений, по которым устанавливается взаимосвязь признаков и строится модель регрессии, должно превышать количество факторных признаков хотя бы в 3—4 раза (а лучше в 8-10 раз).

Как отмечалось выше, статистическая связь проявляется только при значительном числе наблюдений на основе действия закона больших чисел, причем, чем связь слабее, тем больше наблюдений для установления связи требуется, чем сильнее - тем меньше. Поэтому, чтобы как можно точнее определить вид и форму зависимости в исследуемых явлениях, надо иметь как можно больше по сравнению с числом признаков наблюдений.

6. Факторные признаки X не должны находиться между собой в функциональной зависимости. Значительная связь независимых (факторных, объясняющих) признаков между собой указывает на мульти- коллениарность. Ее наличие приводит к построению неустойчивых регрессионных моделей, «ложных» регрессий. Поэтому при обнаружении мультиколлениарности один из признаков следует исключить из дальнейшего анализа, при этом чаще всего исключается тот, который оказывает наименьшее влияние на результативную величину Y.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >