Регрессионный анализ в исследованиях финансовой деятельности

Общие принципы построения регрессионных уравнений

Выше уже рассматривались корреляционные поля, образуемые скоплениями точек, графически обозначающими фактические наблюдения. Чаще всего эти точки группируются возле некоторой линии, если связь показателей линейна, или кривой, если связь нелинейна. Эти линии называются линиями регрессии, а описывающие их аналитические выражения - уравнениями регрессии (рис. 7.2).

Зная уравнение регрессии, можно для любых значений X, подставляя их в уравнение, приближенно оценить значение зависимой переменной Y. Причем, точность такой оценки будет тем выше, чем теснее группируются точки фактических наблюдений относительно линии регрессии, т.е. точность модели регрессии определяется тем, насколько тесной является взаимозависимость признаков X и Y.

Уравнения регрессии при разной форме связи

Рис. 7.2. Уравнения регрессии при разной форме связи

* Если две переменные практически не связаны между собой, то моделью будет являться горизонтальная прямая.

Регрессионный анализ - это статистический метод исследования зависимости случайной величины У от переменных Xj, где j=l,2,...,k. При этом факторные переменные X рассматриваются в регрессионном анализе как неслучайные величины независимо от истинного закона распределения Хп а зависимая случайная величина Y имеет нормальный закон распределения с условным математическим ожиданием, являющимся функцией от Xj

Кроме того, предполагается, что дисперсия случайной величины У постоянна и не зависит от факторных признаков.

Выбор типа аналитического выражения для описания линии регрессии предварительно можно осуществить на основе визуального анализа корреляционного поля (рис. 7.2), информации прошлых исследований. В принципе для отображения зависимости между X и У могут использоваться любые математические функции и имеющиеся в настоящее время компьютерные программы позволяют это сделать.

При построении парной регрессии (с одной факторной переменной) обычно используются следующие функции:

Однако в действительности любой результативный показатель испытывает воздействие не одного, как в случае парной корреляции, а нескольких факторов, поэтому зачастую строят модели множественной регрессии, которые принимают вид:

1. Линейная:

наиболее часто встречающаяся модель.

2. Степенная:

3. Показательная:

4. Параболическая:

5. Гиперболическая:

где Uj (j = 1, 2, ..., к) - параметры регрессионного уравнения, называемые коэффициентами регрессии.

Бывает, что на основе графика не удается определить тип регрессионного уравнения. Тогда строят несколько моделей, а затем по определенным критерия определяют лучшую. Однако если можно ограничиться построением линейной модели, то выбирают ее. Такая популярность и предпочтительность объясняется очень просто: математический аппарат линейных уравнений наиболее разработан, а сами модели более легко интерпретируемы.

Критерием нахождения значений коэффициентов регрессии щ является следующее требование: сумма квадратов отклонений наблюдаемых «игреков» от «игреков», рассчитанных по уравнению регрессии, должна быть минимальной. Это положение исходит из того, что параметры регрессионной модели должны быть такими, чтобы на графике корреляционного поля линия регрессии оказалась в самой гуще точек фактических наблюдений, т.е. проходила бы на минимальном удалении от них.

В виде формулы это требование записывается следующем образом:

Метод нахождения значений коэффициентов регрессии по приведенному критерию называется методом наименьших квадратов (МНК). Существуют и другие подходы к оценке параметров, однако простота и универсальность МНК сделала его наиболее применимым.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >