Этапы проведения регрессионного анализа

Рассмотрим процедуру проведения регрессионного анализа по этапам.

Выбор зависимой и независимых переменных

На первом этапе необходимо выбрать зависимую переменную и независимые переменные для анализа. Для этого можно воспользоваться кнопкой Variables в окне модуля Multiple Regression. Затем откроется следующее окно Select dependent and independent variable lists (рис. 3.3), в левой части которого указывают имя зависимой переменной, а в правой — имена независимых переменных. Для выбора нескольких несмежных переменных нужно удерживать клавишу . После этого, щёлкнув по кнопке ОК, пользователь возвращается в Стартовую панель модуля Multiple Regression.

Определение опций и параметров анализа

На втором этапе аналитик может задать различные опции и параметры анализа (рис. 3.2), в частности:

  • ? Input fde — тип входной информации. Когда входная информация представляет собой массив исходных данных, следует оставить значение Raw Data (необработанные данные).
  • ? MD deletion — в данной строке указывается режим обработки пропущенных данных.
Выбор зависимой и независимых переменных в окне Select dependent and independent variable lists

Рис. 3.3. Выбор зависимой и независимых переменных в окне Select dependent and independent variable lists

Кроме того, здесь есть возможность провести обзор описательных статистик и корреляционных матриц, выбрав команду Review descriptive statistics, correlation matrix. При выборе данной команды можно рассчитать коэффициенты парной корреляции (но без указания их значимости), ковариации, средние для переменных и среднеквадратические отклонения, то есть провести предварительный анализ исходных переменных, который позволяет сделать выводы о структуре связей между выбранными переменными. Не рекомендуется включать в регрессионную модель переменные, слабо связанные с результативным признаком, а также переменные, тесно связанные друг с другом. Когда между объясняющими переменными есть ощутимая линейная зависимость, это свидетельствует о наличии мультиколлинеарности. Однако модель регрессии становится неустойчивой, поскольку незначительное изменение состава выборки (значений признаков) или состава объясняемых переменных может вызвать кардинальное изменение модели, что делает её мало пригодной для использования па практике. В таком случае чаще всего используют исключение из модели одной из двух коррелированных между собой переменных, гребневую регрессию, переход от первоначальных переменных к их главным компонентам.

Команда Extended precision computations позволяет выбрать метод расчёта с повышенной точностью.

Команда Advanced options (stepwise or ridge regression) открывает доступ к различным методам регрессионного анализа, в том числе и методам пошаговой регрессии (Stepwise) и гребневой регрессии (Ridge). После выбора этой команды и нажатия кнопки ОК на экране появляется окно, в котором можно выбрать дополнительные методы анализа (рис. 3.4).

По умолчанию в данном окне отображаются условия стандартной процедуры обработки: в строке Method указано Standard. При изменении команды в этой строке пользователь переходит к методам пошаговой регрессии. Методы пошаговой регрессии позволяют из множества независимых переменных отобрать только самые значимые для адекватного описания модели множественной регрессии. В модуле реализованы две процедуры отбора переменных, каждая из которых может давать различный конечный набор переменных — в частности, последовательное включение (Forward stepwise) и последовательное исключение (Backward stepwise). В пошаговой регрессии с последовательным включением система начинает строить модель с одной независимой переменной; затем, используя /•’-критерий, включает в модель ещё одну переменную и т. д. Если предполагается, что в модели должно присутствовать небольшое количество независимых переменных, то лучше использовать метод пошаговой регрессии с включением. Если же предполагается, что в модели должно присутствовать большое количество независимых переменных, рекомендуется использовать метод с исключением.

Выбор дополнительных методов анализа в окне Model Definition

Рис. 3.4. Выбор дополнительных методов анализа в окне Model Definition

Гребневую регрессию используют для получения более устойчивых оценок параметров регрессионной модели в условиях мультиколлинеарности переменных.

В строке Tolerance указывают величину толерантности.

Реализовать метод пошаговой множественной регрессии можно, нажав левой кнопкой мыши на закладку Stepwise в окне Model Definition (рис. 3.4).

После этого окно Model Definition приобретет следующий вид (рис. 3.5).

После определения всей необходимой информации для построения регрессионной модели следует нажать кнопку ОК в правом верхнем углу окна.

Выбор дополнительных методов анализа в окне Model Definition (пошаговая регрессия)

Рис. 3.5. Выбор дополнительных методов анализа в окне Model Definition (пошаговая регрессия)

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >