Толерантность (во множественной регрессии)

Толерантность переменной определяется как разность единицы и квадрата коэффициента множественной корреляции этой переменной со всеми остальными независимыми переменными, входящими в уравнение регрессии. Поэтому чем меньше толерантность переменной, тем более избыточен её вклад в уравнение регрессии (то есть тем более её вклад избыточен при заданных значениях других переменных). Если толерантность любой переменной в уравнении регрессии равна нулю (или очень близка к нулю), оценить уравнение регрессии невозможно, так как получаемая матрица будет плохо обусловлена и не будет иметь обратной.

Остатки

Остатки — это разности между наблюдаемыми значениями и значениями, предсказанными изучаемой моделью. Чем лучше модель согласуется с данными, тем меньше величина остатков.

Стандартизованные значения остатков

Стандартизованные значения остатков вычисляют как разность между наблюдаемыми и предсказанными значениями, делённую на квадратный корень из среднеквадратичного значения остатков.

Попарное и построчное удаление пропущенных данных

Принятый по умолчанию способ удаления пропущенных данных при вычислении корреляционной матрицы — построчное удаление наблюдений с пропусками (удаляется вся строка, в которой пропущено хотя бы одно значение).

Этот способ приводит к «правильной» корреляционной матрице — все коэффициенты вычисляют по одному и тому же множеству наблюдений. Однако если пропущенные значения распределены в переменных случайным образом, то этот метод может привести к тому, что из рассматриваемого множества данных будут исключены все наблюдения (так как в каждой строке наблюдений встретится хотя бы одно пропущенное значение). Чтобы избежать подобной ситуации, применяют другой способ — попарное удаление: учитывают только пропуски в каждой выбранной паре переменных и игнорируют пропуски в других переменных.

Корреляцию между парой переменных вычисляют по наблюдениям, где нет пропусков. Во многих ситуациях, особенно когда пропусков относительно мало (скажем, 10%) и они распределены достаточно хаотично, этот метод не приводит к серьёзным ошибкам.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >