Мультиколлинеарность ¾ это линейная взаимосвязь двух или нескольких объясняющих переменных. Последствиями мультиколлинеарности являются
1) большие стандартные ошибки , что расширяет доверительные интервалы теоретических коэффициентов уравнения линейной регрессии;
2) уменьшение статистик , что может привести к выводу о статистической незначимости коэффициента;
3) и становятся очень чувствительными к малейшим изменениям данных;
4) затрудняется определение вклада каждой из объясняющих переменных в объясняемую уравнением линейной регрессии дисперсию результативного признака;
5) возможно получение неверного знака у коэффициентов регрессии.
Точных количественных оценок для определения наличия или отсутствия мультиколлинеарности не существует. Однако есть некоторые признаки наличия мультиколлинеарности:
1) высокий коэффициент детерминации и низкие статистики некоторых переменных;
2) высокие значения частных коэффициентов корреляции (коэффициенты корреляции между двумя переменными, очищенные от влияния других переменных).
|
|
Excel позволяет вычислить корреляционную матрицу (матрицу из попарных коэффициентов корреляции) для любого количества переменных. Для этого нужно воспользоваться сервисом Сервис\Анализ данных\Корреляция. В качестве входного интервала надо указать диапазон ячеек, содержащий объясняющие переменные.
Обычно явление мультиколлинеарности считают установленным, если коэффициент парной корреляции между двумя какими-либо переменными больше 0,8.
Чтобы избавиться от мультиколлинеарности, в модель включается лишь один из линейно связанных факторов, причем тот, которых в большей степени связан с зависимой переменной.