Мультиколлинеарностью в моделях множественной регрессии называется наличие линейной зависимости между факторными переменными, включенными в модель.
Мультиколлинеарность – нарушение одного из основных условий, лежащих в основе построения модели множественной регрессии. Мультиколлинеарность в матричном виде – ϶ᴛᴏ зависимость между столбцами матрицы факторных переменных.
Проблема мультиколлинеарности возникает, когда в уравнениях наблюдений столбца матрицы X становятся практически линейно зависимыми, что входит в противоречие с исходной предпосылкой Гаусса-Маркова.
Предпосылка теоремы Гаусса–Маркова – независимость столбцов 𝑋𝑗, матрицы регрессоров 𝑋:
В ситуации мультиколлинеарности оценки параметров линейной регрессионной модели становятся ненадежными
Виды:
1. Строгая (perfect) мультиколлинеарность - наличие линейной функциональной связи между независимыми переменными (иногда также и зависимой)
2. Нестрогая (imperfect) мультиколлинеарность - наличие сильной линейной корреляционной связи между независимыми переменными (иногда также и зависимой)
|
|
Признаки мультиколлинеарности:
Частичная мультиколлинеарность характеризуется коэффициентом корреляции между регрессорами Для определения степени коррелированности регрессоров определяют матрицу их взаимных корреляций:
1. Если
Если между регрессорами имеется высокая степень корреляции, матрица 𝑋𝑇𝑋 существует, но близка к вырожденной:
2. Близость к нулю определителя матрицы 𝑋𝑇𝑋
Последствия мультиколлинеарности:
1. Увеличение дисперсий оценок параметров. Это расширяет интервальные оценки и ухудшает их точность
2. Уменьшение t-статистик коэффициентов, что приводит к неоправданным выводам о значимости регрессоров
3. Неустойчивость МНК-оценок параметров и их дисперсий
4. Возможность получения неверного с точки зрения теории знака у параметра регрессии или неоправданно большого значения