Для оценки качества уравнения регрессии используют коэффициент детерминации R2:
. (15)
Величина R 2 показывает, какую долю общей дисперсии результативного признака (знаменатель) объясняет уравнение регрессии (числитель).
Тогда величина 1 – R 2:
(16)
характеризует долю остаточной дисперсии, которая обусловлена влиянием на результативный признакнеучтенных в модели факторов.
Величина коэффициента детерминации изменяется в пределах от нуля до единицы: 0 ≤ R2 ≤ 1. Чем ближе R2 к единице, тем теснее наблюдения примыкают к линии регрессии, тем лучше уравнение регрессии описывает исходные данные. Если R2 = 1, то исходные данные лежат на линии регрессии и между X и Y имеется функциональная зависимость. Если R2 = 0, изменение X не влияет на изменение Y, т. е. изменение Y целиком обусловлено воздействием неучтённых в модели факторов.
В общем случае (0 < R2 < 1) коэффициент детерминации показывает, какая доля дисперсии результативного признака Y определяется (детерминируется) контролируемой нами вариацией функции регрессии f (X). Оставшаяся доля дисперсии
(1 – R 2) объясняется воздействием неконтролируемой случайной компоненты и определяет ту верхнюю границу точности, которой можно добиться при аппроксимации результативного признака Y по заданным значениям X.
|
|
В рассматриваемом частном случае парной линейной регрессии (и только!) справедливы следующие заключения:
1) коэффициент детерминации равен квадрату коэффициента корреляции:
; (17)
2) если в отношении коэффициента корреляции статистическая значимость установлена, то это свойство автоматически выполняется в отношении коэффициента детерминации при том же уровне значимости.