Скорректированный индекс множественной регрессии

При расчете индекса множественной корреляции используется остаточная дисперсия, которая имеет систематическую ошибку в сторону преуменьшения, тем более значительную, чем больше параметров определяется в уравнении регрессии при заданном объеме наблюдений . Если число параметров при равно и приближается к объему наблюдений, то остаточная дисперсия будет близка к нулю и индекс множественной корреляции приблизится к единице даже при слабой связи факторов с результатом. Для того чтобы не допустить возможного преувеличения тесноты связи, применяется скорректированный индекс множественной корреляции.

Скорректированный индекс множественной корреляции содержит поправку на число степеней свободы, а именно остаточная сумма квадратов делится на число степеней свободы остаточной вариации , а общая сумма квадратов отклонений – на число степеней свободы в целом по совокупности . Формула скорректированного индекса множественной детерминации имеет вид:

(14)

Поскольку , то величина скорректированного индекса детерминации можно представить в виде:

(15)

Для линейной зависимости признаков скорректированный коэффициент множественной регрессии определяется по той же формуле, что и индекс множественной корреляции, т.е. как корень квадратный из . Отличие состоит лишь в том, что в линейной зависимости под подразумевается число факторов, включенных в регрессионную модель, а в криволинейной зависимости – это число параметров при и их преобразованиях (, и т.д.), которое может больше числа факторов как экономических переменных. При заданном объеме наблюдений при прочих равных условий с увеличением числа независимых переменных (параметров) скорректированный коэффициент множественной детерминации убывает. Его величина может стать и отрицательной при слабых связях результата с факторами. В этом случае он должен считаться равным нулю. При небольшом числе наблюдений нескорректированная величина коэффициента множественной детерминации имеет тенденцию переоценивать долю вариации результативного признака, связанную с влиянием факторов, включенных в регрессионную модель.

Чем больше объем совокупности, по которой исчислена регрессия, тем меньше различаются показатели и . В статистических пакетах прикладных программ в процедуре множественной регрессии обычно приводится скорректированный коэффициент (индекс) множественной корреляции (детерминации). Величина коэффициента множественной детерминации используется для оценки качества регрессионной модели. Низкое значение коэффициента (индекса) множественной корреляции означает, что в регрессионную модель не включены существенные факторы – с одной стороны, а с другой стороны – рассматриваемая форма связи не отражает реальные соотношения между переменными, включенными в модель. В этом случае требуются дальнейшие исследования по улучшению качества модели и увеличению ее практической значимости.

Однако увеличение при добавлении новой переменной не всегда означает, что ее коэффициент значимо отличается от нуля. Поэтому увеличение скорректированного индекса множественной корреляции не означает улучшение спецификации регрессионной модели, как можно было бы предположить.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: