Вопрос №8. Особенности вычисления показателей тесноты связи парной линейной регрссии

 

Когда мы изучаем тесноту связи, то мы смотрим, насколько близко реальные (фактические) значения расположены к линии регрессии (т.е. насколько близко точки к линии). Чем ближе, тем теснее.

На рис. 5 фактор лучше объясняет результат, чем на рис. 4. На рис. 4 скорее всего вмешивается еще какой-то фактор (а может и не один), который объясняет эту зависимость.

Поэтому если точки лежат близко, то выбираем функции вида: .

Показатели тесноты связи показывают насколько фактор или факторы, включенные в модель регрессии, объясняют изменение результата. Величина ε характеризует тесноту связи (чем он меньше, тем связь тес­нее), с помощью метода наименьших квадратов мы оптимизировали эти отклонения. характеризует разброс точек, тесноту связи.Эта величина является характеристикой связи, но ее нельзя использо­вать как показатель связи ввиду следующего недостатка: данная величина зависит от единиц измерения исходных показателей, если исходные показа­тели имеют разные единицы измерения, то тогда показатели будут несопо­ставимы.

Поэтому для того, чтобы получить показатель тесноты связи, приду­мали использовать правило сложения дисперсий. Это правило изучалось на лекциях по статистике для аналитической группировки, для линейной дисперсии это правило выглядит следующим образом:

Можно сделать вывод о том, что деление на n можно опустить, тогда ничего не изменится:

 

 

Где общая сумма квадратов . - факторная сумма квад­ратов: - остаточная сумма квадратов. Основной недостаток суммы квадратов в его размерности, но оказыва­ется, что это часть от общей суммы:

 

Если , тогда связь максимально тесная. Ограничение такое, так как у нас часть целого:

Чем ближе к нулю, тем связь теснее, чем ближе к единице, тем связь слабее по этой формуле.

Можно, в принципе, использовать данное выражение как показатель тесноты связи, но удобнее, чтобы тесная связь была, когда ближе к 1. Поэтому рассмотрим другую формулу (которая и представляет собой показатель тесноты связи):

Если SSocm большая, то показатель стремится к нулю, и связь слабая.

Для линейных функций этот показатель называется коэффициентом детерминации, а если факторов много, то называется коэффициентом множественной детерминации.

Из правил сложения дисперсий следует:

С ним есть функционально связанный показатель - коэффициент кор­реляции (или коэффициент множественной корреляции, если фак­торов много):

Для того, чтобы оценить, насколько тесна связь, используется шкала Чеддока (о силе связи судит, только по абсолютному значению , т.е берем по модулю, а, вообще, он может быть и отриц. и положит.):

0,1 – 0,3 - связь слабая

0,3 – 0,5 - связь умеренная

0,5 – 0,7 - связь заметная

0,7 – 0,9 - связь тесная

0,9 – 0,99 - связь очень тесная

Выводы по R:допустим,R=0,76.R^2=0,87, а значит, что связь между валовым доходом и среднегодовой стоимостью основных фондов и оборотных средств тесная. Выводы по R^2 делаются глядя на

 -доля факторной дисперсии в общей дисперсии результата.

Следовательно, вариация валового дохода на 76% обусловлена вариацией факторов, включенных в модель регрессии, то есть вариацией среднегодовой стоимости основных фондов и оборотных средств.



К билету 7,8

 - обычно для множ регрессии, а если парная линейная регрессия, то

 

 

Эта формула действует хороша только для парной регрессии.

Следовательно: . Если r=0,72, то связь тесная (смотрим на модуль) минус показывает, что связь обратная.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: