Парная корреляция

Пусть в результате наблюдений изучаемого экономического показателя Y удалось выявить один определяющий (доминирующий) фактор X. В этом случае говорят об изучении парной корреляционной связи.

Для изучения корреляции двух случайных величин Х и Y необходимо заручиться эмпирическими данными следующего вида.

X x1 x2 x3 xn
Y y1 y2 y3 yn

 
 

При первичном анализе все пары наблюдений (xi, yi), i = 1, …, n изображаютна координатной плоскости. В результате получают так называемое корреляционное поле (диаграмму рассеяния).Взаимное положение точек визуально характеризует форму взаимосвязи Х и Y (рис. 1).

Рис. 1. Варианты взаимосвязи между Х и Y

Прямая линия 1 на рис. 1, а достаточно хорошо соответствует эмпирическим данным. Поэтому для описания формы зависимости между X и Y целесообразно выбрать линейную функцию .

На рис. 1, б формавзаимосвязи X и Y близкакквадратичной (кривая 2) и никак не напоминает линейную(кривая 1).

На рис. 1, в между X и Y отсутствует сколько-нибудь определённая взаимосвязь. В частности, прямые 1 и 2,проведенные через центр «облака» наблюдений, одинаково плохи для представления точек наблюдений.

Рассмотрим подробнее вариант, представленный на рис. 1, а. Пусть статистическая связь между переменными X и Y близка к линейной.

Мерой тесноты линейной связи двух случайных переменных является коэффициент линейной корреляции Пирсона ρ xy, который для выборочных данных (xi, yi) i = 1, …, n оценивают по формуле:

(2)

где – выборочные средние; Sx, Sy – стандартные ошибки.

В расчётах по формуле (2) довольно часто ошибаются, считая, что . Для того, чтобы убедиться в обратном, рекомендуем расписать вручную несколько первых слагаемых при вычислении упомянутых выше средних величин.

Основные свойства выборочного коэффициента корреляции:

1. Коэффициент корреляции принимает значения на отрезке [–1,1], то есть –1 £ rxy £ 1.

2. Если между величинами X и Y существует положительная линейная корреляция, то rxy > 0, если отрицательная, то rxy < 0.

3. Если между величинами X и Y отсутствует линейная корреляционная связь, то rxy = 0.

4. Чем ближе rxy по модулю к 1, тем теснее линейная корреляционная связь между X и Y.

5. Если | rxy |= 1, то величины X и Y связаны функциональной линейной зависимостью.

Коэффициент корреляции rxy вычисляется по выборочным данным и может существенно отличаться от значения коэффициента корреляции ρ xy в генеральной совокупности. Например, ненулевое значение выборочного коэффициента корреляции rxy может быть целиком обусловлено случайным колебанием выборки, на основе которой он вычислен. В такой ситуации rxy может неверно представлять характер взаимосвязи X и Y в генеральной совокупности.

В силу сказанного необходима проверка гипотезы о статистической значимости коэффициента корреляции ρ xy.

Проверяется основная гипотеза Н 0: ρ xy = 0 – между Х и Y корреляционная связь отсутствует, то есть выборочный коэффициент корреляции rxy статистически не отличим от нуля.

Н 1: ρ xy ≠ 0 – альтернативная гипотеза, соответствующая наличию линейной корреляционной зависимости между X и Y.

По выборке (x 1, y 1), (x 2, y 2), …, (xn, yn) объёма n вычисляется статистика:

, (3)

имеющая при справедливости Н 0 распределение Стьюдента с числом степеней свободы .

С другой стороны, по таблице критических точек распределения Стьюдента для данного уровня значимости α и числа степеней свободы определяем критическое значение t/ 2;n).

Если | t | > t/ 2;n), то нулевая гипотеза отклоняется.Это значит, что коэффициент корреляции статистически значим, то есть между X и Y в генеральной совокупности существует линейная корреляционная зависимость.

При | t |t/ 2;n) нулевая гипотеза принимается.Это значит, что коэффициент корреляции статистически незначим, то есть между X и Y в генеральной совокупности отсутствует линейная корреляционная зависимость.

Если статистическая значимость коэффициента корреляции подтверждена, то оценку тесноты связи X и Y делают с использованием так называемой шкалы Чеддока (табл. 1).

Таблица 1

Величина | rxy | 0,1 – 0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 0,9 – 0,99
Характеристика силы связи слабая умеренная заметная высокая весьма высокая

Таким образом, результаты корреляционного анализа отвечают на следующие вопросы:

  1. Имеется ли связь между изучаемыми переменными?
  2. Какова структура этой связи?
  3. Как измерить тесноту этой связи?

Дальнейшее изучение взаимосвязи экономических переменных, т. е. получение формулы связи, считают целесообразным при | rxy | > 0,7.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: