Пусть в результате наблюдений изучаемого экономического показателя Y удалось выявить один определяющий (доминирующий) фактор X. В этом случае говорят об изучении парной корреляционной связи.
Для изучения корреляции двух случайных величин Х и Y необходимо заручиться эмпирическими данными следующего вида.
X | x1 | x2 | x3 | … | xn |
Y | y1 | y2 | y3 | … | yn |
При первичном анализе все пары наблюдений (xi, yi), i = 1, …, n изображаютна координатной плоскости. В результате получают так называемое корреляционное поле (диаграмму рассеяния).Взаимное положение точек визуально характеризует форму взаимосвязи Х и Y (рис. 1).
Рис. 1. Варианты взаимосвязи между Х и Y
Прямая линия 1 на рис. 1, а достаточно хорошо соответствует эмпирическим данным. Поэтому для описания формы зависимости между X и Y целесообразно выбрать линейную функцию .
На рис. 1, б формавзаимосвязи X и Y близкакквадратичной (кривая 2) и никак не напоминает линейную(кривая 1).
На рис. 1, в между X и Y отсутствует сколько-нибудь определённая взаимосвязь. В частности, прямые 1 и 2,проведенные через центр «облака» наблюдений, одинаково плохи для представления точек наблюдений.
|
|
Рассмотрим подробнее вариант, представленный на рис. 1, а. Пусть статистическая связь между переменными X и Y близка к линейной.
Мерой тесноты линейной связи двух случайных переменных является коэффициент линейной корреляции Пирсона ρ xy, который для выборочных данных (xi, yi) i = 1, …, n оценивают по формуле:
(2)
где – выборочные средние; Sx, Sy – стандартные ошибки.
В расчётах по формуле (2) довольно часто ошибаются, считая, что . Для того, чтобы убедиться в обратном, рекомендуем расписать вручную несколько первых слагаемых при вычислении упомянутых выше средних величин.
Основные свойства выборочного коэффициента корреляции:
1. Коэффициент корреляции принимает значения на отрезке [–1,1], то есть –1 £ rxy £ 1.
2. Если между величинами X и Y существует положительная линейная корреляция, то rxy > 0, если отрицательная, то rxy < 0.
3. Если между величинами X и Y отсутствует линейная корреляционная связь, то rxy = 0.
4. Чем ближе rxy по модулю к 1, тем теснее линейная корреляционная связь между X и Y.
5. Если | rxy |= 1, то величины X и Y связаны функциональной линейной зависимостью.
Коэффициент корреляции rxy вычисляется по выборочным данным и может существенно отличаться от значения коэффициента корреляции ρ xy в генеральной совокупности. Например, ненулевое значение выборочного коэффициента корреляции rxy может быть целиком обусловлено случайным колебанием выборки, на основе которой он вычислен. В такой ситуации rxy может неверно представлять характер взаимосвязи X и Y в генеральной совокупности.
|
|
В силу сказанного необходима проверка гипотезы о статистической значимости коэффициента корреляции ρ xy.
Проверяется основная гипотеза Н 0: ρ xy = 0 – между Х и Y корреляционная связь отсутствует, то есть выборочный коэффициент корреляции rxy статистически не отличим от нуля.
Н 1: ρ xy ≠ 0 – альтернативная гипотеза, соответствующая наличию линейной корреляционной зависимости между X и Y.
По выборке (x 1, y 1), (x 2, y 2), …, (xn, yn) объёма n вычисляется статистика:
, (3)
имеющая при справедливости Н 0 распределение Стьюдента с числом степеней свободы .
С другой стороны, по таблице критических точек распределения Стьюдента для данного уровня значимости α и числа степеней свободы определяем критическое значение t (α / 2;n).
Если | t | > t (α / 2;n), то нулевая гипотеза отклоняется.Это значит, что коэффициент корреляции статистически значим, то есть между X и Y в генеральной совокупности существует линейная корреляционная зависимость.
При | t | ≤ t (α / 2;n) нулевая гипотеза принимается.Это значит, что коэффициент корреляции статистически незначим, то есть между X и Y в генеральной совокупности отсутствует линейная корреляционная зависимость.
Если статистическая значимость коэффициента корреляции подтверждена, то оценку тесноты связи X и Y делают с использованием так называемой шкалы Чеддока (табл. 1).
Таблица 1
Величина | rxy | | 0,1 – 0,3 | 0,3 – 0,5 | 0,5 – 0,7 | 0,7 – 0,9 | 0,9 – 0,99 |
Характеристика силы связи | слабая | умеренная | заметная | высокая | весьма высокая |
Таким образом, результаты корреляционного анализа отвечают на следующие вопросы:
- Имеется ли связь между изучаемыми переменными?
- Какова структура этой связи?
- Как измерить тесноту этой связи?
Дальнейшее изучение взаимосвязи экономических переменных, т. е. получение формулы связи, считают целесообразным при | rxy | > 0,7.