Регрессионный анализ

Регрессионный анализ – область статистического анализа, изучающая зависимость измерений значений переменных от одной или нескольких зависимых переменных (факторов).

Задачами регрессионного анализа являются установление формы зависимости между переменными, оценка функции регрессии, оценка неизвестных значений (прогноз значений) зависимой переменной.

Регрессионный анализприменим только по отношению к количественно выраженным переменным, измеряемым в метрических шкалах.

Точная зависимость Y от X называется уравнением регрессии Y=f(X).

Одномерное линейное уравнение регрессии: Y = b1X + b0

Уравнение позволяет предсказывать для любого значения Х соответствующее значение переменной Y.

Для каждой пары данных (xi, yi), полученных в ходе эмпирического исследования, вычисленное по уравнению регрессии значение ỹ и значение yi чаще всего не совпадает.

Yi=b1Xi + b0 + ei, - для точки с координатами (Xi, Yi)

где ei – ошибка оценивания Y для i –го объекта

Значения ei=yi-ỹ называются ошибками оценки или остатками.

Нахождение коэффициентов регрессии сводится к интегральной минимизации этих остатков таким образом, чтобы их сумма квадратов была минимальной из всех возможных: .

Параметры линейной регрессии (МНК):

Коэффициент регрессии: b1 = .

Свободный член регрессии может быть вычислен:

Где - средние значения переменных X и Y соответственно;

Коэффициент регрессии находится в тесной связи с коэффициентом корреляции. Коэффициент корреляции представляет собою среднее геометрическое из коэффициентов регрессии признаков:

r=

Коэффициент линейной регрессии и коэффициент корреляции Пирсона связаны следующим соотношением:

Где σy, σx – стандартные отклонения этих переменных.

Проверка, насколько данная модель уравнения регрессии действительно удовлетворяет экспериментальным данным осуществляется при помощи F-отношение, по формуле:

,

где N – объем выборки (число наблюдений).

r2xy- коэффициент множественной детерминации

Здесь альтернативная гипотеза утверждает, что модель уравнения регрессии действительно удовлетворяет экспериментальным данным. Нулевая гипотеза о том, что между переменными X и Y отсутствует значимая связь.

Если, принимается альтернативная гипотеза о регрессионном уравнении в целом, то необходимо проверить частные гипотезы в отношении регрессионных коэффициентов.

Стандартная ошибка выборочного коэффициента регрессии может быть рассчитана при помощи следующего уравнения:

Sbxy=

Достоверность выборочного коэффициента регрессии проверяется с помощью критерия Стьюдента с числом степеней свободы n=n-2 и принятым уровнем статистической значимости. Нулевая гипотеза сводится к предположению, что в генеральной совокупности коэффициент регрессии равен нулю.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: