Простейшая модель – парная линейная регрессия

Мы ищем взаимосвязь между двумя величинами в самой простой форме – в форме линейной зависимости:        у = b1 + b2х

При этом мы предполагаем, что обе наши величины носят по крайней мере частично случайный характер, а нашей задачей является выяснить, существует ли между ними линейная зависимость и найти такие коэффициенты b1 и b2, которые являются в некотором смысле «наилучшими».

Прояснению прежде всего подлежит последний термин – что значит «наилучшие»? – попробуем разобраться. Реально мы располагаем на старте некоторыми наборами значений {xi,yi} (или геометрически – набором точек {Pi}). При этом как минимум одна переменная yi содержит случайную составляющую ui. Поэтому точная запись нашего соотношения будет иметь вид:

 

yi = b1 + b2 xi + ui              (2.1)

 

Т.е. мы предполагаем, что в каждом наблюдении величина yj состоит из двух компонент: 1)неслучайной составляющей b1 + b2 xi    и    2)случайного члена ui.

 

Неизбежность появления случайного члена связана с несколькими причинами.

1. Неполнота модели. Например, мы полагаем, что главной причиной инфляции последних лет был популизм правительств, выразившийся в необоснованном росте зарплат работников, не подкрепленным соответствующим ростом производительности труда. Тогда должна быть линейная связь между темпом инфляции и ростом зарплат. Однако в такой модели мы очевидным образом игнорируем другие составляющие инфляции, например, рост цен на углеводороды. Пусть вклад этих составляющих носит подчиненный характер, но он есть, а мы его не включили в модель, это приведет к появлению немотивированных в рамках модели отклонений, которые мы относим на счет случайной компоненты.

2. Ошибки измерения. Вполне очевидно, что и в определении средней зарплаты, и в определении инфляции присутствуют неизбежные ошибки уже потому, что эти величины определяются по выборочным данным, а не по генеральной совокупности (чтобы точно определить величину инфляции за месяц нужно получить данные по всем продуктовым рынкам, по всем магазинам и по всем видам продукции, что, разумеется, нереально). Подобные ошибки измерения присутствуют неизбежно и всегда при получении любых экономических показателей.

3. Не вполне адекватный выбор математической модели. Мы предположили, что связь между нашими переменными линейна, а в реальности она носит более сложный характер. Тем не менее в первом приближении и в ограниченном диапазоне вполне целесообразно рассмотреть линейную модель, но при этом неизбежны ошибки, которые мы тоже относим на счет случайного члена.

Мы перечислили лишь наиболее часто встречающиеся факторы, которые могут быть источниками наших ошибок. Но уже из этого перечня ясно, что отклонения реальности от модели имеют место всегда, вопрос лишь в том, как оценить масштаб этих отклонений и какой масштаб отклонений считать приемлемым.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: