Простейшая модель – парная линейная регрессия

Мы ищем взаимосвязь между двумя величинами в самой простой форме – в форме линейной зависимости: у = b₁ + b₂х

При этом мы предполагаем, что обе наши величины носят по крайней мере частично случайный характер, а нашей задачей является выяснить, существует ли между ними линейная зависимость и найти такие коэффициенты b₁ и b₂, которые являются в некотором смысле «наилучшими».

Прояснению прежде всего подлежит последний термин – что значит «наилучшие»? – попробуем разобраться. Реально мы располагаем на старте некоторыми наборами значений {x_i,y_i} (или геометрически – набором точек {P_i}). При этом как минимум одна переменная y_i содержит случайную составляющую u_i. Поэтому точная запись нашего соотношения будет иметь вид:

y_i = b₁ + b₂ x_i + u_i (2.1)

Т.е. мы предполагаем, что в каждом наблюдении величина y_j состоит из двух компонент: 1)неслучайной составляющей b₁ + b₂ x_i и 2)случайного члена u_i.

Неизбежность появления случайного члена связана с несколькими причинами.

1. Неполнота модели. Например, мы полагаем, что главной причиной инфляции последних лет был популизм правительств, выразившийся в необоснованном росте зарплат работников, не подкрепленным соответствующим ростом производительности труда. Тогда должна быть линейная связь между темпом инфляции и ростом зарплат. Однако в такой модели мы очевидным образом игнорируем другие составляющие инфляции, например, рост цен на углеводороды. Пусть вклад этих составляющих носит подчиненный характер, но он есть, а мы его не включили в модель, это приведет к появлению немотивированных в рамках модели отклонений, которые мы относим на счет случайной компоненты.

2. Ошибки измерения. Вполне очевидно, что и в определении средней зарплаты, и в определении инфляции присутствуют неизбежные ошибки уже потому, что эти величины определяются по выборочным данным, а не по генеральной совокупности (чтобы точно определить величину инфляции за месяц нужно получить данные по всем продуктовым рынкам, по всем магазинам и по всем видам продукции, что, разумеется, нереально). Подобные ошибки измерения присутствуют неизбежно и всегда при получении любых экономических показателей.

3. Не вполне адекватный выбор математической модели. Мы предположили, что связь между нашими переменными линейна, а в реальности она носит более сложный характер. Тем не менее в первом приближении и в ограниченном диапазоне вполне целесообразно рассмотреть линейную модель, но при этом неизбежны ошибки, которые мы тоже относим на счет случайного члена.

Мы перечислили лишь наиболее часто встречающиеся факторы, которые могут быть источниками наших ошибок. Но уже из этого перечня ясно, что отклонения реальности от модели имеют место всегда, вопрос лишь в том, как оценить масштаб этих отклонений и какой масштаб отклонений считать приемлемым.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

9 10 11 12 13 14 15

Калибры, виды и назначение. Контроль параметров макрогеометрии деталей калибрами

Классификация методов обучения

Примеры решения задач. Определите рентабельность продукции по следующим данным: количество выпущенных изделий за квартал - 1 500 штук

Виды деятельности. Существуют различные классификации видов деятельности:

Показатели движения численности работников. Пример 1,2

Технология изготовления порошков

Самый сильный аргумент, почему эволюция человека не могла быть