Понятие множественной регрессии
Множественная регрессия – уравнение связи с несколькими независимыми переменными:
y = f (x1,x2,...,xp),
где у – зависимая переменная (результативный признак);
х1,х2,…,хp– независимые переменные (факторы).
Множественная регрессия применяется в ситуациях, когда из множества факторов, влияющих на результативный признак, нельзя выделить один доминирующий фактор и необходимо учитывать влияние нескольких факторов.
Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.
Постановка задачи множественной регрессии. По имеющимся данным n наблюдений за совместным изменением p +1 переменной y и xj и {(yi, xj,i); j =1,2,..., p; i =1,2,..., n } (табл. 3.1) необходимо определить аналитическую зависимость ŷ=f(x1, x2,..., xp), наилучшим образом описывающую данные наблюдений.
Таблица 3.1
Результаты наблюдений
y | x1 | x2 | … | xp | |
y1 | x11 | x21 | … | xp1 | |
y2 | x12 | x22 | … | xp2 | |
… | … | … | … | … | … |
n | yn | x1n | x2n | … | xpn |
Как и в случае парной регрессии, построение уравнения множественной регрессии осуществляется в два этапа:
– спецификация модели;
– оценка параметров выбранной модели.
Спецификация модели включает в себя решение двух задач:
- отбор p факторов xj, наиболее влияющих на величину y;
- выбор вида уравнения регрессии ŷ = f (a 1, a 2,..., as, x 1, x 2,..., xp), где a 1, a 2,..., as, – параметры модели.