В прогнозных расчетах по уравнению регрессии определяется предсказываемое ур значение как точечный прогноз при т. е. путем подстановки в линейное уравнение регрессии соответствующего значения х. Однако точечный прогноз явно нереален, поэтому он дополняется расчетом стандартной ошибки , т. е. и соответственно мы получаем интервальную оценку прогнозного значения у*: .
Для того чтобы понять, как строится формула для определения величин стандартной ошибки подставим в уравнение линейной регрессии выражение параметра а:
тогда уравнение регрессии примет вид:
Отсюда следует, что стандартная ошибка зависит от ошибки и ошибки коэффициента регрессии b, т. е.
(2.23)
Из теории выборки известно, что Используя в качестве оценки остаточную дисперсию на одну степень свободы S2, получим формулу расчета ошибки среднего значения переменной у:
(2.24)
Ошибка коэффициента регрессии, как уже было показано, определяется формулой:
Считая, что прогнозное значение фактора получим следующую формулу расчета стандартной ошибки предсказываемого по линии регрессии значения, т. е. :
|
|
(2.25)
Соответственно имеет выражение:
(2.26)
Рассмотренная формула стандартной ошибки предсказываемого среднего значения у при заданном значении характеризует ошибку положение линейной регрессии. Величина стандартной ошибку достигает минимума при и возрастает по мере ошибки того, как «удаляется» от в любом направлении. Иными словами, чем больше разность между и тем больше ошибка с которой предсказывается среднее значение у для заданного значения . Можно ожидать наилучшие результаты прогноза, если признак – факторов х находиться в центре области наблюдений х, и нельзя ожидать хороших результатов прогноза при удалении от . Если же значение оказывается за пределом наблюдаемых значений х, используемых при построении линейной регрессии, то результаты прогноза ухудшаются в зависимости от того, насколько отклоняется от области наблюдаемых значений фактора х.
Для примера 2.1 составит:
При ,
При
Соответственно составит эту же величину и при . Для прогнозируемого значения 95% доверительные интервалы при заданном определяются выражением: т.е. или
При прогнозное значение у составит:
ур = -5,79+ 36,84-4= 141,57, которое представляет собой точечный прогноз.
Прогноз линии регрессии в интервале составит:
На графике, приведенном на рис. 2.5, доверительные границы для представляют собой гиперболы, расположенные по обе стороны от линии регрессии. Рис. 2.5 показывает, как изменяются пределы в зависимости от изменения : две гиперболы по обе стороны от линии регрессии определяют 95 % доверительные интервалы для среднего значения у при заданном значении х.
|
|
Однако фактические значения у варьируют около среднего значения . Индивидуальные значения у могут отклоняться от на величину случайной ошибки, дисперсия которой оценивается как остаточная дисперсия на одну степень свободы S2. Поэтому ошибка предсказываемого индивидуального значения у должна включать не только стандартную ошибку но и случайную ошибку S.
Рис. 2.5. Доверительный интервал линии регрессии:
а — верхняя доверительная граница; б — линия регрессии;
в — доверительный интервал для при ;
г - нижняя доверительная граница.
Средняя ошибка прогнозируемого индивидуального значения у составит:
(2.27)
По данным примера 2.1 получим:
Доверительные интервалы прогноза индивидуальных значений у при с вероятностью 0,95 составят: 141,57 ± 2,57 • 8,01, или 141,57 ± 20,59, это означает, что .
Интервал достаточно широк прежде всего за счет малого объема наблюдений.
При прогнозировании на основе уравнения регрессии следует помнить, что величина прогноза зависит не только от стандартной прогноза ошибки индивидуального значения у, но и от точности прогноза значение фактора х. Его величина может задаваться на основе анализа других моделей исходя из конкретной ситуации, а также анализа динамики данного фактора.
Рассмотренная формула средней ошибки индивидуального значения признака может быть использована также для оценки существенности различия предсказываемого значения и некоторого гипотетического значения.
Предположим для примера 2.1, что в предстоящем году в связи со стабилизацией экономики при выпуске продукции в 8 тыс.ед. затраты на производство не превысят 250 млн. руб. Означает величина ли это действие изменение закономерности или же данная величина затрат соответствует регрессионной модели?
Для того чтобы ответить на это вопрос, найдем точечный прогноз при х=8, т.е.
Предполагаем значение затрат, исходя из экономической ситуации, составляет 250,0. Для оценки существенности, различая этих величин, определим среднюю ошибку прогнозируемого значения:
Сравним ее с величиной предполагаемого снижения издержек производства,
т. е. 38,93.
Поскольку оценивается значимость только уменьшения затрат, то используется односторонний t - критерий Стьюдента. При ошибке в 5% с пятью степенями свободы tтабл = 2,015. Следовательно, предполагаемое уменьшение затрат значимо отличается от прогнозируемого по модели при 95 % - ном уровне доверия. Однако если увеличить вероятность до 99 %, при ошибке в 1 % фактическое значение t - критерия оказывается ниже табличного 3,365, и рассматриваемое различие в величине затрат статистически незначимо.