Оценка точности и качества прогнозов

Метод наименьших квадратов (МНК) для модели парной регрессии

МНК – один из базовых методов регрессионного анализа для оценки неизвестных параметров регрессионных моделей по выборочным данным.

Метод основан на минимизации суммы квадратов остатков регрессии.

МНК можно назвать метод решения задачи в любой области, если решение заключается или удовлетворяет некоторому критерию минимизации суммы квадратов некоторых функций от искомых переменных. Поэтому МНК может применяться также для приближенного представления (аппроксимации) заданной функции другими (более простыми) функциями, при нахождении совокупности величин, удовлетв-х уравнениям или ограничениям, колич-во которых превышает колич-во этих величин и т.д.

МНК говорит, что сумма отклонений д.б. минимизирована.

В случае парной линейной регрессионной модели коэффициент детерминации равен квадрату корреляции.

3. Классификация эконометрических моделей

1. По целевому назначению

а) теоретико-аналитические модели

б) прикладные модели

2. По исследуемым экономич-м процессам и содержательной проблематике

а) модели народны хозяйств в целом

б)комплексы моделей производства и потребления

в) комплексы моделей формирования и распределения доходов

г) комплексы моделей формирования трудовых ресурсов

д) комплексы моделей ценообразования

е) комплексы моделей финансовых связей

3. На дескриптивные и нормативные модели

4. По характеру отражения причинно-следственных связей

5. По способу отражения факторов времени

Оценка точности и качества прогнозов

5. Этапы эконометрического моделирования

1. Аналитический

2. Дополнительные показатели моделирования

3. Предварительный выбор тенденции (тренда)

4. Показатели вариации

a. Средний уровень ряда

b. Дисперсия (сигма квадрат) – отношение суммы квадрата отклонения каждого элемента ряда к среднему уровню ряда к количеству этих элементов

c. Среднее квадратическое отклонение (сигма - корень из дисперсии)

d. Коэффициент вариации (V) – отношение среднего квадратического отклонения к среднему уровню ряда

Вариация = волотильность (вариация самого ряда (1ый и посл.эл-т) – во сколько раз изменился показатель, внутрирядовая вариация)

5. Проверка распределения результативного признака на близость к известным распределениям (шаблонам) – в работе – способ Вестергарда

6. Расчет показателей корреляции (теснота связи)

Корреляцияэто статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом, изменения одной или нескольких из этих величин приводят к систематическому изменению другой или других величин. Математической мерой Корреляции двух случайных величин служит коэффициент Корреляции. Отношение между двумя или более рядами ценностей. Чем теснее связаны между собой две (или больше) серии, тем выше степень Корреляции.

Парная линейная корреляция [-1,1] – отношение разности среднего к произведению ср.квадратического отклонения.

Если коэф.парной корреляции от 0,9 до 1 – теснота связи высокая, если от 0 до 0,1 – то слабая, если отрицательная – связь обратная (-0,1 – слабая, -0,9 – сильная).

Связь – линейная, либо нелинейная (2 порядка, 3 порядка, log)

7. Стандартные ошибки коэффициентов регрессионной модели (h или эпсилон)

a. Квадратическая ошибка коэффициента корреляции (h)

Достоверность коэффициентов ≤5%

8. Проверка существенности коэффициента модели регрессии с помощью критерия Стьюдента

Если расчетное значение критерия Стьюдента меньше табличного, то испытуемый показатель несущественен, им можно пренебречь.

Если расчетное значение больше табл. значения, то показатель существенен, им пренебречь нельзя.

9. Определение параметров регрессии

a. Метод наименьших квадратов (сумма квадратов отклонений должна быть минимальной)

10. Проверка модели на достоверность

a. Коэффициент совокупной детерминации (R2 [0,1]дисперсия факторных признаков делить на дисперсию результативного признака)

Если коэффициент детерминации меньше 0,9 (0,95), недостоверность построенной модели.

Если от 0,9 до 1 – исследования достоверны.

Недостоверной модель может быть по след. причинам:

А) в экономике все модели многофакторные – недостаточно факторных переменных включено в модель, либо включены не те.

Б) неправильно выбрана форма связи (6 этап) – может быть нелинейная связь (2 порядка, 3 порядка, log).

11. Прогнозирование

В статистике прогнозирование – экстраполяция (перспективы на будущее или ретроспективы в прошлое)

Прогнозы бывают точечные (конкретная цифра) и интервальные (от – до)

11.1. Экстраполяция (вне, снаружи) — особый тип аппроксимации, при котором функция аппроксимируется вне заданного интервала, а не между заданными значениями.

Экстраполировать можно через цепной индекс (Кт) – отношение изменения смежных элементов

11.2. Интерполя́ция (внутри) — в вычислительной математике способ нахождения промежуточных значений величины по имеющемуся дискретному набору известных значений.

11.3. Прогноз по тренду (теоретической линии регрессии)

6. Доверительные интервалы прогнозов

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитывается t-критерий Стьюдента и доверительные интервалы каждого из показателей. Доверительная или интервальная оценка позволяет по данным выборки указать интервал, в кот. с высокой вероятностью следует писать истинное, но не известное значение параметра распределения генеральной совокупности. Такие интервалы называются доверительными.

Если в границы доверительного интервала попадает 0, т.е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается нулевым, т.к. он не может одновременно принимать и положительные и отрицательные значения.

7. Классификация эконометрических переменных и типов данных. Проблемы, связанные сданными

В эконометрических моделях в основном используются данные трёх типов:

1) пространственные данные (cross-sectional data);

2) временные ряды (time-series data);

3) панельные данные (panel data).

Пространственными данными называется совокупность экономической информации, которая характеризует различные объекты, однако полученной за один и тот же период или момент времени.Пространственные данные являются выборочной совокупностью из некоторой генеральной совокупности. Примером пространственных данных может служить комплекс экономической информации по какому-либо предприятию (численность работников, объём производства, размер основных фондов), объёмах потребления продукции определённого вида, данные о ВВП различных стран в каком-либо конкретном году и т. д.

Временными данными называется совокупность экономической информации, которая характеризует один и тот же объект, но за разные периоды времени.

Отдельно взятый временной ряд можно рассматривать как выборку из бесконечного ряда значений показателей во времени. Примером временных данных могут служить данные о динамике индекса потребительских цен, ежедневные обменные курсы валют.

Отличия временных данных от пространственных данных:

1) единицы временных рядов подвержены явлению автокорреляции (зависимости между прошлыми и текущими наблюдениями временного ряда), т. е. они не являются статистически независимыми в отличие от единиц случайной пространственной выборки;

2) единицы временных рядов не являются одинаково распределёнными величинами;

3) в отличие от пространственных данных временные данные естественным образом упорядочены во времени.

Панельными данными называются данные, содержащие сведения об одном и том же множестве объектов за ряд последовательных периодов времени.

Панельные данные являются обобщением или комбинацией пространственных и временных данных. Примером панельных данных могут служить показатели хозяйственной деятельности совокупности предприятий, которые собираются каждый год. В этом случае мы получим массив данных, в котором содержатся и данные об однородных объектах за один и тот же период времени, и последовательные значения одной экономической переменной в различные периоды времени. Но если совокупность предприятий из года в год будет различна, то такие данные уже не будут панельными.

Набором признаков называется совокупность экономической информации, которая характеризует изучаемый процесс или объект.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: