Практическая часть. Задание 1. Используя данные из таблицы П1 Приложения 1 (файл analiz. Sta),построитьлинейную многофакторную регрессионную модель и провести анализ зависимости

Задание 1. Используя данные из таблицы П1 Приложения 1 (файл analiz.sta),построитьлинейную многофакторную регрессионную модель и провести анализ зависимости производительности труда (Y) от трудоемкости единицы продукции (X1), удельного веса комплектующих изделий (Х3) и фондоотдачи (X7).

Основные действия те же, что и при построении однофакторной регрессионной модели (см. Лабораторная работа №11). В данном примере независимой переменной является Y — производительности труда, зависимыми – трудоемкость единицы продукции (X1 ), удельный вес комплектующих изделий (Х3) и фондоотдача (X7).

Сначала следуетоткрыть файл исходных данных (analiz.sta), затем переключиться в модуль MultipleRegression, сделать соответствующие установки в окне Selectdependentandindependentvariablelist и установить флажок в поле Reviewdescr.stats,corr.Matrix(Обзор описательных статистик, корреляционная матрица), что позволит провести предварительный анализ исходных переменных и построить корреляционную матрицу, анализ которой дает возможность сделать важные выводы о структуре связей между выбранными переменными (см. рис. 12.1).

Рис. 12.1 – Окно Multiple Regression

После того, как будет нажата кнопка ОК, на экране появится окно Correlations (рис.12.2), в котором представлены значения коэффициентов парной корреляции. Не рекомендуется включать в модель переменные, слабо связанные с результативным признаком – это фактор X7 (r_yx7=0.293).

Наиболее тесную связь с результирующим признаком Y имеют факторы Х1 (r_{y x1}=0,816) и X3 (r_yx3=0,64). Их и нужно оставить для построения модели (см. рис. 12.2).

Рис.12.2 – Окно Correlations

Далее следует вернуться в окно Selectdependentandindependentvariablelist, определить в качестве независимых переменных факторы X1 и X 3 и нажать кнопку ОК. Система произведет вычисления, и на экране появится следующее окно результатов (см. рис. 12.3).

Рис.12.3 – Окно Multiple Regression Results

В информационной части окна содержатся краткие сведения о результатах анализа, а именно:

коэффициент детерминации R ^2,= 0,688. Это значение показывает, что построенная регрессия объясняет более 68,8% разброса значений переменной Y относительно среднего;

значение F -критерия Фишера и уровень значимости р. В данном примере мы имеем достаточно высокое значение F-критерия — 29,795, а представленный в окне уровень значимости p = 0,00 показывает, что построенная регрессия высоко значима.

Рассмотрим вторую часть информационного окна. В ней представлена информация о значимых и незначимых оценках регрессионных коэффициентов. При этом высвечивается строка

x1 beta = -0,69, x3 beta = 0.195

и приводится пояснение Significantbeta'sarehighlighted (Значимые beta высвечены). Отметим, что в данном случае beta есть стандартизованные коэффициенты В₁, т. е. коэффициент при независимой переменной X1 и В3, т. е. коэффициент при независимой переменной X3.

Перейдем в функциональную часть окна результатов.

Нажав кнопку Regressionsummary (Итоговый результат регрессии), получим на экране Spreadsheet (Электронная таблица вывода) электронную таблицу с численными результатами оценивания регрессионной модели (см. рис. 12.4).

Рис.12.4 – Параметры модели множественной регрессии

Верхняя часть окна – информационная, в нижней части находятся параметры модели. В столбце В, например, коэффициенты b₀ = 12,428, b₁ =-17,108, b3 =2,836.

Таким образом, полученное уравнение множественной регрессии имеет вид

Y = -17,108∙X₁ + 2,836∙X₃ +12,428.

Значения критериев Стьюдента (t) позволяют оценить значимость коэффициентов уравнения регрессии, критерий Фишера (F=29,759) и скорректированныйкоэффициент детерминации(AdjustedR1=0,6648 ) – значимость построенной модели.

Для получения описательной статистики следует вернуться в окно Multiple Regression Results,нажать кнопкуCorrelations & desc.stats,после чего на экране появится окно ReviewDescriptiveStatistics(см. рис. 12.3), из которого следует выбрать необходимые для анализа статистики:

кнопкой Means&SD (поставив флажок в поле SD=Sums of Squares/N) смещенные среднеквадратичные отклонения;

кнопкой Correlations – коэффициенты корреляции.

Из окна MultipleRegressionResults,нажав кнопкуAnalysisofvariance,можно получить таблицу адекватности – значения общей суммы квадратов, регрессионной суммы квадратов, сумму квадратов остатков, критерий Фишера, число степеней свободы, уровень значимости (см. рис.12.5).

Рис.12.5 – Таблица адекватности

Чтобы посмотреть, как связаны остатки с наблюдаемыми значениями, в окне MultipleRegressionResults следует нажать кнопку ResidualAnalysis (Анализ остатков) и в появившемся окне выбрать команду Obs&Residuals (см. рис.12.6).

Чтобы посмотреть, как наблюдаемые значения связаны с предсказанными с помощью построенной модели, следует нажать кнопку Pred&observed(F) (см. рис. 12.7).

Рис.12.6 – График наблюдаемых	Рис.12.7 – График наблюдаемых
переменных остатков	и предсказанных значений

Из графиков на рис. 12.6 и рис. 12.7 видно, что модель достаточно адекватно описывает данные. Следовательно, с ее помощью можно делать достаточно точные выводы о зависимости производительности труда от трудоемкости единицы продукции и удельного веса комплектующих изделий.

Чтобы получить прогноз значения зависимой переменной Y, в окнеMultipleRegressionResultsследует нажать кнопкуPredictdependentvarи в появившееся на экране окноSpecifyvaluesforindep.varsввести новые значения Х1, например 0,18, и X3, например 0,55, и нажать ОК (см. рис. 12.8).

В результате в окне Predictingvaluesfor(см. рис.12.9)на основании полученного ранее уравнения регрессии Y = -17,108∙X₁ + 2,836∙X₃ +12,428будет рассчитано прогнозируемое значение производительности труда Y(10,908) при снижении трудоемкости единицы продукции X1 до 0,18 и уровне удельного веса комплектующих изделий X3,равномзначению 0,55.

Рис. 12.8 –Окно	Рис.12.9 – Окно
Specify values for indep. Vars	Predicting values for

Задание 2. на основании условия Задания 1 (см. выше) построить нелинейную модель, отражающую зависимость производительности труда Y от трудоемкости единицы продукции X1 и удельного веса комплектующих изделий X3.

Для переключения в этот модуль следует в переключателе разделов (Statistica Module Switcher) выбрать раздел Nonlinear Estimation, после чего на экране появится окно с перечнем доступных пользователю нелинейных функций для построения регрессионной модели (см. рис. 12.10). Особый интерес вызывает раздел « Функции, определенные пользователем» (User-specified regression). Здесь пользователь сам может математически задать вид уравнения регрессии и рассчитать и оценить его.

Рис.12.10 – Окно Nonlinear Estimation

Для этого в окнеUser-Specified Regression Function (рис.12.11)нужно нажать Function to be еstimated & loss function.

Рис.12.11 – Окно User-Specified Regression Function

и в полеEstimated function(рис. 12.12)определить уравнение регрессии, которое требуется рассчитать и оценить.

Рис.12.12 – Окно Estimated function & loss function

В нижней части окна приведены допускаемые в формулах арифметические операторы и стандартные функции, а также примеры их использования для записи выражений.

Созданную функцию можно сохранить для дальнейшего использования, для чего следует нажать Save As.

Для оценки отклонений между расчетным и фактическим значениями результирующего параметра (Y ) в поле Loss functionпо умолчанию находится функция (OBS-PRED)**2. Сюда также при необходимости можно ввести другую функцию.

Далее следует нажать ОК, перейти в окно Model estimation(см. рис.12.13), определить метод (Estimation metod), при помощи которого будут рассчитываться коэффициенты уравнения регрессии, число итераций и точность вычислений. Кроме того, обозначить флажком поле Asymptotic standart errorsдля включения в итоговый отчет оценок стандартных ошибок и уровней значимости.

После проведения расчетов результаты, по которым можно оценить адекватность модели по описанной выше методике, будут находиться в таблице окна Model(см. рис.12.14).

Рис.12.13 – Окно Model estimation

Рис.12.14 – Окно Model

Задания для самостоятельной работы

Задание 1. Исследовать влияние факторов x1, x2,..., х_n на результативный признак Y [6]. Построив матрицу коэффициентов парной корреляции и корреляционное поле, сделать предположение о наличии и типе связи между исследуемыми факторами и рассчитать экономико-математическую многофакторную регрессионную модель, отражающую влияние показателей экономического роста предприятия за период 1997 – 2002 г.г. x1, x2,..., х_n на результативный признак Y. (см. таблицу 12.1). Оценить адекватность модели. Построить график наблюдаемых переменных остатков и график наблюдаемых и предсказанных значений.

Использовать модуль Multiple Regression.

Таблица 12.1. Показатели экономического роста предприятия

Период	ИПЦ	Выручка	Себесто-имость	Прибыль от реализации	Балан-совая прибыль	Стоимость основных фондов	Рентабель-ность общая	Рентабель-ность собственная
	x₀	x₁	x₂	x₃	x₄	x₅	x₆	x₇
1-1997	132,2						1,2	4,7
2-1997	130,3						1,1	4,3
3-1997	126,6						1,1	4,3
4-1997	115,4						0,5	1,8
1-1998	107,3							19,5
2-1998	105,6						4,2	20,4
3-1998	105,7						5,6	27,1
4-1998	104,5						5,7	28,2
1-1999								12,8
2-1999	103,5						2,3	14,2
3-1999	103,3						2,1
4-1999	100,5						1,8	11,3
1-2000	107,6						5,4
2-2000	109,5						4,9	19,1
3-2000	120,8						3,8	15,1
4-2000							3,1	10,7
1-2001	113,2						5,1	22,6
2-2001	111,4						5,1	22,4
3-2001	111,7						5,1	22,4
4-2001	100,2						5,5	24,2
1-2002	105,1						4,8	20,6
2-2002	105,6						5,2	22,4
3-2002	106,1						5,8
4-2002	107,2						6,4	27,4
1-2003	106,1						6,8	22,1
2-2003							6,9	22,4
3-2003	103,4							25,4
4-2003	103,4							26,2
1-2004	103,9							22,6
2-2004	103,8						7,2	22,5
3-2004	103,8						7,3	25,1
4-2004	103,7						3,4	25,2

Варианты заданий

№ варианта	Результативный признак	Номера факторных признаков
	x₀	x₁, x₂, x₃, x₄
	x₀	x₂, x₃, x₄, x₅
	x₀	x₃, x₄, x₅, x₆
	x₀	x₄, x₅, x₆, x₇
	x₅	x₁, x₂, x₃, x₄
	x₅	x₁, x₂, x₃, x₇
	x₅	x₂, x₃, x₆, x₇
	x₇	x₂, x₃, x₄, x₅
	x₇	x₃, x₄, x₅, x₆
	x₇	x₁, x₂, x₅, x₆

Задание 2. Поскольку не все показатели экономического роста предприятия x1, x2,..., х_n имеют тесную корреляционную связь с результирующим признаком Y (см. таблицу 12.1), по данным своего варианта построить многофакторную регрессионную модель нелинейной структуры, наиболее адекватно описывающую исходные данные. Использовать модуль Nonlinear Estimation.