Grubbs' Test (assumes normality)

Sorted Values

    Studentized Values Studentized Values Modified
Row Value Without Deletion With Deletion MAD Z-Score
  0,0 -1,4579 -1,48899 -1,62213
  1,4 -1,43562 -1,46558 -1,59472
  4,7 -1,38311 -1,41053 -1,53011
  5,0 -1,37834 -1,40553 -1,52423
  7,2 -1,34334 -1,36893 -1,48116
...        
  239,8 2,35758 2,4675 3,07294
  240,3 2,36554 2,4765 3,08273
  240,4 2,36713 2,47831 3,08469
  251,5 2,54374 2,68026 3,30202
  273,0 2,88583 3,0834 3,72297
19 X 318,5 3,60979    
24 X 422,3 5,26136    

Grubbs' Test (assumes normality)

Test statistic = 2,88583

P-Value = 0,232156

Рис. 2.0 Коробчатая диаграмма показателя Y_selected

Анализ переменной Y_norm

  1. На коробчатой диаграмме для показателя Y_norm (Рис. 2.1) наблюдаются аномальные значения.

Рис. 2.1 Коробчатая диаграмма показателя Y_norm.

2. На гистограмме (Рис. 2.2) представленно распределение частот показателя Y_norm.

Рис. 2.2 Гистограмма распределения показателя Y_norm.

3. Значение коэффициента вариации, представленного в таблице (Табл. 2.1), превышает 33%, поэтому совокупность является неоднородной. Среднее арифметическое значение Y_norm в 1,46 раз больше среднего квадратического отклонения.

Табл. 2.1 – Таблица описательных статистик показателя Y_norm.

Count  
Average 1,45783
Standard deviation 0,999989
Coeff. of variation 68,5944%
Minimum 0,0
Maximum 4,344
Range 4,344
Stnd. skewness 3,20299
Stnd. kurtosis 1,23978

Анализ переменной X1_norm

  1. На коробчатой диаграмме для показателя X1_norm (Рис. 2.3) наблюдаются аномальные значения.

Рис. 2.3 Коробчатая диаграмма показателя X1_norm.

2. На гистограмме (Рис. 2.4) представленно распределение частот показателя X1_norm.

Рис. 2.4 Гистограмма распределения показателя X1_norm.

3. Значение коэффициента вариации, представленного в таблице (Табл. 2.2), не превышает 33%, поэтому совокупность является неоднородной. Среднее арифметическое значение X1_norm в 5,18 раз больше среднего квадратического отклонения.

Табл. 2.2 – Таблица описательных статистик показателя X1_norm.

Count  
Average 5,17824
Standard deviation 0,999975
Coeff. of variation 19,3111%
Minimum 2,142
Maximum 7,463
Range 5,321
Stnd. skewness -1,99294
Stnd. kurtosis 1,8397

Анализ переменной X2_norm

  1. На коробчатой диаграмме для показателя X2_norm (Рис. 2.5) наблюдаются аномальные значения.

Рис. 2.5 Коробчатая диаграмма показателя X2_norm.

2. На гистограмме (Рис. 2.6) представленно распределение частот показателя X2_norm.

Рис. 2.6 Гистограмма распределения показателя X2_norm.

3. Значение коэффициента вариации, представленного в таблице (Табл. 2.3), не превышает 33%, поэтому совокупность является однородной. Среднее арифметическое значение X2_norm в 4,48 раз больше среднего квадратического отклонения.

Табл. 2.3 – Таблица описательных статистик показателя X2_norm.

Count  
Average 4,47659
Standard deviation 1,00002
Coeff. of variation 22,3389%
Minimum 1,188
Maximum 7,534
Range 6,346
Stnd. skewness -1,85667
Stnd. kurtosis 2,93191

Анализ переменной X3_norm

  1. На коробчатой диаграмме для показателя X3_norm (Рис. 2.7) наблюдаются аномальные значения.

Рис. 2.7 Коробчатая диаграмма показателя X3_norm.

2. На гистограмме (Рис. 2.8) представленно распределение частот показателя X3_norm.

Рис. 2.8 Гистограмма распределения показателя X3_norm.

3. Значение коэффициента вариации, представленного в таблице (Табл. 2.4), превышает 33%, поэтому совокупность является неоднородной. Среднее арифметическое значение X3_norm в 1,23 раза больше среднего квадратического отклонения.

Табл. 2.4 – Таблица описательных статистик показателя X3_norm.

Count  
Average 1,23475
Standard deviation 0,999959
Coeff. of variation 80,985%
Minimum 0,013
Maximum 5,104
Range 5,091
Stnd. skewness 4,58769
Stnd. kurtosis 3,41518

Анализ переменной X4_norm

  1. На коробчатой диаграмме для показателя X4_norm (Рис. 2.9) видны экстремальные значения.

Рис. 2.9 Коробчатая диаграмма показателя X4_norm.

2. На гистограмме (Рис. 2.10) представленно распределение частот показателя X4_norm.

Рис. 2.10 Гистограмма распределения показателя X4_norm.

3. Значение коэффициента вариации, представленного в таблице (Табл. 2.4), превышает 33%, поэтому совокупность является неоднородной. Среднее арифметическое значение X4_norm в 1,45 раз больше среднего квадратического отклонения.

Табл. 2.4 – Таблица описательных статистик показателя X4_norm.

Count  
Average 1,45257
Standard deviation 0,99999
Coeff. of variation 68,8428%
Minimum 0,185
Maximum 5,738
Range 5,553
Stnd. skewness 7,89668
Stnd. kurtosis 12,7208

Этап 3: Предварительная обработка (логарифмирование)

Анализ переменной Y_log

  1. На коробчатой диаграмме для показателя Y_log (Рис. 3.1) видны экстремальные значения.

Рис. 3.1 Коробчатая диаграмма показателя Y_log.

2. На гистограмме (Рис. 3.2) представленно распределение частот показателя Y_log.

Рис. 3.2 Гистограмма распределения показателя Y_log.

3. Значение коэффициента вариации, представленного в таблице (Табл. 3.1), не превышает 33%, поэтому совокупность является однородной. Среднее арифметическое значение Y_log в 4 раза больше среднего квадратического отклонения.

Табл. 3.1 – Таблица описательных статистик показателя Y_log.

Count  
Average 4,23875
Standard deviation 1,04391
Coeff. of variation 24,6278%
Minimum 0,336
Maximum 6,046
Range 5,71
Stnd. skewness -5,18303
Stnd. kurtosis 4,61969

Анализ переменной X1_log

  1. На коробчатой диаграмме для показателя X1_log (Рис. 3.3) видны экстремальные значения.

Рис. 3.3 Коробчатая диаграмма показателя X1_log.

2. На гистограмме (Рис. 3.4) представленно распределение частот показателя X1_log.

Рис. 3.4 Гистограмма распределения показателя X1_log.

3. Значение коэффициента вариации, представленного в таблице (Табл. 3.2), не превышает 33%, поэтому совокупность является однородной. Среднее арифметическое значение X1_log в 19 раз больше среднего квадратического отклонения.

Табл. 3.2 – Таблица описательных статистик показателя X1_log.

Count  
Average 4,2234
Standard deviation 0,219518
Coeff. of variation 5,19766%
Minimum 3,357
Maximum 4,605
Range 1,248
Stnd. skewness -5,30193
Stnd. kurtosis 5,93285

Анализ переменной X2_log

  1. На коробчатой диаграмме для показателя X2_log (Рис. 3.5) видны экстремальные значения.

Рис. 3.5 Коробчатая диаграмма показателя X2_log.

2. На гистограмме (Рис. 3.6) представленно распределение частот показателя X2_log.

Рис. 3.6 Гистограмма распределения показателя X2_log.

3. Значение коэффициента вариации, представленного в таблице (Табл. 3.3), не превышает 33%, поэтому совокупность является однородной. Среднее арифметическое значение X2_log в 20 раз больше среднего квадратического отклонения.

Табл. 3.3 – Таблица описательных статистик показателя X2_log.

Count  
Average 5,40295
Standard deviation 0,267158
Coeff. of variation 4,94466%
Minimum 4,106
Maximum 5,953
Range 1,847
Stnd. skewness -7,24731
Stnd. kurtosis 12,2429

Анализ переменной X3_log

  1. На коробчатой диаграмме для показателя X3_log (Рис. 3.7) видны экстремальные значения.

Рис. 3.7 Коробчатая диаграмма показателя X3_log.

2. На гистограмме (Рис. 3.8) представленно распределение частот показателя X3_log.

Рис. 3.8 Гистограмма распределения показателя X3_log.

3. Значение коэффициента вариации, представленного в таблице (Табл. 3.4), не превышает 33%, поэтому совокупность является однородной. Среднее арифметическое значение X3_log в 3,6 раза больше среднего квадратического отклонения.

Табл. 3.4 – Таблица описательных статистик показателя X3_log.

Count  
Average 4,36781
Standard deviation 1,20367
Coeff. of variation 27,5578%
Minimum 0,262
Maximum 6,249
Range 5,987
Stnd. skewness -5,42256
Stnd. kurtosis 4,53113

Анализ переменной X4_log

  1. На коробчатой диаграмме для показателя X4_log (Рис. 3.9) наблюдаются аномальные значения.

Рис. 3.9 Коробчатая диаграмма показателя X4_log.

2. На гистограмме (Рис. 3.10) представленно распределение частот показателя X4_log.

Рис. 3.10 Гистограмма распределения показателя X4_log.

3. Значение коэффициента вариации, представленного в таблице (Табл. 3.4), не превышает 33%, поэтому совокупность является однородной. Среднее арифметическое значение X4_log в 4,6 раз больше среднего квадратического отклонения.

Табл. 3.4 – Таблица описательных статистик показателя X4_log.

Count  
Average 3,14467
Standard deviation 0,677788
Coeff. of variation 21,5536%
Minimum 1,281
Maximum 4,713
Range 3,432
Stnd. skewness -1,9531
Stnd. kurtosis 1,8592

Выводы

1. В результате исключения аномальных наблюдений значение коэффициента вариации не снизилось до 33%, поэтому совокупность нормированных значений показателя Y осталась неоднородной.

2. В результате логарифмирования исходных данных коэффициент вариации достиг 24,6278%, это означает, что нам удалось добиться однородности показателя Y.

Приложения

Приложение 1: Табл. 1. – Исходные данные лабораторной работы.

  Номер варианта            
    P5 P3 P7 P8 P12  
Год              
f1 Region Y X1 X2 X3 X4
Для прогноза Регион 9.5. сброс загрязненных сточных вод в поверхностные водные объекты (кубических метров) 9.3. использование свежей (кубических метров) воды, на душу населения 2.3. удельный вес городского населения в общей численности населения (оценка на конец года; в процентах) 13.4. индексы производства по виду экономической деятельности "обрабатывающие производства" (в процентах к предыдущему году) 4.19. число собственных легковых автомобилей на 1000 человек населения (на конец года; штук)
1 Приморский край 339   76,1 104,1 233,5
1 Хабаровский край 203   81,8 119,4 160,2
1 Сахалинская область 45   79,7 97,5 251,9
  Номер варианта            
    P5 P3 P7 P8 P12  
Год              
f1 Region Y X1 X2 X3 X4
Для прогноза Регион 9.5. сброс загрязненных сточных вод в поверхностные водные объекты (кубических метров) 9.3. использование свежей (кубических метров) воды, на душу населения 2.3. удельный вес городского населения в общей численности населения (оценка на конец года; в процентах) 13.4. индексы производства по виду экономической деятельности "обрабатывающие производства" (в процентах к предыдущему году) 4.19. число собственных легковых автомобилей на 1000 человек населения (на конец года; штук)
  Владимирская область     77,6 124,4 165,3
  Воронежская область     63,7 111,0 205,4
  Ивановская область     81,0 114,7 140,2
  Калужская область     76,3 114,6 189,1
  Костромская область     69,8 107,0 164,4
  Курская область     65,2 106,6 165,7
  Липецкая область     63,7 104,4 202,5
  Московская область     80,1 107,7 261,1
  Орловская область     65,5 97,1 179,1
  Рязанская область     70,9 113,4 193,4
  Смоленская область     72,7 112,1 203,3
  Тамбовская область     58,7 114,4 174,5
  Тверская область     74,7 111,6 183,1
  Тульская область     79,4 109,0 195,1
  Ярославская область     82,2 106,9 149,7
  г. Москва     100,0 90,1 261,4
  Республика Карелия     78,1 122,0 218,9
  Республика Коми     77,0 119,4 175,3
  Архангельская область     75,6 112,9 150,5
  в том числе Ненецкий ао 1,6   67,2 102,1 143,2
  Вологодская область     70,7 105,0 202,2
  Калинингpадская область     77,6 128,1 269,4
  Ленинградская область     65,9 101,7 221,3
  Мурманская область     92,8 93,6 173,4
  Новгородская область     70,6 106,8 168,5
  Псковская область     70,2 108,9 185,3
  г. Санкт-Петербург     100,0 111,4 266,0
  Республика Адыгея     51,0 124,1 196,4
  Республика Калмыкия     44,1 94,0 152,3
  Краснодарский край     52,9 114,3 221,8
  Астраханская область     66,7 110,3 198,8
  Волгоградская область     76,0 102,3 170,4
  Ростовская область     67,2 117,1 190,5
  Республика Дагестан     45,3 142,6 62,2
  Республика Ингушетия (1990 г. - включая Чеченскую республику) 1,9   38,3 108,5 66,6
  Кабардино-Балкарская Республика     54,5 116,2 123,9
  Карачаево-Черкесская Республика     42,3 115,0 160,8
  Республика Северная Осетия - Алания     63,8 122,5 159,6
  Чеченская Республика (1990 г. - включая Республику Ингушетия) 0,0   35,0 102,1 62,8
  Ставропольский край     57,2 110,1 193,4
  Республика Башкортостан     60,4 107,9 200,4
  Республика Марий Эл     63,1 114,6 126,4
  Республика Мордовия     60,4 116,4 137,7
  Республика Татарстан     75,4 117,1 169,7
  Удмуртская Республика     69,2 92,2 170,0
  Чувашская Республика     58,8 114,7 110,0
  Пермский край     75,0 84,8 159,9
  Кировская область     74,0 101,4 161,2
  Нижегородская область     78,9 100,7 166,2
  Оренбургская область     59,6 102,7 211,1
  Пензенская область     67,1 110,5 160,3
  Самарская область     80,2 103,5 220,4
  Саратовская область     74,5 111,2 174,8
  Ульяновская область     73,5 113,6 170,9
  Курганская область     60,3 107,2 195,8
  Свердловская область     83,9 108,8 215,6
  Тюменская область     78,1 105,3 232,2
  Ханты-Мансийский автономный округ - Югра     91,5 109,9 254,4
  Ямало-Ненецкий автономный округ     84,7 77,2 200,0
  Челябинская область     82,0 113,4 186,1
  Республика Алтай 0,4   27,6 93,3 188,8
  Республика Бурятия     58,4 112,1 142,6
  Республика Тыва     53,1 102,2 101,4
  Республика Хакасия     67,3 134,1 207,9
  Алтайский край     54,7 114,4 167,4
  Забайкальский край     65,9 103,3 162,8
  Красноярский край     76,3 102,3 198,5
  Иркутская область     79,5 104,4 165,7
  Кемеровская область     85,4 102,8 170,6
  Новосибирская область     77,3 112,3 196,8
  Омская область     71,5 110,3 172,6
  Томская область     70,2 93,5 171,1
  Республика Саха (Якутия)     64,1 90,8 137,9
  Камчатский край     77,3 100,1 248,4
  Приморский край     76,1 104,1 233,5
  Хабаровский край     81,8 119,4 160,2
  Амурская область     66,7 103,5 170,2
  Магаданская область     95,4 100,1 230,5
  Сахалинская область     79,7 97,5 251,9
  Еврейская автономная область     67,6 99,9 121,6
  Чукотский автономный округ     64,8 95,0 44,4

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: