Предмет данного раздела статистики – население, рассматриваемый фактор – труд

Население (Bevölkerung, Population) – это совокупность людей, проживающих на определенной территории, непрерывно возобновляющаяся за счет рождения и смертей.

Объектом наблюдения статистики населения могут быть различные совокупности: и население в целом, и отдельные группы.

Источники статистики населения:

1) перепись (единовременное наблюдение в сплошной или выборочной форме);

2) микроперепись (охватывает 5% постоянного населения);

3) текущий учет (ЗАГС, паспортные столы, паспортно-визовая служба МВД);

Задачи статистики населения:

1) учет и анализ численности и размещения населения;

2) учет и анализ состава и структуры населения;

3) учет движения населения и его воспроизводства;

4) изучение социальных характеристик населения;

5) разработка и совершенствование методологии переписи и текущего учета населения.

7.2 Статистика численности и состава населения

1) Показатели численности

Численность населения (Bevölkerungszahl, Size of population) – это количество лиц, проживающих на определенной территории страны или в отдельных ее регионах.

Учет осуществляется на определенную дату и время (критический момент наблюдения).

Различают следующие категории населения: постоянное (ПН), наличное (НН), временно проживающее (ВП) и временно отсутствующее (ВО) население.

Постоянное население (Wohnbevölkerung, Stable population) – это лица, постоянно проживающие на данной территории, независимо от их фактического местонахождения на момент учета.

Наличное население (Ortsanwesende Bevölkerung, Available population) - это лица, которые на момент учета фактически находятся в данном населенном пункте, независимо от их постоянного места жительства.

Временно проживающее население (Vorübergehend anwesende Bevölkerung, Temporary staying population)- это лица, которые на момент учета находятся на территории данного населенного пункта, но постоянно проживают в другом.

Временно отсутствующее население (Vorübergehend abwesende Bevölkerung, Temporary absentee population) – это лица, находящиеся в момент учета за пределами места жительства.

Пример. На начало 2001 г. наличное население г. Нижнего Новгорода составляло 1356,5 тыс. чел, постоянное население – 1351,7 тыс. чел.

При проведении переписи обычно учитывают наличное население с пометкой о временном проживании или временном отсутствии.

Все категории связаны между собой следующим образом:

ПН = НН – ВП + ВО

НН = ПН – ВО + ВП

Определение категории имеет большое значение для планирования экономики и социального развития (например, количество мест в школах определяют по постоянному населению, а объем товарооборота – по наличному населению).

В основе анализа численности населения лежит показатель среднегодовой численности, который рассчитывается по формуле средней арифметической:

где S1 и S2 – численность населения на начало периода 1,2

Пример. Среднегодовая численность наличного населения г. Нижнего Новгорода в 2000 г. составила 1361,7 тыс. чел.

Если имеются данные по ряду периодов, равноотстоящих друг от друга, то используется более точная формула средней хронологической.

Если интервалы не равны, имеем среднюю хронологическую взвешенную (пример см. в теме ряды динамики).

Наиболее часто применяются показатели абсолютного прироста (уменьшения) численности населения Sn – S1; коэффициента (темпа) роста Sn/S1; коэффициента (темпа) прироста населения Sn/S1 – 1; среднегодового темпа роста ; плотности населения, численности городского и сельского населения; численности населения по отдельным регионам.

Пример: Плотность – это количество жителей на квадратный километр. В настоящее время плотность населения составляет в РФ 8,7 чел/км2 и в Нижегородской области 48 чел/км2. Для сравнения: плотность населения в ЕС равна 115 чел/км2, в США - 28,2 чел/км2, в Японии 331, 7 чел/км2.

2) Показатели структуры населения

Показатели структуры (состава) населения – это возрастная структура населения, численность мужского и женского населения, национальный состав, группы населения по составу семьи, источникам средств к существованию и т.д..

Так, для анализа и оценки возрастно-половой структуры населения существуют так называемые возрастные пирамиды:

возраст (год рождения,)

М Ж

численность, тыс. чел.

Рис. 7.1. Схема возрастной пирамиды

В данном случае пирамида отображает прогрессивную структуру населения. Стационарная и регрессивная структура имеет место тогда, когда пирамида принимает соответственно прямоугольную форму или форму перевернутого треугольника, т.е. когда население соответственно распределяется по возрастным группам равномерно или стареет.

Население склонно к округлению возраста на 0 и на 5. В результате в возрастных группах, оканчивающихся на 0 и на 5, образуются наросты – так называемая аккумуляция возрастов. Для избежания этого кроме возраста спрашивают еще и год рождения.

Показатели демографической нагрузки отражают нагрузку на общество непроизводительного населения. Рассчитываются такие показатели, как отношение общего числа детей, лиц пенсионного возраста и их общей совокупности к численности населения трудоспособного возраста.

Пример. В РФ на 1000 лиц трудоспособного возраста в 1995 г. приходилось 430 детей и подростков 0-15 лет и 325 лиц старше трудоспособного возраста, всего – 755 чел.

Практическое применение эти показатели имеют при расчете затрат на пенсионное обеспечение, на содержание детей, на социальные мероприятия.

7.2 Статистика естественного движения и статистика миграции населения

Воспроизводство населения – это процесс постепенной смены населения через смену уходящих поколений.

Уровень воспроизводства характеризуется показателями естественного движения населения. При их изучении используют абсолютные (число родившихся, умерших) и относительные показатели (исчисление в расчете на 100, 1000, 10000… человек).

Коэффициенты рождаемости:

N – число родившихся.

Коэффициенты смертности:

M – число умерших.

Коэффициент естественного прироста населения:

Используют также специальные коэффициенты такие, как специальный коэффициент рождаемости:

SF - среднегодовая численность женщин, способных к деторождению (в фертильном возрасте – 15-49 лет).

Повозрастной коэффициент рождаемости:

N15-19 – число родившихся от матерей в возрасте 15-19 лет.

Повозрастной коэффициент смертности:

Отдельно вычисляют коэффициенты смертности детей до одного года:

N1 – число родившихся в этом году;

N0 – число родившихся в предыдущем году;

М0 – число умерших.

m0 – число умерших в текущем году из родившихся в предыдущем;

m1 - число умерших в текущем году из родившихся в этом же году.

Коэффициент жизненности:

На базе этих показателей применяют стандартизированные (нормированные) показатели. Они нормируются, например, по удельному весу отдельных групп в структуре населения I.

Коэффициент смертности:

Обобщающие показатели воспроизводства населения – это показатели суммарной плодовитости, брутто-коэффициент воспроизводства и нетто-коэффициент воспроизводства.

Суммарная плодовитость – это количество детей, рожденных одной женщиной за весь фертильный период.

Fx – вероятность родить ребенка в возрасте x лет (15≤x≤49);

Кp – повозрастной коэффициент рождаемости.

Брутто-коэффициент воспроизводства показывает, сколько девочек в качестве смены оставляет каждая женщина.

δ – доля девочек среди родившихся.

Нетто-коэффициент воспроизводства (исчисляется только для женщин) показывает, сколько девочек доживает до возраста своей матери.

Lx – среднее число женщин в возрасте от x до x+1 года.

Маятниковая миграция – это перемещения с места жительства на работу и обратно.

Существует три показателя миграции:

1) Коэффициент прибытия:

2) Коэффициент убытия:

3) коэффициент механического прироста

Общий коэффициент прироста населения – это сумма коэффициентов естественного прироста и механического прироста.

K = Kест.пр. + Kмех.пр.

Для более глубокого анализа и изучения особенностей демографических показателей в отдельных возрастных группах применяют табличный счет населения (например, таблицы смертности, плодовитости и т.д.).

Таблицы строят в полном и кратком варианте (полная таблица – с одногодичным интервалом, краткая – с интервалом в 5-10 лет).

Экономические таблицы могут содержать следующие данные:

1) Возраст – X;

2) Число доживших до возраста X – lx;

3) Число умерших в возрасте от X до X+1 – dx;

4) Вероятность умереть в течение следующего года – qx;

5) Вероятность остаться в живых в следующем году – px;

6) Средняя продолжительность предстоящей жизни населения - exº.

Рассмотрим некоторые взаимосвязи между этими величинами:

Тx – число предстоящих человеко-лет жизни.

W – предельный возраст;

Lx – число доживших до возраста Х лет.

7.4 Перспективные расчеты численности населения

Существуют следующие методы перспективного расчета:

1) глобальный метод (на основе данных о численности населения в начальном периоде и коэффициентов механического и естественного прироста):

К – общий коэффициент прироста населения.

2) метод передвижки возрастов:

Глобальный метод хорошо применяется для определения общей численности населения, но не применяется для определения численности отдельных возрастных групп. Для этого можно использовать метод передвижки возрастов (табличный счет).

ТЕМА 8. ИЗМЕРЕНИЕ УРОВНЯ КОНЦЕНТРАЦИИ

Konzentrationsmessung Measurement of concentration

8.1 Постановка проблемы

Измерение уровня концентрации – это одна из задач статистического анализа. Она заключается в определении степени концентрации изучаемого признака по единицам совокупности, а также в оценке неравномерности его распределения.

Подобные цели часто ставятся на практике. Например:

1) в сфере социальной политики, при анализе уровня жизни населения (например, проблема неравномерного распределения доходов);

2) в антимонопольной политике и политике развития конкуренции (выявление доминирующего положения на рынке и рыночной силы хозяйствующих субъектов);

3) для стратегического планирования и анализа рынка отдельных фирм (например, оценка доли рынка по имущественному обороту, прибыли, числу занятых и т. д.).

Как можно заметить даже из приведенного выше списка, концентрация в экономическом смысле может касаться двух аспектов: во-первых, сосредоточения экономических признаков (рыночной власти, доли рынка и др.) у немногих единиц совокупности; во-вторых, существования значительных различий, неравенства в размере отдельных единиц совокупности. Соответственно различают абсолютную концентрацию и относительную концентрацию (Absolute und relative Konzentration, Absolute and relative Concentration).

Пример:

- 1,7 % населения обладают более чем 70 % имущества – относительная концентрация;

- на рынке определенного товара 3 наиболее крупных предприятия имеют совокупную долю 90 % - абсолютная концентрация.

Различие абсолютной и относительной концентрации особенно заметно в случае строго равномерного распределения объема признака по единицам совокупности: относительная концентрация будет равна 0, а абсолютная концентрация будет тем больше, чем меньше число единиц совокупности.

8.2 Показатели концентрации

Для измерения относительной концентрации наиболее часто применяется кривая концентрации -кривая Лоренца (Lorenzkurve, Lorenz curve) и рассчитываемые на ее основе показатели.

Пример. Рынок снабжается пятью предприятиями. Три предприятия имеют по10 % рынка каждое, четвертое – 20 %, пятое – 50 %.

Для построения кривой Лоренца представим данные в виде накопленной частоты объема совокупности (число предприятий в %) и накопленной частоты объема признака (доля рынка в %). Данные представляются в ранжированном виде (или по возрастанию, или по убыванию).

Таблица 8.1.

Данные о снабжении рынка предприятиями

Предприятие	Накопленная частота объема совокупности, %	Доля рынка, %	Накопленная частота объема признака, %
1	20 %	10 %	10 %
2	40 %	10 %	20 %
3	60 %	10 %	30 %
4	80 %	20 %	50 %
5	100 %	50 %	100 %

Прохождение кривой L сравнивают с прямой D, проходящей под углом 45%. Прямая D соответствует идеальному случаю равномерного распределения и называется прямой равномерного распределения.

Накопленная доля рынка в %

100 A

60 D

40 L

0 20 40 60 80 100

Накопленная доля предприятий в %

Площадь, заключенная между прямой D и кривой L показывает степень концентрации. Чем больше площадь, тем больше концентрация.

Треугольник AOB соответствует случаю абсолютной монополизации.

В нашем примере визуально можно сделать вывод о существенной концентрации доли рынка у ведущих предприятий.

Если мы будем сравнивать площадь, заключенную между прямой D и кривой L и площадь треугольника АОВ, то получим коэффициент Джини (Gini-Koeffizient, Gini coefficient). Он используется для количественной оценки уровня концентрации:

dxi – доля i-ой группы в общем объеме совокупности;

dyi - доля i-ой группы в общем объеме признака;

dyiⁿ - накопленная доля i-ой группы в общем объеме признака.

Или в немецком варианте:

n – число единиц совокупности;

i – порядковый номер единицы совокупности.

Коэффициент Джини изменяется от 0 до 1:

0 ≤G≤1

При G=0, то признак распределен равномерно, кривая L совпадает с прямой D. При G=1 площадь, заключенную между прямой D и кривой L и площадь треугольника АОВ совпадают, т.е. имеется одна единица совокупности -абсолютная монополия – с долей рынка 100 %.

Пример расчета коэффициента Джини.

1) По немецкому варианту формулы и данным табл. 8.1.:

= 0,36

Значение коэффициента Джини подтверждает вывод о существенной концентрации признака "доля рынка".

2) По российскому варианту формулы и данным таблицы 8.2.:

Таблица 8.2.

Распределение доходов населения в _ месяце 199_ г.

Группы населения (ранжированные по уровню сред-недушевого дохода, по 10 % численности населения)	Месяц _
	Удельный вес в совокупном доходе	Накопленная частота
1	4,3	4,3
2	6,1	10,4
3	7,1	17,5
4	8,1	25,6
5	9,1	34,7
6	10,1	44,8
7	11,2	56,0
8	12,6	68,6
9	14,3	82,9
10	17,1	100,0

Источник данных: (Шмойлова Р.А., 1996, с.365)

Рассчитаем коэффициент Джини:

При разделении совокупности на десять равных групп формула коэффициента Джини упрощается:

Таким образом, концентрация доходов населения (или дифференциация населения по уровню доходов) в нашем примере составила 21 %, что не является критической величиной.

Для измерения абсолютной концентрации применяют другие показатели концентрации: коэффициент концентрации, индекс Герфиндаля, индекс Розенблюта, экспоненциальный индекс, коэффициент энтропии и др..

Коэффициент концентрации CRg (Konzentrationsrate, Concentration ratio)- самый простой показатель концентрации:

pi – доля i-го значения признака;

g – число единиц совокупности с наибольшими значениями признака (g = 3, 4, 5, …).

По данным табл.8.1.:

т.е. рынок сильно монополизирован

Индекс Герфиндаля (Herfindahl-Index, Herfindahl index) имеет в основе формулу средней арифметической взвешенной, где весами выступают сами доли pi:

По данным таблицы 8.1.:

Подтверждается вывод о сильной монополизации рынка.

В разных странах критические значения коэффициента концентрации и индекса Герфиндаля разные. Так, в РФ они приняты следующими:

- если CR3 < 45 %, HHI < 1000, то	рынок неконцентрированный (нормальная концентрация)
- если 45 ≤ CR3 ≤ 70 %, 1000 ≤ HHI ≤ 2000, то	рынок умеренно концентрированный (средняя степень концентрации)
- если CR3 > 70 %, HHI > 2000, то	слабая конкурентная среда (высокая степень концентрации)

В ФРГ доминирующее положение предприятия или группы предприятий на рынке возникает, если

- на 1 предприятие приходится свыше 1/3 всего оборота на рынке, либо

- на 3 и менее предприятий – свыше ½ оборота, либо

- на 5 и менее предприятий – свыше 2/3 оборота.

В США безопасным с точки зрения монополизации считается рынок с HHI < 1000, при HHI > 1800 рынок считается слабоконкурентным, при 1000 ≤ HHI ≤ 1800 требуются дополнительные исследования. Максимально возможная концентрация долей крупнейших предприятий на рынке составляет:

при HHI = 1000	при HHI = 1800
CR1 ≤ 31 %	CR1 ≤ 42 %
CR2 ≤ 44 %	CR2 ≤ 60 %
CR3 ≤ 54 %	CR3 ≤ 72 %
CR4 ≤ 63 %	CR4 ≤ 85 %

Экспоненциальный индекс (Exponentialindex, Exponential index) основывается на средней геометрической взвешенной:

К особой группе показателей рыночной силы можно отнести индекс Линда (Linda-Index, Linda index) который связан с поиском границы олигополии:

Аi – общая доля i единиц совокупности с наибольшими значениями признака в объеме признака;

Аk – доля k изучаемых единиц совокупности в объеме признака. (примеры расчета индекса Линда и экспоненциального индекса)

8.3 Применение методов измерения уровня концентрации в экономике

Рассмотрим применение методов измерения уровня концентрации в экономике на примере анализа и оценки состояния конкурентной среды на нижегородском рынке наружной рекламы.[1]

Под продуктовыми границами рынка понимается часть товарной группы "Услуги в области рекламы" – "Услуги по распространению рекламы" (конкретно речь идет о распространении наружной рекламы).

Покупателями на рынке услуг в области рекламы всегда выступают рекламодатели. Продавцами услуг по распространению рекламы выступают рекламораспространители Нижегородской области и других крупных российских городов и регионов, а также других стран.

Географическими границами рынка услуг по распространению наружной рекламы является территория г. Нижнего Новгорода.

В 1997 г. 40 рекламных фирм предлагали услуги по распространению наружной рекламы, в 1998 г. - 52 фирмы. Ограничимся, однако, 8 фирмами, так как эти фирмы являлись наиболее крупными и объем предоставляемых ими услуг составил 90% от общего объема рынка.

Доли хозяйствующих субъектов на рынке услуг по распространению наружной рекламы в 1996-1997 гг. отражены в таблице 8.3.

Таблица 8.3.

Доли хозяйствующих субъектов на рынке услуг по распространению наружной рекламы

Продавцы	Доля на товарном рынке, %
Продавцы	1996 г.	1997 г.
ООО "Курсив"	32	32
ЧП Арабаджи	18	5,6
ООО "Ректайм"	12	24,4
ООО "Фирма АНЖ"	11,5	10,4
ООО "Россерв"	9,5	11,2
АОЗТ "АПР-НН"	3	3,6
ТОО "Арт-студия Клим"	2	1,5
ООО "Росреклама"	2	1,3
Прочие хозяйств. субъекты	10	10
Всего:	100	100

Подсчитаем уровень концентрации трех (CR3), четырех (CR4), шести (CR6) и восьми (CR8) крупнейших продавцов на рынке.

	CR3	CR4	CR6	CR8
- Коэффициент концентрации по итогам 1996 г.	62 %	73 %	86 %	90 %
- Коэффициент концентрации по итогам 1997 г.	68 %	79 %	88 %	90 %

Индекс Герфиндаля за 1996 г. составил:

3х3 + 12х12 + 9,5х9,5 + 2х2 + 18х18 + 11,5х11,5 + 32х32 + 2х2 + 10х10 = 1831,5

За 1997 г.:

3,6х3,6 + 24,4х24,4 + 11,2х11,2 + 1,3х1,3 + 5,6х5,6 + 10,4х10,4 + 32х32 + 1,5х1,5 + 10х10 = 1988,26

В соответствии со значениями коэффициента концентрации и индекса Герфиндаля определяем тип рынка:

- в 1996 г. - умеренно концентрированный рынок, так как коэффициент концентрации трех крупнейших продавцов равен 62 %, т.е. 45 < CR3< 70. Индекс Герфиндаля равен 1831,5, т.е. 1000 < HHI < 2000;

- в 1997 г. тип рынка определен аналогично - умеренно концентрированный, так как коэффициент концентрации равен 68 %, т.е. 45< CR3< 70. Индекс Герфиндаля равен 1988,26, т.е. 1000 < HHI < 2000.

Итоговая оценка состояния конкурентной среды на товарном рынке "Услуги по распространению наружной рекламы" в г. Нижнем Новгороде представлена в таблице 8.4.

Таблица 8.4.

Сводная таблица оценки состояния конкурентной среды на рынке "Услуги по распространению наружной рекламы"

Наименование Показателя	Ед. изм.	Критерии оценки значений показателей	Характеристика типа рыночной структуры			Оценки состояния конкурентной среды
Наименование Показателя	Ед. изм.	Критерии оценки значений показателей	высоко конц. рынок	умеренно кон-. рынок	низко кон- центр. рынок	неразвитая конкуренция	развитая конкуренция
1. Численность хозяйствующ. субъектов на данном товарном рынке - 40	шт
2. Доли каждого продавцам в общем объеме товарного ресурса рынка (Di): 32 %,	%	Распределение Di -равномерное		+			+
24,4 %, 11,2 %,10,4 %, 5,6 %, 3,6 %, 1,5 %, 1,3 %, для остальных 32 хоз. субъектов - 10 %
3. Коэффициент рыночной концентрации CR	%	45%<68%<70%		+			+
4. Индекс Герфиндаля HHI		1000<1988,2<2000		+			+
5. Барьеры «входа» на рынок		степень преодоли-мости –преодоли-мый
6. Открытость рынка		рынок открыт
Итоговая оценка				+			+

ТЕМА 9. Корреляционный и регрессионный анализ

Korrelations- und Regressionsrechnung Correlation and regression analysis

9.1 Понятие корреляции и регрессии

Корреляция (Korrelation, Correlation)– это изучение взаимосвязей двух или более величин.

Регрессия (Regression) – это нахождение аналитического выражения взаимосвязи, т.е. определение конкретной формулы.

При изучении взаимосвязей одни признаки – факторные обусловливают изменение других – результативных. Факторные признаки обычно обозначаются Х, результативные Y.

Методы корреляции предназначены для изучения корреляционной зависимости, которую нужно отличать от функциональной зависимости. Функциональная зависимость означает полное соответствие между изменениями факторного и результативного признака, т.е. зная факторный признак, можно точно определить результативный. Корреляционная связь означает, что одному значению факторного признака соответствует неопределенное число результативных признаков, т.е. мы можем с помощью корреляционного анализа установить лишь тенденцию изменения результативного признака при изменении факторного.

Задачи, которые решают корреляционный и регрессионный анализы:

1) предварительный анализ статистической совокупности;

2) установление факта наличия связи, ее направления и формы;

3) установление степени тесноты связи;

4) построение регрессионной модели;

5) интерпретация и практическое использование выводов и результатов.

9.2 Показатели корреляции

Показатели корреляции отражают тесноту корреляционной связи.

Корреляционную связь различают:

I. По числу переменных:

простая (парная):

2) сложная (множественная):

3) частичная:

II.

По виду связи:

1) позитивная;

2) негативная.

III. По форме связи:

1) линейная;

2) нелинейная.

Y_i экстремально позитивная связь сильная позитивная связь

X_i

слабая позитивная связь сильная негативная связь

нет связи экстремально негативная связь

нелинейная позитивная связь нелинейная связь

Рис. 9.1. Виды связей между двумя переменными

Основными показателями корреляции являются:

1) коэффициент Фехнера;

2) коэффициент ассоциации;

3) коэффициент контингенции;

4) критерий согласия - χ²;

5) коэффициент корреляции рангов;

6) коэффициент корреляции;

7) коэффициент детерминации;

8) корреляционное отношение.

Рассмотрим все эти показатели подробнее.

Коэффициент Фехнера (Fechner-Koeffizient, Fechner coefficient):

nс – число совпадений знаков отклонений индивидуальных величин от средней;

nн - число несовпадений знаков отклонений индивидуальных величин от средней.

Пример (см. табл.9.1.):.

Вывод: существует слабо выраженная негативная связь между X и Y.

Коэффициент Фехнера изменяется от -1 до +1.

В общем случае, если показатели корреляции:

0 ≤ П ≤ 0,3, то существует слабая связь;

0,3 ≤ П ≤ 0,7 – умеренная связь;

0,7 ≤ П ≤ 1 – сильная связь.

Таблица 9.1.

Данные для расчета коэффициента Фехнера

Носитель признака	Факторный признак X	Результативный признак Y
1	5 (+)	5 (+)
2	4 (-)	5 (+)
3	4 (-)	4 (-)
4	5 (+)	4 (-)
5	5 (+)	3 (-)

По номинально измеряемым признакам можно рассчитать лишь коэффициенты ассоциации (Assoziationskoeffizient, Association coefficient) и контингенции (Kontingenzkoeffizient, Contingent coefficient).

Таблица 9.2

Данные для расчета коэффициентов ассоциации и контингенции

Участники мероприятия	Спортсмены	Не спортсмены
Мужчины	20 (а)	60 (в)
Женщины	15 (с)	80 (d)

Существует ли зависимость между двумя качественными признаками – полом и отношением к спорту?

1) по коэффициенту ассоциации

Вывод: вряд ли существует такая зависимость, т.е. степень зависимости невелика.

2) по коэффициенту контингенции:

Вывод: связь еще слабее.

Более точным по сравнению с рассматриваемыми коэффициентами является критерий согласия - χ² Пирсона (χ² Anpassungstest nach Pearson, Pearson χ²-test of goodness of fit), отражающий связь между двумя и более признаками.

О – реальные значения признаков;

Е – теоретически выровненные значения признаков.

Пример.По данным таблицы 9.3. нужно ответить на вопрос: зависит ли частота несчастных случаев от смены? Предварительная гипотеза: связь отсутствует.

Таблица 9.3

Данные о несчастных случаях по предприятию N

Номер смены	Число несчастных случаев
Номер смены	Реальное	Теоретически выровненное
1	1	5
2	7	5
3	7	5
Итого:	15	15

Вычислим критерий согласия - χ²:

Чем больше χ², тем больше вероятность того, что между О и Е есть существенные различия, т.е. наша гипотеза (связь отсутствует) неверна. Напротив, чем меньше χ², тем несущественнее, случайнее различия между О и Е, т.е. тем больше вероятность верности гипотезы.

По специальным таблицам находим критериальное значение χ² с вероятностью 95 % и числом степеней свободы 2 (равно числу строк таблицы-1, т.е. 3-1=2):

χ² = 5,99

Таким образом, в нашем примере χ² небольшой (4,8 < 5,99), различия между О и Е случайны, фактическое распределение несчастных случаев по сменам не отличается существенно от теоретически выровненного. Вывод: с 95 % вероятностью можно утверждать, что наша гипотеза верна.[2]

Для ординально измеряемых признаков применяется коэффициент корреляции рангов по Спирмену r (Spearmanscher Rangkorrelations-koeffizient, Spearman's rank correlation coefficient).

d – разность порядковых номеров (рангов) факторного и результативного признаков;

n – число наблюдений.

Пример: (см. табл. 9.4):

Вывод: существует сильная положительная зависимость между стажем и производительностью

Таблица 9.4

Стаж и производительность труда по 5 работникам предприятия N

№ работника	Стаж		Производительность		X*Y	X²	Y²	d	d²
№ работника	X	Ранг	Y	Ранг	X*Y	X²	Y²	d	d²
1	1	1	2	1	2	1	4	0	0
2	2	2	4	2	8	4	16	0	0
3	3	3	8	4	24	9	64	-1	1
4	4	4	6	3	24	16	36	1	1
5	5	5	10	5	50	25	100	0	0
Итого	15		30		108	55	220		2

Наиболее точным показателем корреляции является коэффициент корреляции (Korrelationskoeffizient, Coefficient of correlation). Он позволяет учесть не только знаки отклонений значений признака от их средних, но и саму величину отклонений. Его можно рассчитать в два шага:

1) расчет показателя ковариации (kovarianz, covariance)

Однако полученные абсолютные величины нельзя сравнивать между собой, т.к. сами признаки X и Y могут быть выражены в разных единицах измерения или средние `Х и`Y могут быть различны по величине. Поэтому отклонения значений признаков от средних нормируют по среднему квадратическому отклонению, т.е. выражают в долях от sx и sy.

2) расчет коэффициент корреляции

На практике применяют другую формулу:

По данным табл. 9.4 рассчитаем коэффициент корреляции:

Вывод: между стажем и производительностью труда существует сильная положительная связь.

Коэффициент детерминации (Bestimmtheitskoeffizient, coefficient of determination):

Он имеет очень простой смысл: какая часть колебаний результативного признака вызвана факторным признаком. В нашем примере 72.25% изменений в производительности труда вызван влиянием стажа работника.

Все эти коэффициенты применяются без ограничений при прямолинейной зависимости. При криволинейной зависимости (параболической) они не годятся. Здесь применяются показатель, называемый корреляционным отношением h (Korrelationsverhältnis, Correlation ratio).

δ² - межгрупповая дисперсия;

σобщ² - общая дисперсия совокупности.

Учитывая правило сложения дисперсии, можно написать видоизмененную формулу корреляционного отношения

- средняя из групповых дисперсий.

Различают эмпирическое (фактическое) корреляционное отношение и теоретическое корреляционное отношение. В последнем для расчета δ² берут выровненные (т.е. рассчитанные по уравнению регрессии) значения результативного признака y. Теоретическое корреляционное отношение еще называют индексом корреляции.

В целом корреляционное отношение является универсальным показателем корреляции и используется при прямо- и криволинейной зависимости. При строго прямолинейной зависимости коэффициент корреляции и корреляционное отношение совпадают, но чем больше кривизна, тем сильнее они отличаются друг от друга.

Для этого коэффициента существует аналогичный предыдущему коэффициент детерминации - η².

Для проверки значимости показателей корреляции рассчитывают их ошибки. Средние квадратические ошибки показателей корреляции имеют вид:

При количестве наблюдений менее 30 в знаменателе под корнем лучше брать n-1.

Показатель корреляции должен в 2-3 раза превосходить ошибку, чтобы с вероятностью 0,95 (0,997) говорить о связи между явлениями.

9.3 Регрессия

Регрессия (Regression)– это определение формы взаимосвязи 2-х или более признаков (определение тенденции развития явления).

Этапы регрессионного анализа:

1) определение функций, которыми характеризуется наша зависимость (прямая, парабола, гипербола и т.д.);

2) определение параметров (коэффициентов) выбранной функции

aX+b

Y_i (X_i;Y_i)

Y_i=(aX_i+b)

Коэффициенты

aX_i+b

X_i X

Рис. 9.2. Графическое изображение метода наименьших квадратов

Используют метод наименьших квадратов:

Его сущность заключается в нахождении таких параметров (коэффициентов) уравнения регрессии, при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических (выровненных) значений.

Формулы для расчета коэффициентов в случае линейной зависимости:

В нашем примере (см. данные табл. 9.4):

b = 6 – 1,7*3 = 0,9

3) определение функции регрессии:

5) Y

8) 10

9) 9

10) 8 Ŷ=1.7X+0.9

11) 7

12) 6

13) 5

14) 4

15) 3 a=tg α

16) 2

17) 1

18) 0 1 2 3 4 5 X

19)

20) найдя уравнение регрессии можно продолжить зависимость за известные пределы или найти дополнительные показатели внутри их, т.е. экстраполировать или интерполировать значения .

При этом нужно учитывать среднюю квадратическую ошибку уравнения регрессии.

Последняя формула более точна и удобна.

.ТЕМА 10. РЯДЫ ДИНАМИКИ

Zeitreiheanalyse The analysis of time series

10.1 Понятие рядов динамики

Ряд динамики (или временной, или хронологический ряд) – это ряд чисел, характеризующих развитие явления во времени. Ряд динамики следует отличать от ряда распределения.

В общем виде ряд динамики обозначается, как

У каждого ряда динамики имеются два элемента: уровень ряда y и момент (период) времени t. Уровень ряда – это показатель, характеризующие объект исследования.

Различают два вида рядов динамики:

1) моментный ряд дает сведения о развитии явления на какие-то последовательные моменты времени (например, численность населения на 1.01.2000);

2) интервальный ряд дает сведения о развитии явления за определенные периоды времени (например, выпуск продукции предприятия за квартал).

В уровнях моментного ряда содержится повторный счет, следовательно, их не имеет смысла суммировать (можно найти только изменение - разность). По интервальным рядам можно определять суммы и нарастающим итогом – конечный показатель.

Компоненты ряда динамики:

1) тренд (Trend, trend) – это основная тенденция развития явления (в долгосрочном плане) – T(t);

2) циклическая (конъюнктурная) компонента (zyklische Komponente, cyclical component) показывает влияние конъюнктурных колебаний (периодически повторяющихся в среднесрочном плане) – Z(t);

3) сезонная компонента (die Saisonkomponente, season component)отражает влияние сезонных или краткосрочных колебаний – S(t);

4) остаточная компонента (die Restkomponente, rest component)отражает влияние прочих факторов, объяснимых и нет – R(t).