I i
X - A x - A
I i
X - A (x - A)
Расчет дисперсии, ее свойства
Средняя величина или величина, ее заменяющая
Абсолютный показатель вариации
V = ------------------------------------------------------------------- * 100%.
(например, медиана)
Соответственно коэффициент осцилляции отражает колеблемость крайних значений признака вокруг средней:
R
Ko = ------------ * 100 %.
-- (7.2.5)
x
Относительное линейное отклонение:
Л
Kл = ------------ * 100 %.
-- (7.2.6)
x
Коэффициент вариации является наиболее распространенным показателем и используется для оценки типичности средних величин:
s
V = ------------ * 100 %.
-- (7.2.7)
x
Если V больше 0,4 (40%), то это говорит о большой колеблемости признака в изучаемой совокупности.
Пример. Сравним вариацию двух признаков:
-- x | s | -- V = s / x * 100% | |
Заработная плата рабочих-сдельщиков, руб. в сутки | 10 % | ||
% выполнения суточной нормы выработки | 16,4 % |
Вариация выполнения норм выработки выше, чем вариация заработной платы, хотя можно ожидать примерного их равенства. Возможно, это объясняется стремлением администрации уравнять заработки рабочих.
|
|
Помимо основной формулы расчета дисперсии применяется упрощенный способ ее вычисления.
1 способ – среднее из квадратов минус квадрат среднего.
__ _2 å x2 * f å x * f
s2 = x2 - x = -------------- - (---------------) 2 .
å f å f
(7.3.1)
2 способ -- способ моментов, основанный на свойствах дисперсии.
Свойства дисперсии:
n если каждое значение x уменьшить или увеличить на одно и то же число, то s2 не меняется;
n если каждое значение x уменьшить или увеличить в i число раз, то s2 уменьшится или увеличится в i2 число раз.
å (--------) 2 * f å ---------- * f
s2 = [ ------------------------- - (----------------------) 2 ] * i2;
å f å f
(7.3.2)
s2 = [ m2 - m1 2 ] * i2 ,
å (-------) * f å (--------) 2 * f
где m1 = ------------------------; m2 = -----------------------;
å f å f
m1 - момент I порядка;
m2 - момент II порядка.
3 способ -- меры вариации для сгруппированных данных.
Для сгруппированных данных можно выделить три дисперсии:
n общая s2 ;
n межгрупповая d2 ;
n внутригрупповая s2i.
Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов.
__
å (xi - x) 2 * fi
s2= ------------------------. (7.3.4)
å fi
Внутригрупповая дисперсия измеряет вариацию признака внутри каждой группы.
__
å (xi - xi) 2 * fi
s2i= ------------------------.
å fi. (7.3.5)
__
Средняя дисперсия из внутригрупповых s2i рассчитывается по формуле средней арифметической взвешенной:
___ å s2i* fi
s2i= --------------------. (7.3.6)
å fi
Этот показатель характеризует влияние на результативный признак всех прочих факторов за исключением признака, положенного в основу группировки.
Межгрупповая дисперсия измеряет вариацию, обусловленную признаком, положенным в основу группировки.
|
|
__ __
å (xi - xо) 2 * fi
d2 = ------------------------,
å fi (7.3.7)
_
где xi – средняя по отдельным группам;
_
xо – средняя общая по всей совокупности.
Правило сложения дисперсий гласит: ___
s2 = d2 + s2i. (7.3.8)
С помощью закона сложения дисперсий можно оценить удельное значение фактора, лежащего в основе группировки, во всей совокупности факторов, воздействующих на результативный признак.
Осуществляется это с помощью коэффициента детерминации и эмпирического корреляционного отношения.
Коэффициент детерминации рассчитывается как отношение
d2
D = ------.
s2 (7.3.9)
Эмпирическое корреляционное отношение рассчитывается по формуле:
___
h = ÖD, (7.3.10)
где h = до 0,3 -- слабая связь;
h = от 0,3 до 0,7 -- средняя степень связи;
h = свыше 0,7 -- высокая степень связи.
В статистике наряду с показателями вариации количественного признака определяются показатели вариации альтернативного признака (то есть признака, которым обладают одни единицы совокупности и не обладают другие).
Доля вариантов, обладающих изучаемым признаком, обозначается p, а не обладающих – q. Кроме того, наличие признака будем обозначать 1, а его отсутствие – 0. Следовательно, p + q = 1.
__ å xi * fi 1 * p + 0 * q
X = ------------- = -------------------- = p;
å fi p + q (7.4.1)
__
å (xi - x) 2 * fi (1 - p)2 * p + (0 - p)2 * q
s2p= ------------------------ = -------------------------------------- = p * q.
å fi p + q (7.4.2)
Пример: Все население – 10 000 чел., в том числе женщины – 6 000 чел.
6 000 4 000
p = --------- = 0,6; q = ---------- = 0,4;
10 000 10 000
___ ____
s2p= p * q = 0,6 * 0,4 = 0,24; s =Ö s2 = Ö 0,24 = 0,49.
Вопросы для самопроверки:
Ø Что такое вариация признака?
Ø Что такое размах вариации и его недостаток как показателя колеблемости признака?
Ø Как вычисляется среднее линейное отклонение и каков недостаток этого показателя?
Ø Расскажите о дисперсии и способах ее расчета.
Ø Среднее квадратическое отклонение и его преимущества перед средним линейным отклонением.
Ø Значение коэффициента вариации как относительного показателя колеблемости признака.
Ø Взаимосвязь показателей вариации.
Ø Правило сложения дисперсий. Экономический смысл общей, межгрупповой и внутригрупповой дисперсий.
Ø Расчет и экономический смысл коэффициента детерминации и эмпирического корреляционного отношения.