Деление вариационного ряда на части
Количество классов
Количество классов на которые необходимо разделить вариационный ряд, определяется различными способами: с помощью таблиц или формул; в подавляющем большинстве случаев количество интервалов зависит от объема выборки.
Для определения классов используем формулу Старжесса:
где, К – количество классов; N – объем выборки или количество значений в ряду, N=30
.
Определение длинны каждого интервала
Определение размаха или амплитуды колебания случайной величины:
;
где, R – размах, мг/л; h – длина каждого интервала.
Определение границ каждого интервала
1. Хmin + h = X1 – [Xmin; X1] – границы 1 интервала;
2. Х1 + h = X2 – [X1 ; X2] – границы 2 интервала;
…………………………………………………………
К. ХК-1 + h = XК – [XК-1 ; XК] – границы К-го интервала.
1. 22,65 + 1,71 = 24,36 – [22,65;24,36] – границы первого интервала;
2. 24,36 + 1,71 = 26,07 – [24,36;26,07] – границы второго интервала;
3. 26,07 + 1,71 = 27,78 – [26,07;27,78] – границы третьего интервала;
4. 27,78 + 1,71 = 29,49 – [27,78;29,49] – границы четвертого интервала;
|
|
5. 29,49 + 1,71 = 31,2 – [29,49;31,2] – границы пятого интервала;
6. 31,2 + 1,71 = 32,91 – [31,2;32,91] – границы шестого интервала.
Определение эмпирической частоты
Частота – это количество значений, попавших в каждый интервал. Расчеты выполняем в виде табл.1.
Таблица 1
К | Границы интервалов | ni | ||
[22,65 – 24,36] | 23,5 | 117,52 | ||
[24,36 – 26,07] | 25,21 | 226,935 | ||
[26,07 – 27,78] | 26,92 | 134,62 | ||
[27,78 – 29,49] | 28,63 | 200,44 | ||
[29,49 – 31,2] | 30,34 | 60,69 | ||
[31,2 – 32,93] | 32,06 | 64,13 | ||
∑ | 868,48 |
ni – эмпирическая частота, рассчитанная по результатам эксперимента;
– среднее арифметическое значение каждого интервала, (мг/л).
Определение расчетных статистических характеристик
Определение мер положения
Меры положения характеризуют расположение центра распределения выборки: среднее арифметическое, мода, медиана.
Среднее арифметическое значение (основной показатель, входящий в характеристику большинства законов распределения) является первым начальным моментом.
, (мг/л)
где, – среднее арифметическое значение выборки, (мг/л);
– элемент выборки
Если учитывать, что ряд натурных наблюдений вариационный и сгруппированный, то среднее арифметическое значение можно рассчитать по следующей зависимости
, (мг/л)
где, ni –частота каждого интервала;
среднее значение каждого интервала, (мг/л).
(мг/л).
Среднее арифметическое значение каждого интервала рассчитывается, как полусумма границ интервалов.
Мода (значение, имеющее максимальную частоту, т.е. наиболее часто встречаемое значение случайной величины в выборке) определяется по формуле:
|
|
;
где Хо – начало модального интервала;
ni – частота модального интервала;
n(i - 1), n(i-+ 1) – соответственно частоты предыдущего и последующего за модальным интервалов.
.
Медиана (определение серединного элемента выборки):
;
где Хо – начало медианного интервала;
Т(i – 1) – сумма частот интервалов предшествовавших медианному;
ni – частота медианного интервала.
.
Меры рассеивания
Характеристикой рассеивания или отклонения случайной величины от центра распределения выступает дисперсия – второй центральный момент. Согласно методу моментов дисперсия определяется по формуле:
.
Для определения стандартного отклонения из дисперсии извлекается квадратный корень, полученная величина называется средним квадратичным отклонением и обозначается σ, (мг/л).:
; (мг/л);
Нормированное отклонение определяется коэффициентом вариации: