Гистограмма

Гистограммой называется столбиковая диаграмма, построенная по значениям относительной частоты групп fi, взятым из группировочной таблицы. В пакете SG процедуры построения группировочной таблицы и гистограммы реализованы в разделе F.DESCRIPTIVE METHODS. Если данные примера 2.1 занести в SG-файл APOG в виде переменной VYR, можно воспользоваться этими процедурами в следующем порядке (см. пример 2.2).

Пример 2.2. Построить группировочную таблицу и гистограмму для переменной APOG.VYR с помощью SG.

Порядок действий после вызова главного меню SG.

1) F.DESCRIPTIVE METHODS, процедура 2.Frequency Tabulation.

2) Data (ввести данные): с помощью [F7] ввести переменную APOG.VYR и нажать клавишу исполнения [F6]. На экране высветится панель исходных данных (табл. 2.4). На этой панели отражены общие характеристики введенной переменной:

тип - дискретная;

нижний предел 10;

верхний предел 24;

число классов 15.

Т.е. предлагается разбить выборку на 15 классов (групп). Эта процедура Статграфа всегда предлагает оптимальное число групп таблицы.

Таблица 2.4.

Tabulation Input Panel

Primary Variable Secondary Variable

-----------------------------------------------------------

Type Discrete Type

Lower limit 10 Lower limit

Upper limit 24 Upper limit

No. of classes 15 No. of classes

Length = 40 Length =

Minimum = 10 Minimum =

Maximum = 24 Maximum =

3)Клавиша исполнения [F6]. В возникшем диалоговом окне выбрать пункт Display table (вывести таблицу на дисплей). Результат - Frequency Tabulation (группировочная таблица) - табл. 2.5.

Таблица 2.5.

Frequency Tabulation

--------------------------------------------------------------------

Lower Upper Mid- Frequ- Relative Cumulat. Cum. Rel.

Class Limit Limit point ency Frequ- Frequ- Frequ-

ency ency ency

--------------------------------------------------------------------

at or below 9.50 0.0000 0.0000

1 9.50 10.50 10.00 2.0500 2.0500

2 10.50 11.50 11.00 0.0000 2.0500

3 11.50 12.50 12.00 4.1000 6.1500

4 12.50 13.50 13.00 4.1000 10.2500

5 13.50 14.50 14.00 2.0500 12.3000

6 14.50 15.50 15.00 6.1500 18.4500

7 15.50 16.50 16.00 5.1250 23.5750

8 16.50 17.50 17.00 0.0000 23.5750

9 17.50 18.50 18.00 8.2000 31.7750

10 18.50 19.50 19.00 0.0000 31.7750

11 19.50 20.50 20.00 3.0750 34.8500

12 20.50 21.50 21.00 0.0000 34.8500

13 21.50 22.50 22.00 3.0750 37.9250

14 22.50 23.50 23.00 0.0000 37.9250

15 23.50 24.50 24.00 3.0750 40 1.0000

above 24.50 0.0000 40 1.0000

--------------------------------------------------------------------

Mean = 16.5 Standard Deviation = 3.77577 Median = 16

Frequency Tabulation (табл.2.5) содержит те же столбцы, что и табл. 2.3, поскольку представляет собой также группировочную таблицу. Перевод терминов:

class - группа;

lower limit - нижний предел;

upper limit - верхний предел;

midpoint - среднее группы;

frequency - частота;

relative frequency - относительная частота;

cumulative frequency - кумулятивная частота;

cumulative relative frequency - относительная кумулятивная частота.

В нижней части табл.2.5 приведены рассчитанные попутно значения основных вычисляемых статистик выборки, а именно:

Mean - средневзвешенное значение, вычисленное по формуле:

`xвз.= f1`x1+f2`x2+...+fk`x1, (2.3)

Standard Deviation - среднеквадратическое отклонение,

Median - медиана.

4)[F10]...[F10] - вернуться в главное меню SG.

5)F.DESCRIPTIVE METHODS, процедура 3.Frequency Histogram.

6)Data (ввести данные): с помощью [F7] ввести переменную APOG.VYR и нажать клавишу исполнения [F6]. После просмотра панели исходных данных (на ней можно задать собственные обозначения осей графика) снова нажать [F6]. На экране появится изображение гистограммы, соответствующей рассчитанной ранее группировочной таблице (рис. 2.3).

Рис. 2.3. Гистограмма, построенная с помощью пакета STATGRAPHICS.

Как видно из заголовка диаграммы на рис.2.3 (Frequency Histo-gram), она представляет собой частотную гистограмму. Действительно, по оси ординат на ней отложены значения групповых частот mi (ср. с табл. 2.5). Для целей анализа часто строят гистограмму иначе: по оси ординат откладывают отношение относительной частоты группы fi к величине интервала Dx. В этом случае площадь каждого прямоугольника становится равной относительной частоте, а суммарная площадь всех прямоугольников будет равна 1. Такой способ построения гистограммы больше соответствует ее математическому смыслу, который, согласно закону больших чисел, состоит в том, что при неограниченном повторении числа опытов форма гистограммы для непрерывных СВ стремится по вероятности к форме плотности распределения этой случайной величины.

График распределения частот на рис.2.3 неудобен еще и тем, что дает излишнее дробление выборки в соответствии с выбранным Статграфом числом групп. В результате некоторые группы гистограммы и группировочной таблицы не заполнены (mi=0). Получаются искусственные разрывы гистограммы, которые искажают природу распределения генеральной совокупности.

Теория группировок рекомендует уменьшать число групп, если в гистограмме образуются разрывы. В соответствии с этой рекомендацией можно построить для этого же примера более удобную аналитическую гистограмму на базе группировочной таблицы 2.3 с количеством групп, равным 3, учитывая малый объем выборки (рис.2.4).

Рис.2.4. Гистограмма, построенная по данным табл.2.3.

Гистограмма на рис.2.4 более удобна для проведения статистиче-ского анализа выборки, в частности, для выдвижения гипотезы о характере распределения вероятностей генеральной совокупности.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: