Распределение признака. Графическое представление данных

Распределением признака называется закономерность, с которой встречаются его значения. Форма распределения признака показывает, с какой частотой значения переменной попадают в определенные интервалы. Форму распределения можно увидеть, представив эмпирические данные графически. Наиболее распространенными формами графического представления данных являются гистограмма и полигон частот.

Гистограмма – это ступенчатая фигура, состоящая из примыкающих друг к другу прямоугольников. Высота каждого прямоугольника равна частоте варианты или интервала группировки.

Полигон частот – это ломаная с вершинами в точках M (xi, ni), где xi – варианта или середина интервала группировки, ni частота варианты или интервала группировки.

Гистограмма и полигон частот позволяют показать, какие конкретные значения или диапазоны значений исследуемой переменной встречаются наиболее часто, насколько различаются эти значения, расположено ли большинство значений около среднего, является ли распределение данных симметричным или асимметричным, многомодальным или одномодальным и т.д. По виду этих графиков можно судить о типе распределения исследуемого признака (нормальное, равномерное и т.д.). На рисунке ниже представлены гистограмма и полигон частот одного и того же измерения.

Моде на гистограмме соответствует прямоугольник наибольшей высоты, или точка на полигоне частот, соответствующая самой высокой вершине (пик). Медиане соответствует точка, через которую проходит вертикальная прямая, делящая площадь гистограммы пополам.

Так, разделим гистограмму из предложенного выше примера на две части вертикальной прямой, проходящей через медиану, т.е. точку 65 на оси абсцисс. Вычислим площади каждой полученной части как сумму площадей прямоугольников: S1 = 10 + 50 + 120 + 45 = 225 и S2 = 45 + 80 + 60 + 40 = 225. Убеждаемся, что площади равны.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: