До этого мы изучали только правила построения интервальных рядов с равными интервалами. В то же время, очень часто при анализе реальных данных приходится строить вариационные ряды с неравными интервалами. Количество групп определяется в каждом случае индивидуально, в зависимости от изучаемой совокупности.
Для оценки качества группировки данных (качества разбиения на интервалы) могут быть использованы эмпирическое корреляционное отношение и график плотности распределения единиц признака (полигон распределения частот и гистограмма).
Первоначально строят интервальный ряд с равными интервалами и анализируют возможность его применения. Применение равных интервалов возможно, если вариация признака (разница между максимальным и минимальным значением) не очень сильная и распределение является равномерным (все группы достаточно наполнены, линия полигона частот не имеет резких перепадов и зигзагов).
Если же эти условия не соблюдаются, то тогда нужно строить интервальные ряды с неравными интервалами. Неравные интервалы делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные, равночастотные и специализированные.
Приблизительно число интервалов m можно оценить исходя только из объема выборки n по формуле Стерджесса или по таблице:
Объем выборки, n | 25-40 | 40-60 | 60-100 | 100-200 | Больше 200 |
Число интервалов, k | 5-6 | 6-8 | 7-10 | 8-12 | 10-15 |