Определение числа групп можно осуществить несколькими способами. Формально-математический способ предполагает использование формулы Стерджесса
k=1+3.322*lg n,
где k - число групп;
n - число единиц совокупности.
Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности.
Число групп также может быть определено с использованием среднего квадратического отклонения (v). При этом существует следующая примерная зависимость между числом групп и значением среднего квадратического отклонения:
Если величина интервала равно 0,5v, то совокупность разбивается на 12 групп;
Если величина интервала равна 2/3v, то совокупность делится на 9 групп;
Если величина интервала равна v, то совокупность делится на 6 групп.
Недостатком применения данного метода определения числа групп является наличие достаточно большой вероятности получения "пустых" или малочисленных групп, которые будут недостаточно типичными для изучаемой совокупности в целом.
Расчет ширины интервала группировки
Важным этапом построения статистической группировки является определение интервалов статистической группировки.
Интервал - это значение варьирующего признака, лежащие в определенных границах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака в интервале. Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.
В зависимости от величины интервалы группировки бывают:
равные
неравные
В свою очередь неравные интервалы подразделяются на:
прогрессивно - возрастающие;
прогрессивно - убывающие;
произвольные;
специализированные.
В зависимости от наличия границ интервалы группировки бывают:
открытые;
закрытые.
Равные интервалы применяются в случае, если изменение количественного признака внутри изучаемой совокупности происходит равномерное и его вариация проявляется в сравнительно узких границах.
Ширина равного интервала определяется по следующей формуле:
h = R/k = Xmax - Xmin/k
где Xmax, Xmin - максимальное и минимальное значения признака в совокупности; k - число групп.
Если максимальное или минимальное значения сильно отличается от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или минимальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум. *
Неравные интервалы могут быть прогрессивно возрастающие или прогрессивно убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической прогрессии определяется следующим образом:
h i +1= h i +a
а в геометрической прогрессии
hi+1 = h * q
где a - константа: для прогрессивно-возрастающих интервалов знак "+", а при прогрессивно убывающих - знак " - "
q - константа: для прогрессивно-возрастающих - больше "1"; для прогрессивно-убывающих - меньше "1".
Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница несущественна.
Закрытыми называются интегралы, у которых имеются и верхняя, и нижняя границы.
Открытыми называются интегралы, у которых указана только одна граница: как правило, верхняя - у первого интервала и нижняя - у последнего. Применение открытых интервалов целесообразно в тех случаях, когда в совокупности встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые в несколько раз отличаются от всех остальных значений изучаемого признака.
Определение признаков, которые в комбинации друг с другом будут характеризовать каждую выделенную группу
При группировке единиц совокупности по количественному признаку обозначение границ интервалов зависит от того, непрерывный или дискретный признак положен в основание группировки.
Если основанием группировки служит непрерывный признак, то одно и то же значение признака выступает и верхней и нижней границами двух смежных интервалов. Верхняя граница i-го интервала равна нижней границе (i+1) - го интервала.
Для того, чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно использовать открытые интервалы. В данном случае, вопрос отнесения отдельных единиц совокупности, значения которых являются граничными, к той или иной группе решается на основе анализа последнего открытого интервала.
Если в основании группировки лежит дискретный признак, то нижняя граница i-го интервала равна верхней границе i-1-го интервала, увеличенной на 1. Группы коммерческих банков по численности работающих (чел) будет иметь вид: 100 - 160, 161 - 220, 221 - 280.
Если изменение количественного признака приводит к появлению нового качества, то граница интервала устанавливается там, где происходит переход от одного качества к другому. Строя такую группировку, следует дифференцированно устанавливать границы интервалов для разных отраслей экономики. Это достигается путем использования группировок со специализированными интервалами. Специализированными называются интегралы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.