Определение числа групп

 

Определение числа групп можно осуществить несколькими способами. Формально-математический способ предполагает использование формулы Стерджесса

 

k=1+3.322*lg n,

 

где k - число групп;

n - число единиц совокупности.

Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности.

Число групп также может быть определено с использованием среднего квадратического отклонения (v). При этом существует следующая примерная зависимость между числом групп и значением среднего квадратического отклонения:

Если величина интервала равно 0,5v, то совокупность разбивается на 12 групп;

Если величина интервала равна 2/3v, то совокупность делится на 9 групп;

Если величина интервала равна v, то совокупность делится на 6 групп.

Недостатком применения данного метода определения числа групп является наличие достаточно большой вероятности получения "пустых" или малочисленных групп, которые будут недостаточно типичными для изучаемой совокупности в целом.

Расчет ширины интервала группировки

 

Важным этапом построения статистической группировки является определение интервалов статистической группировки.

Интервал - это значение варьирующего признака, лежащие в определенных границах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака в интервале. Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.

В зависимости от величины интервалы группировки бывают:

равные

неравные

В свою очередь неравные интервалы подразделяются на:

прогрессивно - возрастающие;

прогрессивно - убывающие;

произвольные;

специализированные.

В зависимости от наличия границ интервалы группировки бывают:

открытые;

закрытые.

Равные интервалы применяются в случае, если изменение количественного признака внутри изучаемой совокупности происходит равномерное и его вариация проявляется в сравнительно узких границах.

Ширина равного интервала определяется по следующей формуле:

h = R/k = Xmax - Xmin/k

 

где Xmax, Xmin - максимальное и минимальное значения признака в совокупности; k - число групп.

Если максимальное или минимальное значения сильно отличается от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или минимальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум. *

Неравные интервалы могут быть прогрессивно возрастающие или прогрессивно убывающие в арифметической или геометрической прогрессии.  Величина интервалов, изменяющихся в арифметической прогрессии определяется следующим образом:

h i +1= h i +a

 

а в геометрической прогрессии

hi+1 = h * q

 

где a - константа: для прогрессивно-возрастающих интервалов знак "+", а при прогрессивно убывающих - знак " - "

q - константа: для прогрессивно-возрастающих - больше "1"; для прогрессивно-убывающих - меньше "1".

Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница несущественна.

Закрытыми называются интегралы, у которых имеются и верхняя, и нижняя границы.

Открытыми называются интегралы, у которых указана только одна граница: как правило, верхняя - у первого интервала и нижняя - у последнего. Применение открытых интервалов целесообразно в тех случаях, когда в совокупности встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые в несколько раз отличаются от всех остальных значений изучаемого признака.

 

Определение признаков, которые в комбинации друг с другом будут характеризовать каждую выделенную группу

 

При группировке единиц совокупности по количественному признаку обозначение границ интервалов зависит от того, непрерывный или дискретный признак положен в основание группировки.

Если основанием группировки служит непрерывный признак, то одно и то же значение признака выступает и верхней и нижней границами двух смежных интервалов. Верхняя граница i-го интервала равна нижней границе (i+1) - го интервала.

Для того, чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно использовать открытые интервалы. В данном случае, вопрос отнесения отдельных единиц совокупности, значения которых являются граничными, к той или иной группе решается на основе анализа последнего открытого интервала.

Если в основании группировки лежит дискретный признак, то нижняя граница i-го интервала равна верхней границе i-1-го интервала, увеличенной на 1. Группы коммерческих банков по численности работающих (чел) будет иметь вид: 100 - 160, 161 - 220, 221 - 280.

Если изменение количественного признака приводит к появлению нового качества, то граница интервала устанавливается там, где происходит переход от одного качества к другому. Строя такую группировку, следует дифференцированно устанавливать границы интервалов для разных отраслей экономики. Это достигается путем использования группировок со специализированными интервалами. Специализированными называются интегралы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.




Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: