Ряди розподілу. Наочне зображення статистичного розподілу

 

Рядом розподілу називають ряд чисел, які характеризують розподіл одиниць досліджуваної сукупності. Ряд чисел, які характеризують розподіл одиниць досліджуваної сукупності залежно від величини ознаки, називається варіаційним рядом.

Нехай у даній статистичній сукупності вивчається деяка ознака, яка, взагалі кажучи, змінюється з переходом від одного члена статистичної сукупності до іншого. Зміну цієї ознаки називають її варіацією, а значення ознаки у даного члена статистичної сукупності – його варіантною.

Якщо здійснити групування варіант за окремими значеннями ознаки, матимемо дискретне групування (від латинського слова discretus – роздільний, перервний).

Наприклад, можна скласти дискретний варіаційний ряд за кількістю балів, отриманих абітурієнтами на вступних іспитах.

Нехай 35 абітурієнтів дістали на трьох екзаменах таку кількість балів: 10; 10; 11; 9; 15; 12; 9; 12; 13; 9; 8; 11; 14; 13; 12; 9; 10; 14; 10; 7; 8; 7; 9; 11; 15; 12; 7; 7; 8; 13; 13; 14; 10. Побудуємо статистичний розподіл цих даних.

Кількість балів 7 8 9  10  11  12  13  14 15
Кількість абітурієнтів 5 3 5 6 3 4 4 3 2

Побудову гістограми для графічного зображення інтервального варіаційного ряду здійснюють таким чином. На осі абсцис відкладають інтервали значень ознаки і на кожному з них, як на основі, будують прямокутник з висотою, пропорційною частоті інтервалу.                

Розраховано, що кількість інтервалів має бути не меншою від 8 – 10 і не більшою від 20 – 25 при об’ємі статистичної сукупності n ≥ 50. У випадку дискретного розподілу на осі абсцис відкладають окремі значення ознаки.

Зазвичай вибирають шкали так, щоб ширина гістограми становила близько 1 її висоти, тобто щоб відношення висоти до ширини було приблизно 3: 5. Середина стовпчика суміщається із серединою інтервалу розряду.

На практиці прийнято зображувати гістограму у формі контуру, а не окремими стовпцями.

Побудова полігона розподілу нагадує побудову гістограми. У гістограмі кожний стовпчик закінчується горизонтальною лінією, причому на висоті, що відповідає частоті в цьому розряді. А в полігоні він закінчується точкою над серединою свого розрядного інтервалу на такій самій висоті.

Для побудови полігона варіаційного ряду на осі абсцис прямокутної системи координат відкладають інтервали значень ознаки і в серединах інтервалів ставлять перпендикуляри, довжини яких пропорційні відповідним частотам. Потім кінці сусідніх перпендикулярів з’єднують відрізками прямих, а кінці крайніх перпендикулярів з’єднують із серединами сусідніх інтервалів, частоти яких дорівнюють нулю. У результаті дістають замкнуту фігуру у вигляді многокутника, яку називають полігоном.

Приклад. За даними таблиці «Результати випробувань міцності ниток» побудуйте гістограму і полігон.


Результати випробувань міцності ниток

 

Міцність нитки,Х 120 – 140 140 – 160 160 – 180 180 – 200 200 – 220 220 – 240 240 – 260 260 – 280
Кількість Ниток, m 1 4 10 14 12 6 2 1

 

Відкладаємо значення ознаки на осі абсцис, а частоти – на осі ординат (масштаб на обох осях вибираємо довільно). На відрізках осі абсцис, які відповідають побудованим інтервалам, будуємо прямокутники і дістаємо гістограму.

Щоб побудувати полігон, даний інтервальний ряд перетворимо на дискретний, обчисливши значення ознаки, що припадає на середину.

 

Міцність нитки, Х 130 150 170 190 210 230 250 270
Кількість ниток, m 1 4 10 14 12 6 2 1

 

Будуємо точки, координатами яких є пари чисел з дискретного варіаційного ряду (130; 1) (150; 4) і т. п. З’єднавши утворені точки відрізками прямої, а крайні точки (130; 1) і (270; 1) – із серединами найближчих інтервалів (110; 0) і (290; 0), дістанемо полігон.

Часом замість гістограми чи полігона будують згладжену криву, яку проводять за точками настільки близько, наскільки це можливо.

Гістограма – найлегша для сприймання форма, тому їй надають перевагу, коли зображують не більше від одного розподілу. Але якщо треба порівняти два або більше розподілів, то для цього краще підходять полігони частот, бо їх можна накласти один на одного при меншій кількості перетинів ліній.




Мода і медіана

 

Ми вже бачили, що властивості сукупності даних можна подати у формі таблиць і графіків. Розглянемо деякі інші способи оцінювання даних за розподілом частот. Їх метою є, як прийнято говорити в статистиці, виявлення міри центральної тенденції (центрального положення).

Найпростіше знайти міру центральної тенденції за допомогою моди (від латинського слова modus – міра, правило).

Мода – це значення ознаки, яке трапляється найчастіше в даному ряді розподілу.

Для дискретних варіаційних рядів мода визначається як значення ознаки з найбільшою частотою. Наприклад, якщо в універмазі протягом дня продано 200 дитячих костюмчиків – 38 штук 22 розміру, 42 штуки 24 розміру, 56 штук 26 розміру, 18 штук 28 розміру, 33 штуки 30 розміру і 13 штук 32 розміру, то модальним номером є 26 – й, бо він має найбільшу чисельність.

Проте не кожна сукупність значень має єдину моду в строгому розумінні цього означення. В сукупності значень (3, 5, 5, 7, 8, 8, 8, 9) модою є число 8, бо воно трапляється частіше за будь-яке інше значення.

У випадку, коли всі значення в групі трапляються однаково часто, вважають, що група оцінок не має моди. Наприклад, у групі (1,2; 1,2; 1,7; 1,7; 4,8; 4,8) мо-ди немає.

Якщо два сусідні значення мають однакову частоту і вона більша від частоти будь-якого іншого значення, мода є середнє цих двох значень. Наприклад, мода групи значень (1, 2, 3, 3, 3, 4, 4, 4, 5) дорівнює 3,5 ((3 + 4): 2). Якщо два несуміжні значення в групі мають рівні частоти і вони більші від частот будь-якого значення, то існує дві моди. Наприклад, у групі значень (7, 10, 10, 10, 11, 13, 14, 14, 14, 15) модами є 10 і 14.

Мода використовується, зокрема, у практиці торгівельної статистики під час визначення купівельного попиту на товари, рівня цін на ринках тощо.

Приклад. Білила цинкові найчастіше використовують художники в масляному живопису. Тому білу фарбу можна вважати модою сукупності фарб, що трапляються на палітрі. Цей факт враховують виробники фарб: білил цинкових випускають більше, ніж фарб інших кольорів.

Медіана – середня величина змінюваної ознаки, яка міститься всередині ряду, розміщеного в порядку зростання або спадання значень ознаки.

Отже,

Медіана – це значення змінюваної ознаки, яке ділить множину даних навпіл, так що одна половина значень більша від медіани, а друга –менша.

Якщо дані містять непарне число різних значень, наприклад 9, 11, 15, 18, 20, то медіана є середнім значенням для випадку, коли вони впорядковані, тобто медіана дорівнює 15. Якщо дані містять парне число різних випадків, наприклад 7, 11, 13, 15, то медіана дорівнює середньому між двома центральними значеннями, якщо вони впорядковані, тобто (11 + 13): 2 = 12.

Приклад.

1. Знайти медіану сукупності даних:

а) 12, 2, 9, 11, 15, 24, 10;

б) 18, 43, 24, 17, 21, 26.

Розв’язання. а) Розмістимо дані сукупності в порядку зростання: 2, 9, 10, 11, 12, 15, 24; n = 7 – непарне число. М = 11.

б) Розмістимо дані в порядку зростання:

17, 18, 21, 24, 26, 43;

n = 6 – парне число. М =  = = 22,5.

2. Результати контрольної роботи за матеріалом розділу дано в таблиці:

 

Оцінка, бал 12 9 6 3 Всього
Частота 11 9 2 20 42

 




Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: