Применение критерия Пирсона для оценки гипотезы распределения случайной величины с помощью табличного процессора Excel.
Сравнив χ2 кр и χ2 можно сделать вывод о значимости гипотезы: если
χ2 кр > χ2, то гипотеза принимается с уровнем значимости a, в противном случае гипотеза отвергается.
В первую очередь, производится округление значений выборки до целого числа (рисунок 11А) и вычисление ni (частоты выборочных значений xi) (рисунок 11Б, ячейки F11:F15). Это возможно сделать воспользовавшись функцией =СЧЁТЕСЛИ( диапазон проверяемых значений; критерий по которому производится проверка ). Значений совпадают с результатами, полученными в предыдущем пункте (рисунок 10).
Рисунок 11.А Округление выборочных значений
Рисунок 11.Б Частота выборочных значений
Затем производится вычисление теоретической вероятности pi выборочного значения xi.
Для проверки гипотезы о нормальном распределении используется функция =НОРМРАСП( xi; среднее арифметическое; средне квадратическое отклонение; 1 ) (рисунок 12).
|
|
Рисунок 12. Теоретическая вероятность выборочного значения
Расчёт теоретической частоты n’i выборочного значения xi представлен на рисунке 13.
Затем вычисляется теоретическая частота выборочного значения xi по формуле:
где n – количество наблюдений, объём выборки.
Рисунок 13. Теоретическая частота выборочного значения
Наблюдаемое значение случайной величины χ2 определяется по формуле:
.
Для упрощения написания формулы в табличном процессоре порядок расчета наблюдаемого значения случайной величины можно разделить на два действия: деление (диапазон ячеек I11:I15) и сумма результатов деления (ячейка I16) (рисунок 14).
Рисунок 14. Вычисление наблюдаемого значения случайной величины χ2
Критическое значение случайной величины χ2 (рисунок 15) определяется с помощью функции:
χ2 кр =ХИ2ОБР (a,r),
где a – уровень значимости, требуемая вероятность (принимается равной значению 0,05),
r – количество степеней свободы.
Расчет количества степеней свободы производится по формуле:
,
где k – количество категорий (количество различных округлённых значений),
р – количество оцениваемых параметров закона распределения.
Из рисунка 14 видно (ячейки E11:E15), что имеется 5 различных округлённых значений оцениваемой случайной величины (количество категорий k). Так как рассматривается гипотеза о нормальном распределении, то оцениваются два параметра (среднее арифметическое и среднее квадратическое отклонение), то есть количество оцениваемых параметров p равно 2. Тогда количество степеней свободы равно 2.
Рисунок 15. Критическое значение случайной величины
|
|
Так как неравенство χ2 < χ2 кр выполняется, тогда гипотеза о том, что выборка случайной величины подчиняется закону нормального распределения при уровне значимости a = 0,05, является верной.