Целью наших рассмотрений является получение оценки генерального среднего µ при условии, что располагаем мы всего лишь одной выборкой.
Мы ранее получили следующий результат: если значение генерального среднего равно µ, а оценка стандартного отклонения для распределения средних равна , то среднее произвольной выборки данного объема будет:
- находится в интервале (µ − 1,96 , µ + 1,96 ) с вероятностью 95%
- находится в интервале (µ − 2,58 , µ + 2,58 ) с вероятностью 99%.
Однако разобранная нами ситуация не реальна, в действительности ведь все обстоит прямо наоборот: реально мы располагаем средним одной выборки и оценкой стандартного отклонения для распределения средних , а интервал, в котором расположено генеральное среднее µ нам как раз необходимо найти.
Для этого попробуем осознать тот факт, что фраза: «Число х принадлежит интервалу (а – ε, а + ε)» эквивалентна утверждению «расстояние между числами а и х меньше, чем ε».
Но это означает, что утверждения «Число х принадлежит интервалу (а – ε, а + ε)» и «Число а принадлежит интервалу (х – ε, х + ε)» также эквивалентны, т.е. всегда либо оба они верны, либо оба они ложны – принцип взаимности. Соответственно и утверждения «среднее находится в интервале (µ − 1,96 , µ + 1,96 )» и «генеральное среднее µ находится в интервале ( − 1,96 , + 1,96 )» также эквивалентны.
|
|
Таким образом, мы можем подвести итог.
Пусть мы сделали выборку объёма n из генеральной совокупности, причем этот объём достаточно велик для того, чтобы мы могли считать, что распределение выборочных средних при таком объёме выборки близко к нормальному.
Для этой выборки мы подсчитали выборочное среднее и .
Тогда мы можем утверждать, что генеральное среднее µ:
- находится в интервале ( − 1,96 , + 1,96 ) с вероятностью 95%
- находится в интервале ( − 2,58 , + 2,58 ) с вероятностью 99%.
Т.е. сделав всего одну выборкуи подсчитав и мы получаем интервальную оценку для среднего генеральной совокупности – что и было нашей целью.
Интервалы типа ( − с , + с ), где с – числовой коэффициент, называются доверительными интервалами, а соответствующие им вероятности доверительными вероятностями.
Часто вместо доверительных вероятностей используют величины, дополняющие их до 100% (до единицы – если вероятности выражены в десятичных дробях, а не в процентах), такие величины называются уровнями значимости. Так доверительной вероятности в 95% (в дробях – 0,95), отвечает уровень значимости в 5% (0,05).
Сделаем еще одно важное замечание. Для больших выборок характер распределения средних всегда близок к нормальному. Но если сами варианты распределены нормально, оказывается распределение средних можно описать точно.
|
|
В этом случае они подчиняются так называемому распределению Стьюдента. Характер распределения Стьюдента зависит от объема выборки. Для выборок, содержащих 50 и более вариант, различия между распределениями Гаусса и Стьюдента уже практически не существенны. Для не очень больших объемов выборки в этом случае применяют несколько иной способ нахождения доверительного интервала.
По специальным таблицам распределения Стьюдента определяют величины коэффициентов с, которые обеспечивают попадание в интервал ( − с , + с ) с вероятностями 95% и 99% (уровни значимости в 5% и в 1%).
В таблицах приводятся величины этих коэффициентов в зависимости от объема выборки.