неизвестна, стандартная ошибка будет оцениваться при использовании р как оценки р:
Теперь мы можем найти (1 - а) 100%-ный доверительный интервал для генеральной доли:
Гл. 5. Статистический вывод 1
где z в ,2 — величина стандартизованной нормальной переменной, выше которой лежит (а/2) 100% выборочного распределения.
LJ Пример 5.5. В ходе аудиторской проверки фирмы была проведена случайная выборка записей по счетам. Из выборки п = 500 записей 10 содержали некоторые ошибки в самой записи или процедуре. Требуется оценить с вероятностью 95% доверительный интервал для доли ошибок во всей генеральной совокупности записей.
Решение
Поскольку пр = 10 и п(1-р) = 490 больше 5, то может быть использована нормальная аппроксимация для биномиального распределения. Так как доля ошибок генеральной совокупности р неизвестна, то стандартная ошибка выборочного распределения должна быть оценена с помощью выборочной доли р. Доверительный интервал с вероятностью 95% для генеральной доли может быть записан как:
|
|
р ±lt96yjSJLi3<
где 1,96 — величина стандартизованной переменной г, которая включает 95%-ное стандартное нормальное распределение
р = 10/500 = 0,02. Поэтому
SE£ - V0.02 х 0,98/500 = 0,0063. Следовательно, доверительный интервал с вероятностью 95% составит: 0,02 ± 1,96 х 0,0063 - 0,02 ± 0,012.
На 95% мы уверены, что доля ошибок в записях на бухгалтерских счетах, в генеральной совокупности р находится в пределах между 0,008 и 0,032.
Отклонение ±0,012 в величине доли составляет приблизительно 60% выборочной доли, равной 0,02. Это много и, следовательно, выборочная доля является ненадежной оценкой генеральной доли.
LJ Пример 5.6. Проведена случайная выборка личных заемных счетов в банке. Иэп» 1000 отобранных счетов 60 оказались с задолженностью по возврату ссуды сроком до трех месяцев.
Найдем доверительный интервал с вероятностью 90% для доли счетов в генеральной совокупности р, которые имеют задолженность до трех месяцев.
Если банк насчитывает 30000 личных заемных счетов, каков доверительный интервал с вероятностью 90% для числа счетов, имеющих задолженность до трех месяцев?
Решение
Доверительные границы — это значения границ доверительного интервала. Так как пр = 60ип(1-р) = 940 (больше 5), может быть использована
144 Ч. 2. Анализ данных как составная часть принятия решений
нормальная аппроксимация. Поскольку соответствующая генеральная доля р неизвестна, то стандартная ошибка выборочного распределения должна быть оценена на
основе выборочной доли р. Выборочная доля интересующих нас счетов равна:
р = 60/1000 = 0,06; соответственно,
SE£ = V р (1 - р)/п = V 0,06 х 0,94/1000 = 0,0075.
Доверительный интервал с вероятностью 90% для генеральной доли находится следующим образом:
|
|
р ± 1,645 SE£,
где ± 1,645 — величина стандартизованной нормальной переменной z, которая включает 90%-ное распределение. Следовательно,
0,06 ± 1,645 х 0,0075 = 0,06 ± 0,012.
Пределы доверительного интервала (доверительные границы) составили:
0,06 + 0,012 = 0,075;
0,06-0,012 = 0,048.
Если общее числа счетов равняется 30000, то доверительный интервал.с вероятностью 90% для числа интересующих нас счетов:
30000 (0,06 ± 0,012) = 1800 ± 360.
Следовательно, на 90% мы уверены, что число счетов, имеющих задолженность до трех месяцев, лежит в пределах между 1440 и 2160.