Рассмотрим задачу на применение Двухвыборочного F-теста для сравнения дисперсий двух генеральных совокупностей. Это может быть самостоятельной задачей, если мы оцениваем, например, точность двух приборов. Точность измерений будет одинаковой, если дисперсии равны. Кроме того F-тест используется перед проведением Двухвыборочного t-теста с одинаковыми дисперсиями.
Пусть необходимо оценить существенность различий в скорости оседания эритроцитов (СОЭ) двух групп больных для уровня значимости α = 0,01 по следующим данным:
X | |||||||
Y |
Для того, чтобы выбрать тест для оценки существенности различий, т.к. рассматриваются выборки не повторных испытаний, нам нужно оценить равенство дисперсий. В зависимости от того равны они или нет выбрать соответствующий t-тест. Поэтому сначала проведем F-тест.
Выдвигаем нулевую гипотезу Н0: о равенстве дисперсий при альтернативной гипотезе Н1: дисперсия первой группы больше дисперсии второй группы (одностороннее распределение, обычно здесь другие альтернативные гипотезы не используются) при уровне значимости α = 0,01.
|
|
Значения данных вносим в таблицу Excel в блоки А1:H1 и А2:H2. Вызываем пакет анализа данных Сервис – Анализ данных…. Выбираем из списка Двухвыборочный F- тест для дисперсии и нажимаем Ок. На экран будет выведено окно (см. рис. 4.3)
Рис. 4.3
В данном окне ввести Интервал переменной 1 блок А1:Н1 или выделить этот блок с помощью мыши. В Интервал переменной 2 ввести блок А2:Н2 или выделить этот блок с помощью мыши. Поставить флажок Метки. Ввести в поле Альфа уровень значимости 0,01. В Параметрах вывода щелкнуть Выходной интервал и ввести в поле ячейку А10 (или выделить эту ячейку с помощью мыши), с которой будет начинаться вывод результата анализа. Нажимаем кнопку Ок. На лист Excel будет выведена следующая таблица:
Двухвыборочный F-тест для дисперсии | ||
X | Y | |
Среднее | 39,85714286 | |
Дисперсия | 3,476190476 | |
Наблюдения | ||
df | ||
F | 2,301369863 | |
P(F<=f) одностороннее | 0,166943934 | |
F критическое одностороннее | 8,466031431 | |
В данной таблице параметры обозначают следующее: Среднее – средние арифметические значения выборок; Дисперсия – дисперсии выборок; Наблюдения – число опытов (объем выборки); df – k = n-1 (число степеней свободы); F – вычисленный параметр Фишера; P(F<= f)одностороннее – критический уровень значимости; F критическое одностороннее – табличное значение параметра Фишера для заданного уровня значимости 0,01. Нулевая гипотеза принимается при F<Fкритическое, в противном случае, при F>Fкритическое, принимается альтернативная гипотеза.
|
|
В нашем случае F = 2,3. Это значительно меньше Fкритическое = 8,47. Следовательно, дисперсии одинаковы для уровня значимости 0,01 (вероятность 99 %).
Теперь переходим ко второй части задачи о существенности различий в СОЭ. Проверяем нулевую гипотезу о равенстве математических ожиданий СОЭ Н0: а1 = а2 при альтернативной гипотезе, что они не равны Н1: а1 ≠ а2 (двустороннее распределение) для уровня значимости 0,01.
Так как мы установили равенство дисперсий двух рядов, то используем Двухвыборочный t-тест с одинаковыми дисперсиями.
Вызываем пакет анализа данных Сервис – Анализ данных…. Выбираем из списка Двухвыборочный t-тест с одинаковыми дисперсиями и нажимаем Ок. На экран будет выведено окно (см. рис. 4.4)
Рис. 4.4
В данном окне ввести Интервал переменной 1 блок А1:Н1 или выделить этот блок с помощью мыши. В Интервал переменной 2 ввести блок А2:Н2 или выделить этот блок с помощью мыши. В поле Гипотетическая средняя разность ввести ноль (т.к. нулевая гипотеза предполагает равенство математических ожиданий рядов). Поставить флажок Метки. Ввести в поле Альфа уровень значимости 0,01. В Параметрах вывода щелкнуть Выходной интервал и ввести в поле ячейку А22 (или выделить эту ячейку с помощью мыши), с которой будет начинаться вывод результата анализа. Нажимаем кнопку Ок. На лист Excel будет выведена следующая таблица:
Двухвыборочный t-тест с одинаковыми дисперсиями | ||
X | Y | |
Среднее | 39,85714286 | |
Дисперсия | 3,476190476 | |
Наблюдения | ||
Объединенная дисперсия | 5,738095238 | |
Гипотетическая разность средних | ||
df | ||
t-статистика | 5,578560025 | |
P(T<=t) одностороннее | 6,00857E-05 | |
t критическое одностороннее | 2,680990292 | |
P(T<=t) двухстороннее | 0,000120171 | |
t критическое двухстороннее | 3,054537956 |
В данной таблице параметры обозначают следующее: Среднее – средние арифметические значения выборок; Дисперсия – дисперсии выборок; Наблюдения – число опытов (объем выборки); Объединенная дисперсия – пока не рассматриваем; Гипотетическая разность средних – гипотеза о равенстве математических ожиданий а1-а2 = 0; df – k = n1+n2-2 (число степеней свободы); t-статистика – рассчитанный параметр Т; t-критическое одностороннее – табличный параметр при альтернативной гипотезе математическое ожидание одной ГС больше (или меньше) математического ожидания второй ГС; t-критическое двухстороннее – табличный параметр при альтернативной гипотезе математические ожидания двух ГС не равны; P(T<=t) одностороннее и P(T<=t) двухстороннее соответствующие критические уровни значимости.
Для рассмотренного примера Т = 5,58, а tтабл = 3,05. Так как Т>tтабл для уровня значимости 0,01, то это означает, что различие в СОЭ для двух групп больных существенно.
Примечание:
В случае неравных дисперсий следует выбрать Двухвыборочный t-тест с разными дисперсиями.