Метод позволяет проверить гипотезу о том, что средние значения двух генеральных совокупностей, из которых извлечены сравниваемые зависимые выборки, отличаются друг от друга. Допущение зависимости чаще всего значит, что признак измерен на одной и той же выборке дважды, например, до воздействия и после него. В общем же случае каждому представителю одной выборки поставлен в соответствие представитель из другой выборки (они попарно объединены) так, что два ряда данных положительно коррелируют друг с другом. Более слабые виды зависимости выборок: выборка 1 — мужья, выборка 2 — их жены; выборка 1 — годовалые дети, выборка 2 составлена из близнецов детей выборки 1, и т. д.
Проверяемая статистическая гипотеза, как и в предыдущем случае, Н0: М1 = М2 (средние значения в выборках 1 и 2 равны). При ее отклонении принимается альтернативная гипотеза о том, что М1 больше (меньше) М2.
Исходные предположения для статистической проверки:
- каждому представителю одной выборки (из одной генеральной совокупности) поставлен в соответствие представитель другой выборки (из другой генеральной совокупности);
- данные двух выборок положительно коррелируют (образуют пары);
- распределение изучаемого признака и в той и другой выборке соответствует нормальному закону.
Структура исходных данных: имеется по два значения изучаемого признака для каждого объекта (для каждой пары).
Ограничения: распределения признака и в той, и в другой выборке должно существенно не отличаться от нормального; данные двух измерений, соответствующих той и другой выборке, положительно коррелируют.
Альтернативы: критерий Т-Вилкоксона, если распределение хотя бы для одной выборки существенно отличается от нормального; критерий t-Стьюдента для независимых выборок — если данные для двух выборок не коррелируют положительно.
Формула для эмпирического значения критерия t-Стьюдента отражает тот факт, что единицей анализа различий является разность (сдвиг) значений признака для каждой пары наблюдений. Соответственно, для каждой из N пар значений признака сначала вычисляется разность di = х1i - x2i.
где Md – средняя разность значений; σd – стандартное отклонение разностей.
Пример расчета:
Предположим, в ходе проверки эффективности тренинга каждому из 8 членов группы задавался вопрос «Насколько часто твое мнение совпадаете мнением группы?» — дважды, до и после тренинга. Для ответов использовалась 10-балльная шкала: 1 — никогда, 5 — в половине случаев, 10 — всегда. Проверялась гипотеза о том, что в результате тренинга самооценка конформизма (стремления быть как другие в группе) участников возрастет (α = 0,05). Составим таблицу для промежуточных вычислений (таблица 3).
Таблица 3
Среднее арифметической для разности Md = (-6)/8 = -0,75. Вычтем это значение из каждого d (предпоследний столбец таблицы).
Формула для стандартного отклонения отличается лишь тем, что вместо Х в ней фигурирует d. Подставляем все нужные значения, получаем:
σd = = 0,886.
Ш а г 1. Вычисляем эмпирическое значение критерия по формуле (3): средняя разность Md = -0,75; стандартное отклонение σd = 0,886; tэ = 2,39; df = 7.
Шаг 2. Определяем по таблице критических значений критерия t-Стьюдента р-уровень значимости. Для df = 7 эмпирическое значение находится между критическими для р = 0,05 и р — 0,01. Следовательно, р < 0,05.
df | Р | ||
0,05 | 0,01 | 0,001 | |
2,365 | 3,499 | 5,408 |
Шаг 3. Принимаем статистическое решение и формулируем вывод. Статистическая гипотеза о равенстве средних значений отклоняется. Вывод: показатель самооценки конформизма участников после тренинга увеличился статистически достоверно (на уровне значимости р < 0,05).
К параметрическим методам относится и сравнение дисперсий двух выборок по критерию F-Фишера. Иногда этот метод приводит к ценным содержательным выводам, а в случае сравнения средних для независимых выборок сравнение дисперсий является обязательной процедурой.
Для вычисления Fэмп нужно найти отношение дисперсий двух выборок, причем так, чтобы большая по величине дисперсия находилась бы в числителе, а меньшая знаменателе.
Сравнение дисперсий. Метод позволяет проверить гипотезу о том, что дисперсии двух генеральных совокупностей, из которых извлечены сравниваемые выборки, отличаются друг от друга. Проверяемая статистическая гипотеза Н0: σ12 = σ22 (дисперсия в выборке 1 равна дисперсии в выборке 2). При ее отклонении принимается альтернативная гипотеза о том, что одна дисперсия больше другой.
Исходные предположения: две выборки извлекаются случайно из разных генеральных совокупностей с нормальным распределением изучаемого признака.
Структура исходных данных: изучаемый признак измерен у объектов (испытуемых), каждый из которых принадлежит к одной из двух сравниваемых выборок.
Ограничения: распределения признака и в той, и в другой выборке существенно не отличаются от нормального.
Альтернатива методу: критерий Ливена (Levene'sTest), применение которого не требует проверки предположения о нормальности (используется в программе SPSS).
Формула для эмпирического значения критерия F-Фишера:
(4)
где σ12 — большая дисперсия, a σ22— меньшая дисперсия. Так как заранее не известно, какая дисперсия больше, то для определения р-уровня применяется Таблица критических значений для ненаправленных альтернатив. Если Fэ > FKp для соответствующего числа степеней свободы, то р < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).
Пример расчета:
Детям давались обычные арифметические задания, после чего одной случайно выбранной половине учащихся сообщали, что они не выдержали испытания, а остальным — обратное. Затем у каждого ребенка спрашивали, сколько секунд ему потребовалось бы для решения аналогичной задачи. Экспериментатор вычислял разность между называемым ребенком временем и результатом выполненного задания (в сек.). Ожидалось, что сообщение о неудаче вызовет некоторую неадекватность самооценки ребенка. Проверяемая гипотеза (на уровне α = 0,005) состояла в том, что дисперсия совокупности самооценок не зависит от сообщений об удаче или неудаче (Н0: σ12 = σ22).
Были получены следующие данные:
Ш а г 1. Вычислим эмпирическое значение критерия и числа степеней свободы по формулам (4):
Шаг 2. По таблице критических значений критерия f-Фишера для ненаправленных альтернатив находим критическое значение для dfчисл = 11; dfзнам = 11. Однако критическое значение есть только для dfчисл = 10 и dfзнам = 12. Большее число степеней свободы брать нельзя, поэтому берем критическое значение для dfчисл = 10: Для р = 0,05 FKp = 3,526; для р = 0,01 FKp = 5,418.
Шаг 3. Принятие статистического решения и содержательный вывод. Поскольку эмпирическое значение превышает критическое значение для р = 0,01 (и тем более — для р = 0,05), то в данном случае р < 0,01 и принимается альтернативная гипотеза: дисперсия в группе 1 превышает дисперсию в группе 2 (р < 0,01). Следовательно, после сообщения о неудаче неадекватность самооценки выше, чем после сообщения об удаче.