t-критерий Стьюдента для зависимых выборок

Метод позволяет проверить гипотезу о том, что средние значения двух ге­неральных совокупностей, из которых извлечены сравниваемые зависимые вы­борки, отличаются друг от друга. Допущение зависимости чаще всего значит, что признак измерен на одной и той же выборке дважды, например, до воз­действия и после него. В общем же случае каждому представителю одной вы­борки поставлен в соответствие представитель из другой выборки (они по­парно объединены) так, что два ряда данных положительно коррелируют друг с другом. Более слабые виды зависимости выборок: выборка 1 — мужья, вы­борка 2 — их жены; выборка 1 — годовалые дети, выборка 2 составлена из близнецов детей выборки 1, и т. д.

Проверяемая статистическая гипотеза, как и в предыдущем случае, Н0: М1 = М2 (средние значения в выборках 1 и 2 равны). При ее отклонении принимается альтернативная гипотеза о том, что М1 больше (меньше) М2.

Исходные предположения для статистической проверки:

- каждому представителю одной выборки (из одной генеральной совокупно­сти) поставлен в соответствие представитель другой выборки (из другой генеральной совокупности);

- данные двух выборок положительно коррелируют (образуют пары);

- распределение изучаемого признака и в той и другой выборке соответству­ет нормальному закону.

Структура исходных данных: имеется по два значения изучаемого признака для каждого объекта (для каждой пары).

Ограничения: распределения признака и в той, и в другой выборке должно суще­ственно не отличаться от нормального; данные двух измерений, соответству­ющих той и другой выборке, положительно коррелируют.

Альтернативы: критерий Т-Вилкоксона, если распределение хотя бы для одной выборки существенно отличается от нормального; критерий t-Стьюдента для независимых выборок — если данные для двух выборок не корре­лируют положительно.

Формула для эмпирического значения критерия t-Стьюдента отражает тот факт, что единицей анализа различий является разность (сдвиг) значений при­знака для каждой пары наблюдений. Соответственно, для каждой из N пар значений признака сначала вычисляется разность di = х1i - x2i.

где Md – средняя разность значений; σd – стандартное отклонение разностей.

Пример расчета:

Предположим, в ходе проверки эффективности тренинга каждому из 8 членов груп­пы задавался вопрос «Насколько часто твое мнение совпадаете мнением группы?» — дважды, до и после тренинга. Для ответов использовалась 10-балльная шкала: 1 — никогда, 5 — в половине случаев, 10 — всегда. Проверялась гипотеза о том, что в результате тренинга самооценка конформизма (стремления быть как другие в группе) участников возрастет (α = 0,05). Составим таблицу для промежуточных вычислений (таблица 3).

Таблица 3

Среднее арифметической для разности Md = (-6)/8 = -0,75. Вычтем это значение из каждого d (предпоследний столбец таблицы).

Формула для стандартного отклонения отличается лишь тем, что вместо Х в ней фигурирует d. Подставляем все нужные значения, получаем:

σd = = 0,886.

Ш а г 1. Вычисляем эмпирическое значение критерия по формуле (3): средняя раз­ность Md = -0,75; стандартное отклонение σd = 0,886; tэ = 2,39; df = 7.

Шаг 2. Определяем по таблице критических значений критерия t-Стьюдента р-уровень значимости. Для df = 7 эмпирическое значение находится меж­ду критическими для р = 0,05 и р — 0,01. Следовательно, р < 0,05.

df Р
0,05 0,01 0,001
  2,365 3,499 5,408

Шаг 3. Принимаем статистическое решение и формулируем вывод. Статистичес­кая гипотеза о равенстве средних значений отклоняется. Вывод: показатель само­оценки конформизма участников после тренинга увеличился статистически досто­верно (на уровне значимости р < 0,05).

К параметрическим методам относится и сравнение дисперсий двух выборок по критерию F-Фишера. Иногда этот метод приводит к ценным содержатель­ным выводам, а в случае сравнения средних для независимых выборок срав­нение дисперсий является обязательной процедурой.

Для вычисления Fэмп нужно найти отношение дисперсий двух выборок, причем так, чтобы большая по величине дисперсия находилась бы в числителе, а меньшая знаменателе.

Сравнение дисперсий. Метод позволяет проверить гипотезу о том, что дисперсии двух генераль­ных совокупностей, из которых извлечены сравниваемые выборки, отлича­ются друг от друга. Проверяемая статистическая гипотеза Н0: σ12 = σ22 (дисперсия в выборке 1 равна дисперсии в выборке 2). При ее отклонении принимается альтернативная гипотеза о том, что одна дисперсия больше другой.

Исходные предположения: две выборки извлекаются случайно из разных ге­неральных совокупностей с нормальным распределением изучаемого признака.

Структура исходных данных: изучаемый признак измерен у объектов (ис­пытуемых), каждый из которых принадлежит к одной из двух сравниваемых выборок.

Ограничения: распределения признака и в той, и в другой выборке суще­ственно не отличаются от нормального.

Альтернатива методу: критерий Ливена (Levene'sTest), применение которого не требует проверки предположения о нормальности (используется в программе SPSS).

Формула для эмпирического значения критерия F-Фишера:

(4)

где σ12 большая дисперсия, a σ22— меньшая дисперсия. Так как заранее не известно, какая дисперсия больше, то для определения р-уровня применяется Таблица критических значений для ненаправленных альтернатив. Если Fэ > FKp для соответствующего числа степеней свободы, то р < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Пример расчета:

Детям давались обычные арифметические задания, после чего одной случайно выбранной половине учащихся сообщали, что они не выдержали испытания, а ос­тальным — обратное. Затем у каждого ребенка спрашивали, сколько секунд ему потребовалось бы для решения аналогичной задачи. Экспериментатор вычислял разность между называемым ребенком временем и результатом выполненного за­дания (в сек.). Ожидалось, что сообщение о неудаче вызовет некоторую неадекват­ность самооценки ребенка. Проверяемая гипотеза (на уровне α = 0,005) состояла в том, что дисперсия совокупности самооценок не зависит от сообщений об удаче или неудаче (Н0: σ1= σ22).

Были получены следующие данные:

 
 

 

Ш а г 1. Вычислим эмпирическое значение критерия и числа степеней свободы по формулам (4):

Шаг 2. По таблице критических значений критерия f-Фишера для ненаправлен­ных альтернатив находим критическое значение для dfчисл = 11; dfзнам = 11. Однако критическое значение есть только для dfчисл = 10 и dfзнам = 12. Боль­шее число степеней свободы брать нельзя, поэтому берем критическое значение для dfчисл = 10: Для р = 0,05 FKp = 3,526; для р = 0,01 FKp = 5,418.

Шаг 3. Принятие статистического решения и содержательный вывод. Поскольку эмпирическое значение превышает критическое значение для р = 0,01 (и тем бо­лее — для р = 0,05), то в данном случае р < 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (р < 0,01). Следователь­но, после сообщения о неудаче неадекватность самооценки выше, чем после сооб­щения об удаче.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: