(III.12)
Дисперсионный анализ можно провести по следующему алгоритму: подсчитывают 1) итоги по столбцам
(III.13)
2) сумму квадратов всех наблюдений
(III.14)
3) сумму квадратов итогов по столбцам, деленную на число наблюдений в столбце,
(III.15)
4) квадрат общего итога, деленный на число всех наблюдений
(корректирующий член),
(III.16)
5) сумму квадратов для столбца
(III.17)
6) — общую сумму квадратов, равную разнице между суммой квадратов всех наблюдений и корректирующим членом,
(III.18)
7) — остаточную сумму квадратов для оценки ошибки эксперимента
(III.19)
8)дисперсию
(III.20)
9)дисперсию
(III.21)
Результаты расчета обычно представляются в виде таблицы дисперсионного анализа (табл. 6).
Таблица 6. Однофакторный дисперсионный анализ (с равным числом повторенийопытов)
Источник дисперсии | Число степеней свободы | Сумма квадратов | Средний квадрат | Математическое ожидание среднего квадрата |
A | ||||
Остаток | ||||
Общая сумма |
Если отношение , то влияние фактора А следует считать незначимым. При этом общая дисперсия связана только с фактором случайности и может служить оценкой для дисперсии воспроизводимости. Такая оценка лучше, чем (III.7), так как имеет большее число степеней свободы, равное . При интерпретации результатов дисперсионного анализа необходимо иметь в виду, что очень низкое значение дисперсионного отношения может быть связано с тем, что влияние какого-то важного неконтролируемого в ходе эксперимента фактора не было рандомизировано. Это может увеличить дисперсию внутри уровней, а дисперсию между уровнями оставить неизменной, что уменьшает дисперсионное отношение. Результаты экспериментов при этом не подчиняются модели (III. 1).
|
|
Если же справедливо неравенство (III. 12), различие между дисперсиями и значимо и, следовательно, значимо влияние фактора А. Определим оценку влияния фактора А из (III.11):
(III.22)
При этом нулевая гипотеза отвергается и различие между средними следует считать значимым. Для выяснения вопроса, какие именно средние различны, применяются критерии Стьюдента, Фишера или ранговый критерий Дункана (см. гл. 11.14).
При интерпретации результатов дисперсионного анализа для модели со случайными уровнями обычно интересуются не проверкой гипотез относительно средних, а оценкой компонент дисперсий. В отличие от модели с фиксированными уровнями выводы по случайной модели распространяются на всю генеральную совокупность уровней.
Рассмотрим схему вычислений для разного числа параллельных наблюдений. Пусть на уровне а, проведено и, параллельных наблюдений. Общее число всех наблюдений равно
Определим: 1) итоги по столбцам
|
|
(III.23)
2) суммы квадратов всех наблюдений
(III.24)
3) сумму квадратов итогов по столбцам, деленных на число наблюдений в соответствующем столбце,
(III.25)
4) квадрат общего итога, деленный на число всех наблюдений,
(III.26)
Дальнейшие расчеты проводятся по формулам (III.17)— (III.21). Если дисперсии и значимо отличаются друг от друга, дисперсию фактора А вычисляют по формуле
(III.27)
Пример1. Рассмотрим применение однофакторного дисперсионного анализа для выяснения влияния вида галоидного алкила (фактор А)на процесс радикальной полимеризации. Изучалось влияние на выход полимера пяти различных галогеналкилов: , , , , . Результаты эксперимента с различными галоидными алкилами (фиксированные уровни фактора А)приведены в таблице.
Номер наблюдений | Уровни фактора А | ||||
79,80 86,30 86,50 92,30 76,50 87,05 82,50 90,00 | 87,30 69,60 81,75 77,95 83,65 64,80 67,30 75,45 | 42,45 64,30 78,90 61,00 31,30 72,85 58,65 52,50 | 76,00 83,50 72,80 89,00 76,50 87,45 74,50 93,15 | 70,70 64,65 38,50 77,00 91,50 68,00 38,05 79,95 | |
Итоги |
Определим средние значения выхода для каждого галоидного алкила:
и общее среднее для всех результатов
Для облегчения вычислений будем вместо значений у рассматривать отклонения этих значений от величины, близкой к общему среднему всех результатов, равной 73 (см. таблицу).
Номер наблюдений | Уровни фактора А | ||||
6,8 13,3 13,5 19,3 3,5 14,05 9,5 17,0 | 14,3 -3,4 8,75 4,95 10,65 -8,2 -5,7 2,45 | -30,55 -8,7 5,9 -12,0 -41,7 -0,15 -14,35 -20,5 | 3,0 10,5 -0,2 16,0 3,5 14,45 1,5 20,15 | -2,3 -8,35 -34,5 4,0 18,5 -5,0 -34,95 6,95 | |
Итоги | 96,95 | 23,8 | -122,05 | 68,9 | -55,65 |
По данным таблицы проведем вычисления по формулам (III.14) — (III.21) в соответствии с вышеприведенной схемой. Результаты расчета представлены в таблице.
Номер наблюдений | Число степеней свободы | Сумма квадратов | Средний квадрат |
A Ошибка Общая сумма | 4084,5 5281,46 9365,96 | 150,9 |
Полученные в результате расчета дисперсии сравним по критерию Фишера:
По табл. 5 приложения находим . Так как , различие галогеналкилов следует признать значимым. Установив при помощи дисперсионного анализа тот факт, что средние значения выходов полимера в целом существенно различаются между собой, перейдем к сравнению влияния отдельных галогеналкилов. Проведем это сравнение по критерию Дункана (см. гл. II, 14) с доверительной вероятностью . Нормированная ошибка среднего равна
Расположим средние значения в порядке возрастания их величин и выпишем из табл. 7 приложения значимые ранги для и :
57,74 66,04 75,97 81,61 85,1
...... 2 3 4 5
Ранги, ...... 2,875 3,025 3,11 3,185
...... 12,5 13,2 13,52 13,09
- различие значимо
- различие значимо
- различие незначимо
- различие незначимо
- различие значимо
- различие значимо
- различие незначимо
- различие значимо
- различие незначимо
- различие незначимо
3. Двухфакторный дисперсионный анализ. Изучается влияние на процесс одновременно двух факторов А и В. Фактор А исследуется на уровнях . фактор В —на уровнях .Допустим, что при каждом сочетании уровней факторов А и В проводится n параллельных наблюдений (табл. 7).
Таблица 7. Данные для двухфакторного дисперсионного анализа с повторениями
B | A | Итоги | |||||
… | … | ||||||
… | … | ||||||
… | … | ||||||
… | … | ||||||
… | … | ||||||
… | … | ||||||
Итоги | … | … |
Общее число наблюдений равно . Результат наблюдения можно представить в виде следующей модели:
(III.28)
где —общее среднее; —эффект фактора А на i -муровне, ; —эффект фактора В на j -муровне, ; — эффект взаимодействия факторов.
Эффект взаимодействия представляет собой отклонение среднего по наблюдениям в (ij)-йсерии от суммы первых трех членов в модели (III.28), (q= 1,2,...,n) учитывает вариацию внутри сериинаблюдений (ошибка воспроизводимости). Будем полагать, как и прежде, что распределена нормально с нулевым математическим ожиданием и дисперсией . Если предположить, что между факторами нет взаимодействия, то можно принять линейную модель:
|
|
(III.29)
Эта модель обычно применяется при отсутствии параллельных наблюдений (табл. 8):
Таблица 8. Данные для двухфакторного дисперсионного анализа без повторений
B | A | Итоги | |||
. . . | . . . | . . . | . . . | . . . | |
Итоги |
Рассмотрим вначале линейную модель (III.29). Через и обозначим средние, соответственно, по столбцам и по строчкам:
(III.30)
(III.31)
через — среднее всех результатов:
(III.32)
Рассеяние в средних по столбцам относительно общего среднего не зависит от фактора В,так как все уровни фактора В усреднены. Это рассеяние связано с влиянием фактора А и случайного фактора. Так как дисперсия среднего (см. гл. II, 5) в т раз меньше дисперсии единичного измерения, имеем
(III.33)
В свою очередь, рассеяние в средних по строчкам не зависит от фактора А и связано с влиянием фактора В:
(III.34)
Равенства (III.33) и (III.34) позволяют оценить влияние факторов А и В,если известна оценка дисперсии . Чтобы оценить фактор случайности при отсутствии параллельных наблюдений, поступим следующим, образом. Найдем дисперсию наблюдений по i -му столбцу:
(III.35)
Эта дисперсия обусловлена влиянием фактора В и фактора случайности
Равенство станет более точным, если вместо использовать средневзвешенную дисперсию по всем столбцам:
(III.36)
Вычитая (III.35) из (III.34), получим
(III.37)
Отсюда
(III.38)
Обозначим полученную оценку (III.38) для дисперсии через . Число степеней свободы равно . Введем также следующие обозначения:
(III.39)
(III.40)
Величины и можно считать выборочными дисперсиями и степенями свободы соответственно. Проверяют нулевые гипотезы о незначимости влияния факторов А и В по критерию Фишера. Если дисперсионное отношение
(III.41)