Продолжая тему исследования зависимостей, начатую в главе 6, рассмотрим задачу о действии на измеряемую величину (отклик) двух факторов. В этой задаче мы предполагаем, что на отклик могут влиять два фактора, каждый из которых принимает конечное число значений (уровней), и интересуемся тем, как влияют эти факторы на изучаемый отклик и влияют ли вообще. Такие задачи характерны как для промышленных и технологических экспериментов, так и для гуманитарных исследований. Остановимся более подробно на одном из распространенных случаев возникновения задач двухфакторного анализа.
Бывает, что в рамках однофакторной модели (см. гл. 6) влияние интересующего нас фактора не проявляется, хотя содержательные соображения указывают, что такое влияние должно быть. Иногда это влияние проявляется, но точность выводов о количественной стороне этого влияния недостаточна. Причиной такого явления может быть большой внутригрупповой разброс, на фоне которого действие фактора остается незаметным или почти незаметным. Очень часто этот разброс вызывается не только случайными причинами, но также действием еще одного фактора. Если мы в состоянии указать такой фактор, можно попытаться включить его в модель, чтобы уменьшить статистическую неоднородность наблюдений и благодаря этому выявить действие на отклик закономерных причин. Конечно, не всегда удается поправить дело введением одного «мешающего» фактора и переходом к двухфакторным схемам, как выше. Иногда приходится рассматривать и трех-, и многофакторные модели. Замысел во всех этих случаях остается прежним.
К задачам двухфакторного или многофакторного анализа часто приводят также исследования по оптимизации технологических процессов. При этом чаще всего заранее известно, что оба фактора оказывают значимое влияние на отклик, а исследователя интересует численная оценка этого влияния с целью выбора оптимального уровня факторов.
Иногда факторы разделяют на важные и мешающие, но это совсем не обязательно. В ряде задач факторы содержательно равноправны для экспериментатора. Эти нюансы мало влияют на статистические модели, они могут сказаться только на постановках статистических вопросов.
Таблица двухфакторного анализа
Рассмотрим, как изменяется таблица однофакторного анализа, приведенная в пункте 6. при включении в модель действия мешающего фактора.
Назовем главный фактор фактором А, а мешающий фактор — фактором В. Пусть фактор А принимает k, а фактор В — п различных значений. Фактор В разбивает все объекты наблюдения на п блоков, каждый блок образуют наблюдения, проведенные при одном уровне фактора В. В блоке отклики могут значимо различаться только за счет-применения к ним различных обработок, то есть за счет различных уровней фактора А. Уровни фактора А (обработки) отображаются в таблице по столбцам, а уровни фактора В (блоки) — по строкам. Традиционная терминология «блок-обработка» в применении к
Таблица 7.1
Обработки | ||||
Блоки | к | |||
1 2 п | in a?2i Хп1 | Ж12 Х22 Хп2 | Xlk Х2к Хпк |
факторам В и А сложилась как результат различного отношения к этим факторам, один из которых является мешающим, а другой определяющим.
Таблица 7.1, содержащая п х к наблюдений (по одному наблюдению в клетке) является основной таблицей двухфакторного анализа. Ее отличие от таблицы однофакторного анализа заключается в том, что наблюдения в любом столбце не являются однородными, то есть могут не образовывать выборки (если влияние мешающего фактора значимо). Для описания такой двухфакторной таблицы требуются более сложные вероятностные модели, чем для однофакторного анализа.