Чтобы выяснить, влияет ли на относительную частоту расщепления не только тип динуклеотида (фактор A), но и какой вклад в общую изменчивость относительной частоты расщепления обусловлен последовательностью анализируемого участка рестриктного фрагмента ДНК (фактор B), будем использовать двухфакторный дисперсионный анализ. Уровни фактора A являются постоянными, а уровни фактора B естественно рассматривать как случайные. В этом случае для анализа результатов эксперимента используется смешанная двухфакторная модель. В качестве плана эксперимента рассмотрим двухфакторный план с группировкой (nested design) для смешанной модели. Это план, для которого уровни одного фактора A группируются по уровням другого фактора B. При этом каждый уровень фактора В группируется не более чем с одним уровнем фактора A, и фактор B называется сгруппированным фактором A, B (A). Такой план позволяет оценить и ошибки наблюдения, и вклад случайного фактора B (A) в общую изменчивость относительной частоты расщепления, и влияние постоянного фактора A на относительную частоту расщепления.
|
|
Для построения такого плана для каждого типа динуклеотида (постоянный фактор A с I уровнями) случайно выбирались «свои» J фрагментов ДНК (случайный фактор B с J уровнями). У каждого из J фрагментов для типа динуклеотида NN определяли значения частоты расщепления этого динуклеотида NN. В этом случае каждый уровень фактора B сочетался не более чем с одним уровнем фактора A.
Смешанная модель для двухфакторного плана с группировкой имеет вид
yijk = μ + αi + bj(i) + εijk, k =1,…, kij, i =1,…, I; j =1,…, J,
где μ – общее среднее, αi – эффект i -огоуровня постоянного фактора A, bj(i) – эффект j- огоуровня случайного фактора B, B (A), сгруппированного i -ым уровнем фактора A; – неизвестные параметры; εijk – ошибки наблюдений; bj(i) и εijk – независимые в совокупности случайные величины с нулевым средним и дисперсиями и , соответственно. Дисперсия наблюдения yijk будет равна . Компонента дисперсии обусловлена вкладом случайного фактора B (A), сгруппированного фактором A, в общую изменчивость зависимой переменной.
Было рассмотрено пять моделей такого типа, и построено пять планов с группировкой для каждой из них:
1. Для анализа частоты расщепления каждого из 16 динуклеотидов ДНК, NN; I =16; J =8.
2. Для анализа частоты расщепления каждого из динуклеотидов ДНК, AN; I =4; J =19.
3. Для анализа частоты расщепления каждого из динуклеотидов ДНК, СN; I =4; J =19.
4. Для анализа частоты расщепления каждого из динуклеотидов ДНК, GN; I =4; J =23.
5. Для анализа частоты расщепления каждого из динуклеотидов ДНК, TN; I =4; J =19.
Статистические задачи дисперсионного анализа для рассматриваемой модели состоят в том, чтобы найти оценки неизвестных параметров и проверить статистические гипотезы. Для такой модели проверяются две гипотезы:
|
|
Статистические задачи дисперсионного анализа для рассматриваемой модели состоят в том, чтобы найти оценки неизвестных параметров и проверить статистические гипотезы. Для такой модели проверяются две гипотезы:
1. H 0: все αi =0, i =1,..., I, что означает – фактор A не влияет, при альтернативе, что, по крайней мере, αk ≠0, что означает – фактор A влияет.
2. H 0: =0 о том, что фактор B (A) не вносит никакого вклада в дисперсию наблюдений, при альтернативе H 1: ≠0.
Необходимо отметить, что все построенные планы являются планами с неравным числом наблюдений при разных комбинациях уровней факторов A и B (A). Поэтому при определении значений числа степеней свободы, ν *, которые в таблицах не приводятся, оценок компонент дисперсии, значений MS, и, следовательно, наблюденного значения статистики критерия, F -отношения, использовался метод Саттервейта. В табл. 7 приведены значения оценок компонент дисперсии и оценка доли дисперсии наблюдения, которая обусловлена фактором B (A) для каждой из пяти рассматриваемых моделей. Оценка дисперсии единичного наблюдения, , определялась как сумма оценок компонент дисперсии и .
Таблица 2. Результаты дисперсионного анализа
для динуклотидов NN.
Источник разброса | Число степеней свободы ν | Средний квадрат MS | F -отношение | p - Значение |
фактор A | 2,41 | 24,82 | 0,00 | |
фактор B (A) | 0,09 | 2,21 | 0,00 | |
Остаток | 0,04 |
Анализ табл. 2 показывает, что влияние типа динуклеотида NN и первичной структуры фрагмента ДНК на относительную частоту ультразвукового расщепления статистически значимо на уровне α =0,05
Таблица 7. Значения оценок компонент дисперсии. Обозначения: / – оценка доли общей дисперсии, обусловленной фактором B (A); / – оценка доли дисперсии ошибки наблюдения.
Модель | / *100% | / *100% | |||
0,0038 | 0,0357 | 0.0395 | 9,6% | 90,4 | |
0,0034 | 0,0256 | 0,0290 | 11,7% | 88,3 | |
0,0096 | 0,0976 | 0,1072 | 9,8% | 90,2 | |
0,0050 | 0,0379 | 0,0429 | 11,6% | 88,4 | |
0,0011 | 0,0208 | 0,0219 | 5,0% | 95,0 |
Статистический анализ экспериментальных данных расщепления ДНК ультразвуком выявил влияние на относительную частоту расщепления двух факторов, типа динуклеотида и нуклеотидной последовательности фрагмента ДНК, и позволил оценить долю дисперсии наблюдения, которая обусловлена случайным фактором – нуклеотидной последовательностью фрагмента ДНК. Результаты анализа показали, что вклад случайного фактора в общую изменчивость относительной частоты расщепления, много меньше, чем вклад фактора – тип динуклеотида.