X | Y | Итого | |
a | b | a+b | |
c | d | c+d | |
Итого | a+c | b+d | a+b+c+d |
Все известные коэффициенты связи для четырехклеточных таблиц основаны на сравнении произведений ad и bc. Если эти произведения близки друг к другу, то полагаем, что связи нет. Если они совсем не похожи – связь есть. Коэффициент ассоциации Юла:
и коэффициент контингенции
Коротко рассмотрим их основные свойства.
Оба коэффициента изменяются в интервале от -1 до +1 (значит, для них имеет смысл направленность связи; о том, что это такое в данном случае, пойдет речь ниже). Обращаются в нуль в случае отсутствия статистической зависимости, о котором мы говорили выше (независимость признаков связана с пропорциональностью столбцов таблицы сопряженности).
). Строгое определение положительной и отрицательной связи можно дать с помощью введения понятия отношения преобладаний [Rudas,1998]:
или, в общем случае (обозначения – как в таблице 14):
Если отношение преобладания больше единицы, то связь называется положительной, если меньше единицы – то отрицательной. (Отношение преобладания обобщается на многомерный случай, о чем коротко пойдет речь в п. 2.3.5.).
|
|
И еще об одном очень важном моменте необходимо сказать. Если мы, используя обозначения 0 и 1 для значений наших признаков, будем интерпретировать эти обозначения как настоящие числа, то, как нетрудно проверить, вычисленный по обычным правилам коэффициент корреляции между признаками окажется равным Ф