Анализ главных компонент является методом сокращения или редукции данных, т.е. методом сокращения числа переменных.
Отметим, что в процессе последовательного выделения факторов они включают в себя все меньше и меньше изменчивости.
Решение о том, когда следует остановить процедуру выделения факторов, главным образом зависит от точки зрения на то, что считать малой "случайной" изменчивостью. Это решение достаточно произвольно, однако имеются некоторые рекомендации, позволяющие рационально выбрать число факторов.
Лабораторный пример: (7респондентов отвечают на 6 вопросов) Как только получена информация о том, сколько дисперсии выделил каждый фактор, вы можете возвратиться к вопросу о том, сколько факторов следует оставить.
1. Критерий Кайзера. Сначала вы можете отобрать только факторы, со значениями вклада, большими 1. По существу, это означает, что если фактор не выделяет дисперсию, эквивалентную, по крайней мере, дисперсии одной переменной, то он опускается. Этот критерий предложен Кайзером (Ка(зег, 1960), и является, вероятно, наиболее широко используемым. В приведенном выше примере на основе этого критерия вам следует сохранить только 2 фактора (две главные компоненты).
2. Критерий каменистой осыпи -
является графическим методом, впервые предложенным Кэттелем (Саttel, 1966). Вы можете изобразить собственные значения, представленные в таблице ранее, в виде простого графика.
Кэттель предложил найти такое место на графике, где убывание собственных значений слева направо
максимально замедляется. В соответствии с этим критерием можно оставить в этом примере 2 или 3 фактора.
Вопрос о группировке вопросов-переменных в факторы решается далее на основе соответствующей таблицы или графика.