Дискриминантный анализ

Основная цель - используется для принятия решения о том, ка­кие переменные различают (дискриминируют) две или более возни­кающие совокупности (группы).

Пример:

1) Исследование в области образования - какие переменные относят выпускника средней школы к одной из трех категорий:

(1) поступающий в колледж;

(2) поступающий в профессиональную школу;

- (3) отказывающийся от дальнейшего образования.

Собираются данные о различных переменных, связанных с учащимися школы.

В начале осени учащиеся естественно должны попасть в одну из названных категорий.

Результаты Дискриминантного анализа можно использовать для определения того, какие переменные дают наилучшее предсказание выбора учащимися дальнейшего пути.

2) Медик может регистрировать различные переменные, относящиеся к состоянию больного, чтобы выяснить, какие переменные лучше предсказывают, что пациент:

выздоровел полностью (группа 1);

частично (группа 2);

- не выздоровел (группа 3).

Основная идея (Д.А.) - определить, отличаются ли совокупности по среднему какой-либо переменной, а затем использовать эту переменную, чтобы предсказать для новых членов их принадлежность к той или иной группе.

Вычислительный подход

Дисперсионный анализ.

1) Задача о функции дискриминации может быть перефразирована как задача одновходового дисперсионного анализа (АNOVА): являются ли две или более совокупности значимо отличающимися одна от другой по среднему значению какой-либо конкретной переменной (если среднее значение определенной переменной значимо различно для двух совокупностей, то можно сказать, что переменная разделяет данные совокупности).

Многомерные переменные: обычно имеются несколько переменных, и задача состоит в том, чтобы установить, какие из переменных вносят свой вклад в дискриминацию между совокупностями.

2) В этом случае будем иметь матрицу общих дисперсий и внут-ригрупповых дисперсий. Для того, чтобы определить, имеются ли значимые различия между группами (с точки зрения всех переменных) применяется процедура Многомерного дисперсионного анализа (МАNOVА): в случае обнаружения статистической значимости, выясняем - какие из переменных имеют значимо различные средние для каждой из совокупностей.

Основное правило - если производится дискриминация между совокупностями, то должно быть заметно различие между средними.

Построение модели

Наиболее общее применение дискриминантного анализа включение в исследование многих переменных с целью определения тех из них, которые наилучшим образом разделяют совокупности между собой.

Модель: - хотим построить "модель", позволяющую лучше всего предсказать, к какой совокупности будет принадлежать тот или иной элемент (объект).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: