1. Используя файл о кредитных историях, собранный в банке - loans.txt, построить классификатор на основе
а) логистической регрессии;
б) деревьев решений
в программе Deductor. Сравнить полученные модели и оценить их качество.
2. Выбрать два из методов классификации:
- дискриминантный анализ;
- логистическая регрессия;
- дерево решений (только функциями MatLab);
- k-ближайших соседей
и составить программу в MatLab. Построить модель классификации на данных, приведенных ниже в заданиях 2.1 и 2.2.
3. Сравнить результаты с результатами, полученными с помощью функций MatLab.
4. Проверить качество классификации методом кросс-валидации.
5. Сравнить результаты с классификацией на основе нейронной сети.
Задание 2.1. Главным управлением экономического развития области был проведен выборочный анализ финансового состояния хозяйствующих субъектов, в результате которого получены три группы промышленных предприятий: нормально функционирующие, нуждающиеся в финансовой поддержке и предприятия, которые находятся в состоянии банкротства. Выводы относительно конкретного предприятия делались на основе анализа коэффициента рентабельности (), коэффициента текущей ликвидности (), коэффициента обеспеченности собственными средствами () и коэффициента утраты (восстановления) платежеспособности ().
|
|
Таблица 2.7 - Результаты выборочного анализа финансового состояния хозяйствующих субъектов, действующих на територии области
Наименование предприятий | |||||
- 1 - | - 2 - | - 3 - | -4 - | - 5 - | |
Группа нормально функционирующих предприятий | |||||
Г.П. «Медтехника» | 8,09 | 1,30 | 0,23 | 1,13 | |
Завод «Гамма» | 8,09 | 1,56 | 2,36 | 1,48 | |
ОАО «Искра» | 23,17 | 17,76 | 0,85 | 17,46 | |
ОАО «Автозапчасти» | 2,10 | 28,78 | 0,97 | 31,02 | |
ОАО «Видеофон» | 4,48 | 1,18 | 0,15 | 1,04 | |
ЗАО «Гидрогаз» | 7,32 | 1,28 | 0,23 | 1,19 | |
ЗАО «Агропродукт» | 12,00 | 1,89 | 0,47 | 1,79 | |
ОАО «Машоборудование» | 4,45 | 7,52 | 0,87 | 7,42 | |
Дорожные электромеханические мастерские | 2,79 | 2,00 | 0,50 | 1,69 | |
ОАО «Преобразователь» | 1.32 | 10,02 | 0,24 | 9,46 | |
Группа предприятий, нуждающихся в финансовой поддержке | |||||
Завод «Радиоприбор» | 0,52 | 0,95 | -0,033 | 0,97 | |
Производственно-коммерческая фирма «Флаттер» | 2,84 | 0,98 | -0,02 | 0,81 | |
ОАО «Судоремонтный завод» | -84,86 | 2,02 | 0,50 | 1,99 | |
ОАО «Автодор» | 34,8 | 9,82 | -0,22 | 0,68 | |
ОАО «Рембыттехника» | 8,42 | 1,09 | 0,08 | 0,96 | |
Группа предприятий, которые находятся в состоянии банкротства | |||||
ОАО «Втормет» | -2,13 | 0,73 | -0,36 | 0,59 | |
- 1 - | - 2 - | - 3 - | -4 - | - 5 - | |
ОАО «Вэлт» | -321,06 | 0,64 | -1,02 | 0,72 | |
ОАО «ЗПП» | -48,53 | 0,97 | -0,03 | 0,96 | |
ОАО «Тяжэкс» | -356,24 | 0,32 | -2,16 | 0,37 | |
ОАО «ЗСАК» | -41,47 | 0,92 | -0,09 | 0,51 | |
Требуется, используя приведенные данные как обучающую выборку, построить модель классификации на основе одного из методов, рассмотренных выше, а затем установить принадлежность следующих предприятий к одному из трех классов, определив тем самым его финансовое состояние.
|
|
Таблица 2.8 - Показатели финансового состояния классифицируемых хозяйствующих субъектов
Наименование предприятий | ||||
ЗАО «ЭПП-микрон» | -5,17 | 2,97 | -0,36 | 3,15 |
ОАО Молочный комбинат | 27,8 | 19,11 | 2,6 | 16,48 |
ООО Продовольственная компания | 0,33 | 0,79 | -0,61 | 0,51 |
ОАО «Фруктовые воды» | -9,19 | -0,1 | 0,19 | 0,51 |
Задание 2.2. При оценке эффективности деятельности предприятий легкой промышленности были получены два класса предприятия: с высокой и низкой производительностью труда. Кроме того, были выявлены факторы, определяющие соответствующий уровень производительности труда: 1) Доля рабочих, занятых вручную не при машинах и механизмах % (); 2) Процент текучести кадров (); 3) Коэффициент сменности по всем рабочим ();
4) Доля профильной продукции в общем объеме продукции ();
5) Электровооруженность, кВт (); В последней колонке приведено Модельное значение выработки, тыс.грн. (табл. 2.9). Опираясь на полученные результаты: 1) проанализируйте резервы роста производительности труда в группе худших предприятий;
2) проведите классификацию предприятий, представленных в табл. 2.10.
Таблица 2.9 - Классификация предприятий по уровню производительности труда
Пред-прия-тие | Факторы | значение выработки, тыс.грн. | ||||
Группа предприятий с высокой производительностью труда | ||||||
34,1 | 1,47 | 93,4 | 21,3 | 69,75 | ||
33,7 | 1,29 | 91,7 | 32,2 | 63,89 | ||
23,6 | 1,17 | 95,3 | 27,8 | 60,64 | ||
29,6 | 1,47 | 95,3 | 22,6 | 81,62 | ||
25,3 | 1,44 | 96,3 | 21,9 | 81,02 | ||
17,9 | 1,52 | 91,1 | 27,8 | 62,53 | ||
29,3 | 1,62 | 94,5 | 23,5 | 83,55 | ||
Группа предприятий с низкой производительностью труда | ||||||
38,4 | 1,36 | 96,4 | 15,5 | 61,68 | ||
37,5 | 1,44 | 95,2 | 12,3 | 54,86 | ||
32,2 | 1,29 | 96,1 | 16,4 | 54,71 | ||
26,1 | 1,46 | 92,3 | 11,4 | 55,90 | ||
30,7 | 1,57 | 92,9 | 23,4 | 51,34 | ||
28,7 | 1,47 | 85,2 | 22,7 | 41,14 |
Таблица 2.10 - Характеристики предприятий, подлежащих классификации
Предпри-ятие | Факторы | ||||
31,5 | 1,76 | 92,7 | 18,4 | ||
31,2 | 1,37 | 94,6 | 17,9 | ||
19,7 | 1,52 | 96,2 | 27,1 | ||
28,7 | 1,56 | 92,2 | 27,8 |
Контрольные вопросы
1. В чем состоит задача классификации?
2. Какие данные нужно иметь для построения модели классификации?
3. Какие методы классификации вам известны и каковы особенности их использования?
4. Как оценивают качество полученной модели классификации?
5. Запишите модель логистической регрессии и опишите алгоритм оценки параметров логистической регрессии.
6. Как кодируют категориальные переменные при решении задачи классификации?
7. В чем состоит метод опорных векторов?
8. Опишите алгоритм построения дискриминантной функции.
9. На основании каких критериев выбирают переменную для ветвления при построении деревьев решений?
10. Какие методы сокращения дерева решений и остановки построения дерева вы знаете?