Задания к лабораторной работе. 1. Используя файл о кредитных историях, собранный в банке - loans.txt, построить классификатор на основе

1. Используя файл о кредитных историях, собранный в банке - loans.txt, построить классификатор на основе

а) логистической регрессии;

б) деревьев решений

в программе Deductor. Сравнить полученные модели и оценить их качество.

2. Выбрать два из методов классификации:

- дискриминантный анализ;

- логистическая регрессия;

- дерево решений (только функциями MatLab);

- k-ближайших соседей

и составить программу в MatLab. Построить модель классификации на данных, приведенных ниже в заданиях 2.1 и 2.2.

3. Сравнить результаты с результатами, полученными с помощью функций MatLab.

4. Проверить качество классификации методом кросс-валидации.

5. Сравнить результаты с классификацией на основе нейронной сети.

Задание 2.1. Главным управлением экономического развития области был проведен выборочный анализ финансового состояния хозяйствующих субъектов, в результате которого получены три группы промышленных предприятий: нормально функционирующие, нуждающиеся в финансовой поддержке и предприятия, которые находятся в состоянии банкротства. Выводы относительно конкретного предприятия делались на основе анализа коэффициента рентабельности (), коэффициента текущей ликвидности (), коэффициента обеспеченности собственными средствами () и коэффициента утраты (восстановления) платежеспособности ().

Таблица 2.7 - Результаты выборочного анализа финансового состояния хозяйствующих субъектов, действующих на територии области

Наименование предприятий
- 1 - - 2 - - 3 - -4 - - 5 -
Группа нормально функционирующих предприятий
Г.П. «Медтехника» 8,09 1,30 0,23 1,13
Завод «Гамма» 8,09 1,56 2,36 1,48
ОАО «Искра» 23,17 17,76 0,85 17,46
ОАО «Автозапчасти» 2,10 28,78 0,97 31,02
ОАО «Видеофон» 4,48 1,18 0,15 1,04
ЗАО «Гидрогаз» 7,32 1,28 0,23 1,19
ЗАО «Агропродукт» 12,00 1,89 0,47 1,79
ОАО «Машоборудование» 4,45 7,52 0,87 7,42
Дорожные электромеханические мастерские 2,79 2,00 0,50 1,69
ОАО «Преобразователь» 1.32 10,02 0,24 9,46
Группа предприятий, нуждающихся в финансовой поддержке
Завод «Радиоприбор» 0,52 0,95 -0,033 0,97
Производственно-коммерческая фирма «Флаттер» 2,84 0,98 -0,02 0,81
ОАО «Судоремонтный завод» -84,86 2,02 0,50 1,99
ОАО «Автодор» 34,8 9,82 -0,22 0,68
ОАО «Рембыттехника» 8,42 1,09 0,08 0,96
Группа предприятий, которые находятся в состоянии банкротства
ОАО «Втормет» -2,13 0,73 -0,36 0,59
- 1 - - 2 - - 3 - -4 - - 5 -
ОАО «Вэлт» -321,06 0,64 -1,02 0,72
ОАО «ЗПП» -48,53 0,97 -0,03 0,96
ОАО «Тяжэкс» -356,24 0,32 -2,16 0,37
ОАО «ЗСАК» -41,47 0,92 -0,09 0,51
           

Требуется, используя приведенные данные как обучающую выборку, построить модель классификации на основе одного из методов, рассмотренных выше, а затем установить принадлежность следующих предприятий к одному из трех классов, определив тем самым его финансовое состояние.

Таблица 2.8 - Показатели финансового состояния классифицируемых хозяйствующих субъектов

Наименование предприятий
ЗАО «ЭПП-микрон» -5,17 2,97 -0,36 3,15
ОАО Молочный комбинат 27,8 19,11 2,6 16,48
ООО Продовольственная компания 0,33 0,79 -0,61 0,51
ОАО «Фруктовые воды» -9,19 -0,1 0,19 0,51

Задание 2.2. При оценке эффективности деятельности предприятий легкой промышленности были получены два класса предприятия: с высокой и низкой производительностью труда. Кроме того, были выявлены факторы, определяющие соответствующий уровень производительности труда: 1) Доля рабочих, занятых вручную не при машинах и механизмах % (); 2) Процент текучести кадров (); 3) Коэффициент сменности по всем рабочим ();
4) Доля профильной продукции в общем объеме продукции ();
5) Электровооруженность, кВт (); В последней колонке приведено Модельное значение выработки, тыс.грн. (табл. 2.9). Опираясь на полученные результаты: 1) проанализируйте резервы роста производительности труда в группе худших предприятий;
2) проведите классификацию предприятий, представленных в табл. 2.10.

Таблица 2.9 - Классификация предприятий по уровню производительности труда

Пред-прия-тие Факторы значение выработки, тыс.грн.
Группа предприятий с высокой производительностью труда
  34,1   1,47 93,4 21,3 69,75
  33,7   1,29 91,7 32,2 63,89
  23,6   1,17 95,3 27,8 60,64
  29,6   1,47 95,3 22,6 81,62
  25,3   1,44 96,3 21,9 81,02
  17,9   1,52 91,1 27,8 62,53
  29,3   1,62 94,5 23,5 83,55
Группа предприятий с низкой производительностью труда
  38,4   1,36 96,4 15,5 61,68
  37,5   1,44 95,2 12,3 54,86
  32,2   1,29 96,1 16,4 54,71
  26,1   1,46 92,3 11,4 55,90
  30,7   1,57 92,9 23,4 51,34
  28,7   1,47 85,2 22,7 41,14

Таблица 2.10 - Характеристики предприятий, подлежащих классификации

Предпри-ятие Факторы
  31,5   1,76 92,7 18,4
  31,2   1,37 94,6 17,9
  19,7   1,52 96,2 27,1
  28,7   1,56 92,2 27,8

Контрольные вопросы

1. В чем состоит задача классификации?

2. Какие данные нужно иметь для построения модели классификации?

3. Какие методы классификации вам известны и каковы особенности их использования?

4. Как оценивают качество полученной модели классификации?

5. Запишите модель логистической регрессии и опишите алгоритм оценки параметров логистической регрессии.

6. Как кодируют категориальные переменные при решении задачи классификации?

7. В чем состоит метод опорных векторов?

8. Опишите алгоритм построения дискриминантной функции.

9. На основании каких критериев выбирают переменную для ветвления при построении деревьев решений?

10. Какие методы сокращения дерева решений и остановки построения дерева вы знаете?



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: