По данным компании Gartner, неструктурированные документы составляют более 80% корпоративных данных, а количество внешних источников (интернет-ресурсов, блогов, форумов, СМИ) исчисляется миллионами. В них содержится гигантское количество данных, которые могут обеспечить компании существенное конкурентное преимущество. Основной вопрос — эффективность и скорость извлечения и анализа ценной информации.
Data Mining - "добыча" или "раскопка данных". Data Mining предназначены для решения задач интеллектуального анализа данных, что позволяет повысить эффективность принятия решений.
Data Mining - это процесс обнаружения в сырых данных:
1) ранее неизвестных и нетривиальных
2) практически полезных и доступных интерпретации знаний,
3) необходимых для принятия решений в различных сферах человеческой деятельности.
На рис. 28 представлены уровни знаний, извлекаемых из данных.
Рис. 28 Уровни знаний, извлекаемых из данных
Data Mining – это технология анализа информации с целью нахождения в уже накопленных предприятием данных ранее неизвестных, но практически полезных знаний, необходимых для принятия решений в различных областях человеческой деятельности.
|
|
Это процесс нахождения скрытых закономерностей в существующих данных.
Знания должны описывать новые связи между свойствами, предсказывать значения одних признаков на основе других.
Интеллектуальный анализ данных или «добыча данных» (Data Mining) позволяет проводить глубокие исследования данных, включающие:
· выявление скрытых зависимостей между данными
· выявление устойчивых бизнес-групп
· прогнозирование поведения бизнес-показателей
· оценку влияния решений на бизнес компании
· поиск аномалий и пр.