Создание ассоциативных правил для анализа покупательских корзин для стимулирования спроса

Розничная сеть по продаже бытовой химии поставила задачу анализа покупательских корзин для оптимизации их размещения на витринах и проведения кросс-продаж. Отдел маркетинга предоставил 5 000 чеков,


в которых отражены покупки, сделанные предыдущими клиентами магазинов. Стоят следующие задачи:

– предсказать, какие товары покупатели могут выбрать в зависимости от того, что уже есть в их корзинах;

– выявить наиболее популярные товарные наборы, состоящие из более чем 1 предмета;

– предложить рекламные акции типа «Каждому купившему A и B

товар C в подарок».

1) Импортируйте в новый проект файл Чеки.txt.

Поле ID (идентификатор транзакции) – это номер чека или код клиента.

А поле ITEM (элемент транзакции) – это наименование товара в чеке.

Оба поля (идентификатор и элемент транзакции) должны быть дискретного вида.

2) К узлу импорта добавим обработчик Ассоциативные правила. Столбец ID сделаем идентификатором транзакции, а ITEM – ее элементом (рис. 9.1)

Рисунок 9.1 – Назначение исходных столбцов данных

3) Настроить параметры построения ассоциативных правил (параметры алгоритма a priori) (рис. 9.2).


Рисунок 9.2 – Настройка параметров построения ассоциативных правил

Здесь для изменения доступны следующие параметры:

Минимальная и максимальная поддержка в % – ограничивают пространство поиска часто встречающихся предметных наборов. Эти границы определяют множество популярных наборов, из которых и будут создаваться ассоциативные правила;

Минимальная и максимальная достоверность в % – в результирующий набор попадут только те ассоциативные правила, которые удовлетворяют условиям минимальной и максимальной достоверности;

Максимальная мощность искомых часто встречающихся множеств – параметр ограничивает длину k-предметного набора. Например, при установке значения 4 шаг генерации популярных наборов будет остановлен после получения множества 4-предметных наборов. В конечном итоге это позволяет избежать появления длинных ассоциативных правил, которые трудно интерпретируются.

Пока оставим все настройки на данной вкладке по умолчанию.

Нажатие на кнопку Пуск приведет к работе алгоритма поиска ассоциативных правил. По окончании его работы справа в полях появится следующая информация (рис. 9.3):

Количество множеств – число популярных наборов, удовлетворяющих заданным условиям минимальной поддержки и достоверности;

Количество правил – число сгенерированных ассоциативных правил.


Рисунок 9.3 – Результат алгоритма a priori

4) Далее выбираем все доступные специализированные визуализаторы (Правила, Популярные наборы, Дерево правил, Что-если) и визуализатор Таблица.

Все эти визуализаторы, кроме Что-если, отображают результаты работы алгоритма в различных формах.

5) На вкладке Популярные наборы, как следует из названия, отображается множество найденных популярных предметных наборов в виде списка.

Кнопка предлагает на выбор несколько вариантов сортировки списка, а кнопка вызывает окно настройки фильтра множеств.

Например, задав в фильтре минимальное значение поддержки 6 % и

отсортировав их по убыванию поддержки, получим следующие

16 популярных наборов. Параметр Мощность указывает на количество товаров в одном наборе (рис. 9.4).

6) На вкладке Дерево правил предлагается еще один удобный способ отображения множества ассоциативных правил, которое строится либо по условию, либо по следствию. При построении дерева правил по условию, на первом (верхнем) уровне находятся узлы с условиями, а на втором уровне – узлы со следствием. В дереве, построенном по следствию, наоборот, на первом уровне располагаются узлы со следствием.


Рисунок 9.4 – Использование фильтра минимальной поддержки

Справа от дерева расположен список правил, построенный по выбранному узлу дерева (рис. 9.5).

Рисунок 9.5 – Список правил выбранного узла

Для каждого правила отображаются поддержка, достоверность и лифт. Если дерево построено по условию, то вверху списка отображается условие правила, а список состоит из его следствий. Тогда правила отвечают на


вопрос, что будет при таком условии. Если же дерево построено по следствию, то вверху списка отображается следствие правила, а список состоит из его условий.

Эти правила отвечают на вопросы, что нужно, чтобы было заданное следствие или какие товары нужно продать для того, чтобы продать товар из следствия.

7) На вкладке Правила помимо самих ассоциативных правил приводятся их основные расчетные характеристики: поддержка, достоверность и лифт. На рисунке показаны ассоциативные правила, отсортированные по убыванию лифта (рис. 9.6).

Рисунок 9.6 – Сортировка ассоциативных правил по убыванию лифта

Поэкспериментируйте с настройкой фильтра в визуализаторах Правила, Популярные наборы и Дерево правил.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: