Приглашаем всех желающих посетить бесплатные пробные занятия по курсам МВА и профессиональной подготовки. Занятия проходят в реальных группах, никаких постановочных занятий. Ознакомиться с расписанием пробных занятий, выбрать заинтересовавшее и зарегистрироваться на него можно здесь
Выработка рекомендаций к бизнес-параметрам с целью увеличения дохода терминального бизнеса на основе анализа платежных транзакций средствами Data Mining
Лебедев В.В.
Выпускник группы ITM-21
Школа IT-менеджмента
РАНХиГС при Президенте РФ
Оплата услуг провайдеров через терминалы – ноу-хау российского бизнеса.
Стремительный рост количества терминалов в 2000-х годах, быстрая окупаемость (до 2-3 месяцев), рост доходности бизнеса.
Замедление темпов роста в 2010-12 годах из-за ужесточения законодательной базы, увеличения конкуренции в лице крупных банков и мелких региональных игроков
Один из векторов деятельности – попытка найти оптимальные, сбалансированные бизнес-параметры: введение тарифных планов для агентов в 2008-09 годах. Продолжение изысканий – углубленный анализ накопленной огромной базы данных по оплате услуг.
Data Mining как нельзя более лучше подходит для решения задачи выявления скрытых нетривиальных зависимостей в большом массиве сырых данных.
Цель работы – выявить закономерности бизнес-параметров платежных транзакций, которые позволят выработать набор правил и рекомендаций, направленных на повышение доходности бизнеса.
Задача работы – провести анализ платежных транзакций средствами Data Mining, найти зависимости и правила между базовыми параметрами платежной транзакции.
Выбор в качестве программного инструмента для анализа данных бесплатной среды Weka (http://www.cs.waikato.ac.nz/~ml/weka/).
Создание модели данных при помощи дерева решений (http://ru.wikipedia.org/wiki/Дерево_принятия_решений). Использование для построения дерева решений алгоритма Джона Квинлана C4.5 и его программную реализацию J48 в среде Weka.
Основная проблема – огромное количество исходных сырых данных. Из-за технических ограничений анализ был произведен только на ограниченном наборе предварительно агрегированных данных. Получение модели дерева решений.
Прогон полученной модели на данных других периодов.
Анализ полученных результатов, выводы.
Одна из интересных выявленных зависимостей – рост доходности с ростом нижней комиссии агента в определенных границах, при выходе за которые, доходность падает.
Для выявления более тонких зависимостей требуется проводить более тщательный анализ очень большого массива данных. Из-за ограничений вычислительных мощностей, выделенных для проведения эксперимента и недостатка времени провести детальный анализ не представилось возможным.
В ходе выполнения данной работы были получены навыки работы с инструментами Data Mining, детально исследованы некоторые алгоритмы анализа данных.
Показана практическая значимость использования возможностей Data Mining в современном бизнесе.
- Войдите на сайт для отправки комментариев