References

moitvivt

Моделирование, оптимизация и информационные технологии

Modeling, Optimization and Information Technology

2310-6018

Издательство

10.26102/2310-6018/2025.49.2.035

1900

Анализ поведения клиентов и выбор маркетинговых стратегий на основе обучения с подкреплением

Analyzing customer behavior and choosing marketing strategies based on reinforcement learning

Прохорова

Ольга Константиновна

Prokhorova

Olga Konstantinovna

roza_pochta@list.ru aff-1

Петрова

Елена Сергеевна

Петрова

Елена Сергеевна

lenoks.sokolova@mail.ru aff-2

Воронежский институт высоких технологий Voronezh Institute of High Technologies

Воронежский государственный технический университет Voronezh state technical University

01 01 2026

1 1

10.26102/2310-6018/2025.49.2.035

2026

This work is licensed under a Creative Commons Attribution 4.0 International License

В условиях современного конкурентного рынка компании сталкиваются с задачей выбора оптимальных маркетинговых стратегий, которые максимизируют вовлеченность клиентов, их удержание и доходы. Традиционные методы, такие как подходы на основе правил или A/B-тестирование, часто оказываются недостаточно гибкими для адаптации к динамичному поведению клиентов и долгосрочным трендам. Обучение с подкреплением (Reinforcement Learning, RL) предлагает перспективное решение, позволяя принимать адаптивные решения через непрерывное взаимодействие с окружающей средой. В статье исследуется применение RL в маркетинге, демонстрируется, как данные о клиентах – такие как история покупок, взаимодействие с кампаниями, демографические характеристики и показатели лояльности – могут быть использованы для обучения RL-агента. Агент учится выбирать персонализированные маркетинговые действия, например, отправку скидок или индивидуальных предложений с целью максимизировать такие показатели, как увеличение дохода или снижение оттока клиентов. Статья предоставляет пошаговое руководство по реализации маркетинговой стратегии на основе RL с использованием MATLAB. Рассматриваются создание пользовательской среды, проектирование RL-агента и процесс обучения, а также практические рекомендации по интерпретации решений агента. С помощью симуляции взаимодействий с клиентами и оценки производительности агента мы демонстрируем потенциал RL для трансформации маркетинговых стратегий. Цель работы – сократить разрыв между передовыми методами машинного обучения и их практическим применением в маркетинге, предложив дорожную карту для компаний, стремящихся использовать возможности RL для принятия решений.

In today's competitive market, companies face the challenge of choosing optimal marketing strategies that maximize customer engagement, retention, and revenue. Traditional methods such as rule-based approaches or A/B testing are often not flexible enough to adapt to dynamic customer behavior and long-term trends. Reinforcement Learning (RL) offers a promising solution, allowing you to make adaptive decisions through continuous interaction with the environment. This article explores the use of RL in marketing, demonstrating how customer data – such as purchase history, campaign interactions, demographic characteristics, and loyalty metrics – can be used to train an RL agent. The agent learns to choose personalized marketing actions, such as sending discounts or customized offers, in order to maximize metrics such as increased revenue or reduced customer churn. The article provides a step-by-step guide to implementing an RL-based marketing strategy using MATLAB. The creation of a user environment, the design of an RL agent and the learning process are considered, as well as practical recommendations for interpreting agent decisions. By simulating customer interactions and evaluating agent performance, we demonstrate the potential of RL to transform marketing strategies. The aim of the work is to bridge the gap between advanced machine learning methods and their practical application in marketing by offering a roadmap for companies seeking to use the capabilities of RL for decision making.

обучение с подкреплением поведение клиентов маркетинговые стратегии состояние среды действия агента награда агента

reinforcement learning customer behavior marketing strategies state of the environment agent actions agent reward

Исследование выполнено без спонсорской поддержки.

The study was performed without external funding.

References 1

Саттон Р.С., Барто Э.Дж. Обучение с подкреплением: введение. Москва: ДМК Пресс; 2020. 552 c.

Zhang Yu., Bai Yu, Jiang N. Offline Learning in Markov Games with General Function Approximation. arXiv. URL: https://arxiv.org/abs/2302.02571v1 [Accessed 12th March 2025].

Zhu Ch., Dastani M., Wang Sh. A Survey of Multi-Agent Deep Reinforcement Learning with Communication. Autonomous Agents and Multi-Agent Systems. 2024;38(1). https://doi.org/10.1007/s10458-023-09633-6

Garrabé É., Russo G. Probabilistic Design of Optimal Sequential Decision-Making Algorithms in Learning and Control. Annual Reviews in Control. 2022;54:81–102. https://doi.org/10.1016/j.arcontrol.2022.09.003

Albrecht S.V., Christianos F., Schäfer L. Multi-Agent Reinforcement Learning: Foundations and Modern Approaches. Cambridge: The MIT Press; 2024. 366 p.

Соколова Е.С. Мультиагентный подход к моделированию межмодульных взаимодействий в стохастических сетевых распределённых системах. Системы управления и информационные технологии. 2020;(1):67–71.

Hu J., Wellman M.P. Multiagent Reinforcement Learning in Stochastic Games. CiteSeerX. URL: https://citeseerx.ist.psu.edu/document?repid=rep1&type=pdf&doi=7ce14dbb9add4d9656746703babd00d8f765b22a [Accessed 18th March 2025].

Littman M.L., Szepesvári C. A Generalized Reinforcement-Learning Model: Convergence and Applications. In: Proceedings of the 13th International Conference on Machine Learning (ICML '96), 03–06 July 1996, Bari, Italy. Morgan Kaufmann; 1996. P. 310–318.

Hu J., Wellman M.P. Multiagent Reinforcement Learning: Theoretical Framework and an Algorithm. In: Proceedings of the Fifteenth International Conference on Machine Learning (ICML 1998), 24–27 July 1998, Madison, Wisconsin, USA. Morgan Kaufmann; 1998. P. 242–250.

Sychrovský D., Solinas Ch., MacQueen R., et al. Approximating Nash Equilibria in General-Sum Games via Meta-Learning. arXiv. URL: https://arxiv.org/abs/2504.18868 [Accessed 18th March 2025].

Schwartz H.M. Multi-Agent Machine Learning: A Reinforcement Approach. John Wiley & Sons, Inc.; 2014. 256 p.

The authors declare that there are no conflicts of interest present.