References

moitvivt

Моделирование, оптимизация и информационные технологии

Modeling, Optimization and Information Technology

2310-6018

Издательство

10.26102/2310-6018/2025.50.3.001

1901

Интерпретируемое обучение с подкреплением для оптимизации операционной эффективности образовательных платформ в условиях цифровой трансформации

Interpreted reinforcement learning to optimize the operational efficiency of enterprises in the context of digital transformation

Прохорова

Ольга Константиновна

Prokhorova

Olga Konstantinovna

roza_pochta@list.ru aff-1

Петрова

Елена Сергеевна

Petrova

Elena Sergeevna

lenoks.sokolova@mail.ru aff-2

Воронежский институт высоких технологий Voronezh Institute of High Technologies

Воронежский государственный технический университет Voronezh State Technical University

01 01 2026

1 1

10.26102/2310-6018/2025.50.3.001

2026

This work is licensed under a Creative Commons Attribution 4.0 International License

В условиях цифровой трансформации образования MOOC-платформы сталкиваются с необходимостью оптимизации операционных процессов при сохранении качества обучения. Традиционные подходы к управлению ресурсами часто не учитывают сложные временные паттерны поведения пользователей и индивидуальные особенности обучения. В работе предлагается решение на основе интерпретируемого обучения с подкреплением (RL), интегрированного с методом Shapley Value для анализа вклада факторов. Исследование демонстрирует, как данные о времени активности, идентификаторах пользователей, целях обучения и других параметрах могут быть использованы для обучения RL-агента, способного оптимизировать распределение ресурсов платформы. Разработанный подход позволяет: количественно оценивать вклад каждого фактора в операционную эффективность; выявлять скрытые временные закономерности активности пользователей; персонализировать управление нагрузкой в пиковые периоды. Статья содержит математическое обоснование метода, практическую реализацию в MATLAB, а также результаты апробации, показавшие снижение операционных затрат при одновременном повышении удовлетворенности пользователей. Особое внимание уделяется интерпретируемости решений RL-агента, что критически важно для образовательной сферы. Работа предоставляет готовую методологию для внедрения интеллектуальных систем управления в цифровом образовании, сочетая теоретические разработки с практическими рекомендациями по реализации. Результаты исследования открывают новые возможности для повышения эффективности MOOC-платформ в условиях растущей конкуренции на рынке образовательных технологий.

In the context of the digital transformation of education, MOOC platforms face the need to optimize operational processes while maintaining the quality of education. Traditional approaches to resource management often do not take into account complex temporal patterns of user behavior and individual learning characteristics. This paper proposes an innovative solution based on interpreted reinforcement learning (RL) integrated with the Shapley Value method to analyze the contribution of factors. The study demonstrates how data on activity time, user IDs, training goals, and other parameters can be used to train an RL agent capable of optimizing the allocation of platform resources. The developed approach allows: quantifying the contribution of each factor to operational efficiency; identifying hidden temporal patterns of user activity; and personalizing load management during peak periods. The article contains a mathematical justification of the method, practical implementation in MATLAB, as well as the results of testing, which showed a reduction in operating costs while increasing user satisfaction. Special attention is paid to the interpretability of the RL agent's decisions, which is critically important for the educational sphere. The work provides a ready-made methodology for the implementation of intelligent management systems in digital education, combining theoretical developments with practical recommendations for implementation. The results of the study open up new opportunities for improving the effectiveness of MOOC platforms in the face of growing competition in the educational technology market.

обучение с подкреплением Shapley Value операционная эффективность цифровая трансформация интерпретируемый ИИ оптимизация бизнес-процессов

reinforcement learning Shapley Value operational efficiency digital transformation interpreted AI business process optimization

Исследование выполнено без спонсорской поддержки.

The study was performed without external funding.

References 1

Бойко Т.А. Качественный и количественный анализ MOOC-платформ. Инновации и инвестиции. 2019;(11):175–180.

Reich J., Ruipérez-Valiente J.A. The MOOC Pivot. Science. 2019;363(6423):130–131.

Caicedo J.C., Lazebnik S. Active Object Localization with Deep Reinforcement Learning. In: 2015 IEEE International Conference on Computer Vision (ICCV), 07–13 December 2015, Santiago, Chile. IEEE; 2015. P. 2488–2496. https://doi.org/10.1109/ICCV.2015.286

Rozemberczki B., Watson L., Bayer P., et al. The Shapley Value in Machine Learning. arXiv. URL: https://arxiv.org/abs/2202.05594v2 [Accessed 10th March 2025].

Саттон Р.С., Барто Э.Дж. Обучение с подкреплением: введение. Москва: ДМК Пресс; 2020. 552 c.

Li X., Xu H., Zhang J., Chang H.-H. Deep Reinforcement Learning for Adaptive Learning Systems. arXiv. URL: https://arxiv.org/abs/2004.08410v1 [Accessed 10th March 2025].

Ashwini, Reddy K.V. Predicting the User Behavior Analysis using Machine Learning Algorithms. International Research Journal of Engineering and Technology (IRJET). 2020;7(7):1740–1746.

Schwartz H.M. Multi-Agent Machine Learning: A Reinforcement Approach. John Wiley & Sons, Inc.; 2014. 256 p.

Ивашкин Ю.А. Мультиагентное моделирование в имитационной системе Simplex3. Москва: Лаборатория знаний; 2016. 350 с.

Соколова Е.С. Мультиагентный подход к моделированию межмодульных взаимодействий в стохастических сетевых распределённых системах. Системы управления и информационные технологии. 2020;(1):67–71.

Шевская Н.В. Объяснимый искусственный интеллект и методы интерпретации результатов. Моделирование, оптимизация и информационные технологии. 2021;9(2). https://doi.org/10.26102/2310-6018/2021.33.2.024

The authors declare that there are no conflicts of interest present.