<?xml version="1.0" encoding="UTF-8"?>
<article article-type="research-article" dtd-version="1.3" xml:lang="ru" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="https://metafora.rcsi.science/xsd_files/journal3.xsd">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">moitvivt</journal-id>
      <journal-title-group>
        <journal-title xml:lang="ru">Моделирование, оптимизация и информационные технологии</journal-title>
        <trans-title-group xml:lang="en">
          <trans-title>Modeling, Optimization and Information Technology</trans-title>
        </trans-title-group>
      </journal-title-group>
      <issn pub-type="epub">2310-6018</issn>
      <publisher>
        <publisher-name>Издательство</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="doi">10.26102/2310-6018/2025.50.3.001</article-id>
      <article-id pub-id-type="custom" custom-type="elpub">1901</article-id>
      <title-group>
        <article-title xml:lang="ru">Интерпретируемое обучение с подкреплением для оптимизации операционной эффективности образовательных платформ в условиях цифровой трансформации</article-title>
        <trans-title-group xml:lang="en">
          <trans-title>Interpreted reinforcement learning to optimize the operational efficiency of enterprises in the context of digital transformation</trans-title>
        </trans-title-group>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Прохорова</surname>
              <given-names>Ольга Константиновна</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Prokhorova</surname>
              <given-names>Olga Konstantinovna</given-names>
            </name>
          </name-alternatives>
          <email>roza_pochta@list.ru</email>
          <xref ref-type="aff">aff-1</xref>
        </contrib>
        <contrib contrib-type="author">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Петрова</surname>
              <given-names>Елена Сергеевна</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Petrova</surname>
              <given-names>Elena Sergeevna</given-names>
            </name>
          </name-alternatives>
          <email>lenoks.sokolova@mail.ru</email>
          <xref ref-type="aff">aff-2</xref>
        </contrib>
      </contrib-group>
      <aff-alternatives id="aff-1">
        <aff xml:lang="ru">Воронежский институт высоких технологий</aff>
        <aff xml:lang="en">Voronezh Institute of High Technologies</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-2">
        <aff xml:lang="ru">Воронежский государственный технический университет</aff>
        <aff xml:lang="en">Voronezh State Technical University</aff>
      </aff-alternatives>
      <pub-date pub-type="epub">
        <day>01</day>
        <month>01</month>
        <year>2026</year>
      </pub-date>
      <volume>1</volume>
      <issue>1</issue>
      <elocation-id>10.26102/2310-6018/2025.50.3.001</elocation-id>
      <permissions>
        <copyright-statement>Copyright © Авторы, 2026</copyright-statement>
        <copyright-year>2026</copyright-year>
        <license license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/">
          <license-p>This work is licensed under a Creative Commons Attribution 4.0 International License</license-p>
        </license>
      </permissions>
      <self-uri xlink:href="https://moitvivt.ru/ru/journal/article?id=1901"/>
      <abstract xml:lang="ru">
        <p>В условиях цифровой трансформации образования MOOC-платформы сталкиваются с необходимостью оптимизации операционных процессов при сохранении качества обучения. Традиционные подходы к управлению ресурсами часто не учитывают сложные временные паттерны поведения пользователей и индивидуальные особенности обучения. В работе предлагается решение на основе интерпретируемого обучения с подкреплением (RL), интегрированного с методом Shapley Value для анализа вклада факторов. Исследование демонстрирует, как данные о времени активности, идентификаторах пользователей, целях обучения и других параметрах могут быть использованы для обучения RL-агента, способного оптимизировать распределение ресурсов платформы. Разработанный подход позволяет: количественно оценивать вклад каждого фактора в операционную эффективность; выявлять скрытые временные закономерности активности пользователей; персонализировать управление нагрузкой в пиковые периоды. Статья содержит математическое обоснование метода, практическую реализацию в MATLAB, а также результаты апробации, показавшие снижение операционных затрат при одновременном повышении удовлетворенности пользователей. Особое внимание уделяется интерпретируемости решений RL-агента, что критически важно для образовательной сферы. Работа предоставляет готовую методологию для внедрения интеллектуальных систем управления в цифровом образовании, сочетая теоретические разработки с практическими рекомендациями по реализации. Результаты исследования открывают новые возможности для повышения эффективности MOOC-платформ в условиях растущей конкуренции на рынке образовательных технологий.</p>
      </abstract>
      <trans-abstract xml:lang="en">
        <p>In the context of the digital transformation of education, MOOC platforms face the need to optimize operational processes while maintaining the quality of education. Traditional approaches to resource management often do not take into account complex temporal patterns of user behavior and individual learning characteristics. This paper proposes an innovative solution based on interpreted reinforcement learning (RL) integrated with the Shapley Value method to analyze the contribution of factors. The study demonstrates how data on activity time, user IDs, training goals, and other parameters can be used to train an RL agent capable of optimizing the allocation of platform resources. The developed approach allows: quantifying the contribution of each factor to operational efficiency; identifying hidden temporal patterns of user activity; and personalizing load management during peak periods. The article contains a mathematical justification of the method, practical implementation in MATLAB, as well as the results of testing, which showed a reduction in operating costs while increasing user satisfaction. Special attention is paid to the interpretability of the RL agent's decisions, which is critically important for the educational sphere. The work provides a ready-made methodology for the implementation of intelligent management systems in digital education, combining theoretical developments with practical recommendations for implementation. The results of the study open up new opportunities for improving the effectiveness of MOOC platforms in the face of growing competition in the educational technology market.</p>
      </trans-abstract>
      <kwd-group xml:lang="ru">
        <kwd>обучение с подкреплением</kwd>
        <kwd>Shapley Value</kwd>
        <kwd>операционная эффективность</kwd>
        <kwd>цифровая трансформация</kwd>
        <kwd>интерпретируемый ИИ</kwd>
        <kwd>оптимизация бизнес-процессов</kwd>
      </kwd-group>
      <kwd-group xml:lang="en">
        <kwd>reinforcement learning</kwd>
        <kwd>Shapley Value</kwd>
        <kwd>operational efficiency</kwd>
        <kwd>digital transformation</kwd>
        <kwd>interpreted AI</kwd>
        <kwd>business process optimization</kwd>
      </kwd-group>
      <funding-group>
        <funding-statement xml:lang="ru">Исследование выполнено без спонсорской поддержки.</funding-statement>
        <funding-statement xml:lang="en">The study was performed without external funding.</funding-statement>
      </funding-group>
    </article-meta>
  </front>
  <back>
    <ref-list>
      <title>References</title>
      <ref id="cit1">
        <label>1</label>
        <mixed-citation xml:lang="ru">Бойко Т.А. Качественный и количественный анализ MOOC-платформ. Инновации и инвестиции. 2019;(11):175–180.</mixed-citation>
      </ref>
      <ref id="cit2">
        <label>2</label>
        <mixed-citation xml:lang="ru">Reich J., Ruipérez-Valiente J.A. The MOOC Pivot. Science. 2019;363(6423):130–131.</mixed-citation>
      </ref>
      <ref id="cit3">
        <label>3</label>
        <mixed-citation xml:lang="ru">Caicedo J.C., Lazebnik S. Active Object Localization with Deep Reinforcement Learning. In: 2015 IEEE International Conference on Computer Vision (ICCV), 07–13 December 2015, Santiago, Chile. IEEE; 2015. P. 2488–2496. https://doi.org/10.1109/ICCV.2015.286</mixed-citation>
      </ref>
      <ref id="cit4">
        <label>4</label>
        <mixed-citation xml:lang="ru">Rozemberczki B., Watson L., Bayer P., et al. The Shapley Value in Machine Learning. arXiv. URL: https://arxiv.org/abs/2202.05594v2 [Accessed 10th March 2025].</mixed-citation>
      </ref>
      <ref id="cit5">
        <label>5</label>
        <mixed-citation xml:lang="ru">Саттон Р.С., Барто Э.Дж. Обучение с подкреплением: введение. Москва: ДМК Пресс; 2020. 552 c.</mixed-citation>
      </ref>
      <ref id="cit6">
        <label>6</label>
        <mixed-citation xml:lang="ru">Li X., Xu H., Zhang J., Chang H.-H. Deep Reinforcement Learning for Adaptive Learning Systems. arXiv. URL: https://arxiv.org/abs/2004.08410v1 [Accessed 10th March 2025].</mixed-citation>
      </ref>
      <ref id="cit7">
        <label>7</label>
        <mixed-citation xml:lang="ru">Ashwini, Reddy K.V. Predicting the User Behavior Analysis using Machine Learning Algorithms. International Research Journal of Engineering and Technology (IRJET). 2020;7(7):1740–1746.</mixed-citation>
      </ref>
      <ref id="cit8">
        <label>8</label>
        <mixed-citation xml:lang="ru">Schwartz H.M. Multi-Agent Machine Learning: A Reinforcement Approach. John Wiley &amp; Sons, Inc.; 2014. 256 p.</mixed-citation>
      </ref>
      <ref id="cit9">
        <label>9</label>
        <mixed-citation xml:lang="ru">Ивашкин Ю.А. Мультиагентное моделирование в имитационной системе Simplex3. Москва: Лаборатория знаний; 2016. 350 с.</mixed-citation>
      </ref>
      <ref id="cit10">
        <label>10</label>
        <mixed-citation xml:lang="ru">Соколова Е.С. Мультиагентный подход к моделированию межмодульных взаимодействий в стохастических сетевых распределённых системах. Системы управления и информационные технологии. 2020;(1):67–71.</mixed-citation>
      </ref>
      <ref id="cit11">
        <label>11</label>
        <mixed-citation xml:lang="ru">Шевская Н.В. Объяснимый искусственный интеллект и методы интерпретации результатов. Моделирование, оптимизация и информационные технологии. 2021;9(2). https://doi.org/10.26102/2310-6018/2021.33.2.024</mixed-citation>
      </ref>
    </ref-list>
    <fn-group>
      <fn fn-type="conflict">
        <p>The authors declare that there are no conflicts of interest present.</p>
      </fn>
    </fn-group>
  </back>
</article>