<?xml version="1.0" encoding="UTF-8"?>
<article article-type="research-article" dtd-version="1.3" xml:lang="ru" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="https://metafora.rcsi.science/xsd_files/journal3.xsd">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">moitvivt</journal-id>
      <journal-title-group>
        <journal-title xml:lang="ru">Моделирование, оптимизация и информационные технологии</journal-title>
        <trans-title-group xml:lang="en">
          <trans-title>Modeling, Optimization and Information Technology</trans-title>
        </trans-title-group>
      </journal-title-group>
      <issn pub-type="epub">2310-6018</issn>
      <publisher>
        <publisher-name>Издательство</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="doi">10.26102/2310-6018/2025.51.4.066</article-id>
      <article-id pub-id-type="custom" custom-type="elpub">2142</article-id>
      <title-group>
        <article-title xml:lang="ru">Адаптивное риск-ориентированное управление эксплуатацией объектов розничной сети на основе кластеризации и обучения с подкреплением</article-title>
        <trans-title-group xml:lang="en">
          <trans-title>Adaptive risk-based management of retail network facilities based on clusterization and training with reinforcements</trans-title>
        </trans-title-group>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Устимов</surname>
              <given-names>Максим Геннадьевич</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Ustimov</surname>
              <given-names>Maxim Gennadievich</given-names>
            </name>
          </name-alternatives>
          <email>mgu1287@mail.ru</email>
          <xref ref-type="aff">aff-1</xref>
        </contrib>
        <contrib contrib-type="author">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Прохорова</surname>
              <given-names>Ольга Константиновна</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Prokhorova</surname>
              <given-names>Olga Konstantinovna</given-names>
            </name>
          </name-alternatives>
          <email>roza_pochta@list.ru</email>
          <xref ref-type="aff">aff-2</xref>
        </contrib>
        <contrib contrib-type="author">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Заложных</surname>
              <given-names>Даниил Олегович</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Zalozhnikh</surname>
              <given-names>Daniil Olegovich</given-names>
            </name>
          </name-alternatives>
          <email>daniil.olegovich957@yandex.ru</email>
          <xref ref-type="aff">aff-3</xref>
        </contrib>
      </contrib-group>
      <aff-alternatives id="aff-1">
        <aff xml:lang="ru">Воронежский институт высоких технологий</aff>
        <aff xml:lang="en">Voronezh Institute of High Technologies</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-2">
        <aff xml:lang="ru">Воронежский институт высоких технологий</aff>
        <aff xml:lang="en">Voronezh Institute of High Technologies</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-3">
        <aff xml:lang="ru">Воронежский институт высоких технологий</aff>
        <aff xml:lang="en">Voronezh Institute of High Technologies</aff>
      </aff-alternatives>
      <pub-date pub-type="epub">
        <day>01</day>
        <month>01</month>
        <year>2026</year>
      </pub-date>
      <volume>1</volume>
      <issue>1</issue>
      <elocation-id>10.26102/2310-6018/2025.51.4.066</elocation-id>
      <permissions>
        <copyright-statement>Copyright © Авторы, 2026</copyright-statement>
        <copyright-year>2026</copyright-year>
        <license license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/">
          <license-p>This work is licensed under a Creative Commons Attribution 4.0 International License</license-p>
        </license>
      </permissions>
      <self-uri xlink:href="https://moitvivt.ru/ru/journal/article?id=2142"/>
      <abstract xml:lang="ru">
        <p>В условиях повышенных операционных и энергетических рисков, характерных для современных розничных сетей, предлагается инновационный двухуровневый подход к управлению эксплуатацией объектов. Исследование направлено на решение ключевой проблемы неоднородности риск-профилей объектов сети, требующей дифференцированных стратегий управления вместо унифицированных регламентов. На стратегическом уровне реализована интеллектуальная кластеризация объектов методом самоорганизующихся карт Кохонена (SOM) по комплексным факторам риска, включающим геопространственные параметры (удаленность от зон операционной напряженности), инфраструктурные показатели (близость к критической инфраструктуре, надежность энергосетей), операционные метрики (логистическая устойчивость, история инцидентов) и социально-экономические индикаторы. В результате кластерного анализа выявлены четыре четко дифференцированные категории объектов: критические, высокого риска, логистически уязвимые и стабильные. На тактическом уровне для каждого кластера разработаны специализированные модели обучения с подкреплением (Reinforcement Learning), адаптирующие эксплуатационные политики в реальном времени. Формализация задачи как марковского процесса принятия решений позволила оптимизировать управляющие воздействия (техническое обслуживание, энергоменеджмент, резервирование) с учетом специфических целей кластера. Ключевой особенностью методологии является кастомизация функций вознаграждения: для критических объектов приоритет отдается максимизации живучести, для стабильных – энергоэффективности, для промежуточных кластеров – сбалансированным стратегиям. Экспериментальная валидация проведена на синтезированном датасете из 100 объектов с использованием современных библиотек машинного обучения (Stable-Baselines3, Gymnasium, Scikit-learn) в контейнеризованной среде Docker WSL2.</p>
      </abstract>
      <trans-abstract xml:lang="en">
        <p>In the context of increased operational and energy risks typical of modern retail chains, an innovative two-tier approach to facility operation management is proposed. The research is aimed at solving the key problem of heterogeneity of the risk profiles of network facilities, which requires differentiated management strategies instead of unified regulations. At the strategic level, intelligent clustering of objects using the Kohonen self-organizing maps (SOM) method has been implemented for complex risk factors, including geospatial parameters (distance from operational tension zones), infrastructural indicators (proximity to critical infrastructure, reliability of power grids), operational metrics (logistical stability, incident history) and socio-economic indicators. As a result of the cluster analysis, four clearly differentiated categories of objects were identified: critical, high-risk, logistically vulnerable and stable. At the tactical level, specialized Reinforcement Learning models have been developed for each cluster to adapt operational policies in real time. The formalization of the task as a Markov decision-making process made it possible to optimize control actions (maintenance, energy management, redundancy), taking into account the specific goals of the cluster. A key feature of the methodology is the customization of reward functions: priority is given to maximizing survivability for critical facilities, energy efficiency for stable ones, and balanced strategies for intermediate clusters. Experimental validation was performed on a synthesized dataset of 100 objects using modern machine learning libraries (Stable-Baselines3, Gymnasium, Scikit-learn) in a Docker WSL2 containerized environment.</p>
      </trans-abstract>
      <kwd-group xml:lang="ru">
        <kwd>управление эксплуатацией</kwd>
        <kwd>обучение с подкреплением</kwd>
        <kwd>риск-ориентированный подход</kwd>
        <kwd>кластеризация</kwd>
        <kwd>энергоэффективность</kwd>
        <kwd>живучесть объектов</kwd>
        <kwd>розничные сети</kwd>
        <kwd>цифровой двойник</kwd>
      </kwd-group>
      <kwd-group xml:lang="en">
        <kwd>operation management</kwd>
        <kwd>reinforcement learning</kwd>
        <kwd>risk-based approach</kwd>
        <kwd>clustering</kwd>
        <kwd>energy efficiency</kwd>
        <kwd>survivability of facilities</kwd>
        <kwd>retail chains</kwd>
        <kwd>digital twin</kwd>
      </kwd-group>
      <funding-group>
        <funding-statement xml:lang="ru">Исследование выполнено без спонсорской поддержки.</funding-statement>
        <funding-statement xml:lang="en">The study was performed without external funding.</funding-statement>
      </funding-group>
    </article-meta>
  </front>
  <back>
    <ref-list>
      <title>References</title>
      <ref id="cit1">
        <label>1</label>
        <mixed-citation xml:lang="ru">Yu L., Qin Sh., Zhang M., Shen Ch., Jiang T., Guan X. A Review of Deep Reinforcement Learning for Smart Building Energy Management. IEEE Internet of Things Journal. 2021;8(15):12046–12063. https://doi.org/10.1109/JIOT.2021.3078462</mixed-citation>
      </ref>
      <ref id="cit2">
        <label>2</label>
        <mixed-citation xml:lang="ru">Djenouri D., Laidi R., Djenouri Y., Balasingham I. Machine Learning for Smart Building Applications: Review and Taxonomy. ACM Computing Surveys. 2019;52(2). https://doi.org/10.1145/3311950</mixed-citation>
      </ref>
      <ref id="cit3">
        <label>3</label>
        <mixed-citation xml:lang="ru">Pigott A., Crozier C., Baker K., Nagy Z. GridLearn: Multiagent Reinforcement Learning for Grid-Aware Building Energy Management. arXiv. URL: https://arxiv.org/pdf/2110.06396.pdf [Accessed 15th November 2025].</mixed-citation>
      </ref>
      <ref id="cit4">
        <label>4</label>
        <mixed-citation xml:lang="ru">Mao R., Aggarwal V. NPSCS: Non-Preemptive Stochastic Coflow Scheduling with Time-Indexed LP Relaxation. IEEE Transactions on Network and Service Management. 2021;18(2):2377–2387. https://doi.org/10.1109/TNSM.2021.3051657</mixed-citation>
      </ref>
      <ref id="cit5">
        <label>5</label>
        <mixed-citation xml:lang="ru">Al Sayed K., Boodi A., Broujeny R.S., Beddiar K. Reinforcement Learning for HVAC Control in Intelligent Buildings: A Technical and Conceptual Review. Journal of Building Engineering. 2024;95. https://doi.org/10.1016/j.jobe.2024.110085</mixed-citation>
      </ref>
      <ref id="cit6">
        <label>6</label>
        <mixed-citation xml:lang="ru">Hillson D. Managing Risk in Projects. London: Routledge; 2016. 126 p.</mixed-citation>
      </ref>
      <ref id="cit7">
        <label>7</label>
        <mixed-citation xml:lang="ru">Samunnisa K., Sunil Vijaya Kumar G., Madhavi K. Intrusion Detection System in Distributed Cloud Computing: Hybrid Clustering and Classification Methods. Measurement: Sensors. 2023;25. https://doi.org/10.1016/j.measen.2022.100612</mixed-citation>
      </ref>
      <ref id="cit8">
        <label>8</label>
        <mixed-citation xml:lang="ru">Obasi I.Ch., Cheng P., Varianou-Mikellidou C., Dimopoulos Ch., Boustras G. Machine Learning for Occupational Accident Analysis: Applications, Challenges, and Future Directions. Journal of Safety Science and Resilience. 2026;7(1). https://doi.org/10.1016/j.jnlssr.2025.100250</mixed-citation>
      </ref>
      <ref id="cit9">
        <label>9</label>
        <mixed-citation xml:lang="ru">Alhoniemi E., Hollmén J., Simula O., Vesanto J. Process Monitoring and Modeling Using the Self-Organizing Map. Integrated Computer Aided Engineering. 1998;6(1). https://doi.org/10.3233/ICA-1999-6102</mixed-citation>
      </ref>
      <ref id="cit10">
        <label>10</label>
        <mixed-citation xml:lang="ru">Bouabdallaoui Y., Lafhaj Z., Yim P., Ducoulombier L., Bennadji B. Predictive Maintenance in Building Facilities: A Machine Learning-Based Approach. Sensors. 2021;21(4). https://doi.org/10.3390/s21041044</mixed-citation>
      </ref>
      <ref id="cit11">
        <label>11</label>
        <mixed-citation xml:lang="ru">Schulman J., Wolski F., Dhariwal P., Radford A., Klimov O. Proximal Policy Optimization Algorithms. arXiv. URL: https://arxiv.org/abs/1707.06347 [Accessed 18th November 2025].</mixed-citation>
      </ref>
      <ref id="cit12">
        <label>12</label>
        <mixed-citation xml:lang="ru">Mnih V., Kavukcuoglu K., Silver D., et al. Human-Level Control Through Deep Reinforcement Learning. Nature. 2015;518(7540):529–533. https://doi.org/10.1038/nature14236</mixed-citation>
      </ref>
      <ref id="cit13">
        <label>13</label>
        <mixed-citation xml:lang="ru">Kohonen T. Self-Organizing Maps. Berlin, Heidelberg: Springer; 2001. 502 p. https://doi.org/10.1007/978-3-642-56927-2</mixed-citation>
      </ref>
    </ref-list>
    <fn-group>
      <fn fn-type="conflict">
        <p>The authors declare that there are no conflicts of interest present.</p>
      </fn>
    </fn-group>
  </back>
</article>