<?xml version="1.0" encoding="UTF-8"?>
<article article-type="research-article" dtd-version="1.3" xml:lang="ru" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="https://metafora.rcsi.science/xsd_files/journal3.xsd">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">moitvivt</journal-id>
      <journal-title-group>
        <journal-title xml:lang="ru">Моделирование, оптимизация и информационные технологии</journal-title>
        <trans-title-group xml:lang="en">
          <trans-title>Modeling, Optimization and Information Technology</trans-title>
        </trans-title-group>
      </journal-title-group>
      <issn pub-type="epub">2310-6018</issn>
      <publisher>
        <publisher-name>Издательство</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="doi">10.26102/2310-6018/2025.51.4.015</article-id>
      <article-id pub-id-type="custom" custom-type="elpub">2051</article-id>
      <title-group>
        <article-title xml:lang="ru">Оценка точности и производительности моделей машинного обучения для прогнозирования оттока клиентов страховой компании</article-title>
        <trans-title-group xml:lang="en">
          <trans-title>Evaluation of accuracy and performance of machine learning models for prognosis customer churn in insurance companies</trans-title>
        </trans-title-group>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <contrib-id contrib-id-type="orcid">0009-0002-1447-4357</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Мадияров</surname>
              <given-names>Куан Галымович</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Madiyarov</surname>
              <given-names>Kuan Galymovich</given-names>
            </name>
          </name-alternatives>
          <email>kuan.mad@mail.ru</email>
          <xref ref-type="aff">aff-1</xref>
        </contrib>
      </contrib-group>
      <aff-alternatives id="aff-1">
        <aff xml:lang="ru">Новосибирский государственный университет экономики и управления «НИНХ»</aff>
        <aff xml:lang="en">Novosibirsk State University of Economics and Management</aff>
      </aff-alternatives>
      <pub-date pub-type="epub">
        <day>01</day>
        <month>01</month>
        <year>2026</year>
      </pub-date>
      <volume>1</volume>
      <issue>1</issue>
      <elocation-id>10.26102/2310-6018/2025.51.4.015</elocation-id>
      <permissions>
        <copyright-statement>Copyright © Авторы, 2026</copyright-statement>
        <copyright-year>2026</copyright-year>
        <license license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/">
          <license-p>This work is licensed under a Creative Commons Attribution 4.0 International License</license-p>
        </license>
      </permissions>
      <self-uri xlink:href="https://moitvivt.ru/ru/journal/article?id=2051"/>
      <abstract xml:lang="ru">
        <p>Проведено комплексное сравнительное исследование нескольких алгоритмов машинного обучения для задачи прогнозирования оттока клиентов страховой компании на данных открытого датасета. Уделено внимание как качественным метрикам точности моделей, так и вычислительной эффективности. Актуальность темы обусловлена высокой конкуренцией на страховом рынке и значительными затратами, связанными с потерей клиентов; своевременное выявление намерения клиента прекратить сотрудничество позволяет компании принять меры для его удержания. Цель исследования – оценить точность и производительность различных моделей машинного обучения, способных предсказать отток клиентов. В экспериментах использованы открытые данные о клиентах страховой компании (индустрия страхования жизни) с признаками, характеризующими их страховые случаи, исторические записи и факт оттока. Добавлен анализ факторов: исследованы корреляции между признаками и целевой переменной, выполнен факторный анализ и оценена важность признаков, влияющих на отток. По результатам, почти все модели продемонстрировали одинаково высокое качество прогноза благодаря наличию доминирующего фактора риска оттока, однако различались по производительности: логистическая регрессия и градиентный бустинг обучаются на порядок быстрее по сравнению с методом опорных векторов и случайным лесом, при значительно меньшем объеме памяти. Полученные результаты подтверждают, что современные ансамблевые алгоритмы способны обеспечить высокую точность прогнозирования оттока клиентов при разумных затратах ресурсов. Их использование целесообразно для страховых компаний с целью своевременного выявления клиентов группы риска, например, клиентов с крупными страховыми выплатами и принятия проактивных мер по удержанию таких клиентов.</p>
      </abstract>
      <trans-abstract xml:lang="en">
        <p>A comprehensive comparative study of several machine learning algorithms for predicting customer churn in an insurance company was conducted using data from an open dataset. Both predictive quality metrics and computational efficiency were examined. The topic is relevant due to intense competition in the insurance market and the substantial costs of losing customers; early detection of a customer’s intention to leave enables targeted retention actions. The aim of the study is to assess the accuracy and performance of different machine-learning models capable of predicting churn. The experiments used open data on insurance customers (life-insurance industry) containing features that describe claim events, historical records, and the churn outcome. We also added factor analysis: correlations between features and the target variable were investigated, factor analysis was performed, and feature importance related to churn was evaluated. The results show that most models achieved similarly high predictive quality due to the presence of a dominant churn-risk factor, but differed in performance: logistic regression and gradient boosting trained an order of magnitude faster than support vector machines and random forests while using substantially less memory. These findings confirm that modern ensemble algorithms can provide high-accuracy churn prediction at reasonable resource costs. Their use is advisable for insurers to promptly identify high-risk clients, such as those with large claims, and to take proactive measures to retain them.</p>
      </trans-abstract>
      <kwd-group xml:lang="ru">
        <kwd>отток клиентов</kwd>
        <kwd>страхование</kwd>
        <kwd>машинное обучение</kwd>
        <kwd>прогнозирование</kwd>
        <kwd>точность модели</kwd>
        <kwd>производительность модели</kwd>
        <kwd>факторный анализ</kwd>
        <kwd>важность признаков</kwd>
      </kwd-group>
      <kwd-group xml:lang="en">
        <kwd>customer churn</kwd>
        <kwd>insurance</kwd>
        <kwd>machine learning</kwd>
        <kwd>prediction</kwd>
        <kwd>model accuracy</kwd>
        <kwd>model performance</kwd>
        <kwd>factor analysis</kwd>
        <kwd>feature importance</kwd>
      </kwd-group>
      <funding-group>
        <funding-statement xml:lang="ru">Исследование выполнено без спонсорской поддержки.</funding-statement>
        <funding-statement xml:lang="en">The study was performed without external funding.</funding-statement>
      </funding-group>
    </article-meta>
  </front>
  <back>
    <ref-list>
      <title>References</title>
      <ref id="cit1">
        <label>1</label>
        <mixed-citation xml:lang="ru">Шайхиева Ж.М. Churn Modeling для прогнозирования оттока клиентов в предприятиях. Вестник науки. 2023;2(11):709–713.</mixed-citation>
      </ref>
      <ref id="cit2">
        <label>2</label>
        <mixed-citation xml:lang="ru">Зеленков Ю.А., Сучкова А.С. Прогнозирование оттока клиентов на основе паттернов изменения их поведения. Бизнес-информатика. 2023;17(1):7–17.</mixed-citation>
      </ref>
      <ref id="cit3">
        <label>3</label>
        <mixed-citation xml:lang="ru">Любинский М.С. Применение машинного обучения для прогнозирования оттока клиентов в CRM-системах. Вестник науки. 2025;3(4):808–812.</mixed-citation>
      </ref>
      <ref id="cit4">
        <label>4</label>
        <mixed-citation xml:lang="ru">Boozary P., Sheykhan S., GhorbanTanhaei H., Magazzino C. Enhancing Customer Retention with Machine Learning: A Comparative Analysis of Ensemble Models for Accurate Churn Prediction. International Journal of Information Management Data Insights. 2025;5(1). https://doi.org/10.1016/j.jjimei.2025.100331</mixed-citation>
      </ref>
      <ref id="cit5">
        <label>5</label>
        <mixed-citation xml:lang="ru">Suguna R., Prakash J.S., Pai H.A., Mahesh T.R., Kumar V.V., Yimer T.E. Mitigating Class Imbalance in Churn Prediction with Ensemble Methods and SMOTE. Scientific Reports. 2025;15. https://doi.org/10.1038/s41598-025-01031-0</mixed-citation>
      </ref>
      <ref id="cit6">
        <label>6</label>
        <mixed-citation xml:lang="ru">Sikri A., Jameel R., Idrees Sh.M., Kaur H. Enhancing Customer Retention in Telecom Industry with Machine Learning Driven Churn Prediction. Scientific Reports. 2024;14. https://doi.org/10.1038/s41598-024-63750-0</mixed-citation>
      </ref>
      <ref id="cit7">
        <label>7</label>
        <mixed-citation xml:lang="ru">AbdelAziz N.M., Bekheet M., Salah A., El-Saber N., AbdelMoneim W.T. A Comprehensive Evaluation of Machine Learning and Deep Learning Models for Churn Prediction. Information. 2025;16(7). https://doi.org/10.3390/info16070537</mixed-citation>
      </ref>
      <ref id="cit8">
        <label>8</label>
        <mixed-citation xml:lang="ru">Liu X., Xia G., Zhang X., Ma W., Yu Ch. Customer Churn Prediction Model Based on Hybrid Neural Networks. Scientific Reports. 2024;14. https://doi.org/10.1038/s41598-024-79603-9</mixed-citation>
      </ref>
      <ref id="cit9">
        <label>9</label>
        <mixed-citation xml:lang="ru">He Ch., Ding Ch.H.Q. A Novel Classification Algorithm for Customer Churn Prediction Based on Hybrid Ensemble-Fusion Model. Scientific Reports. 2024;14. https://doi.org/10.1038/s41598-024-71168-x</mixed-citation>
      </ref>
      <ref id="cit10">
        <label>10</label>
        <mixed-citation xml:lang="ru">Khattak A., Mehak Z., Ahmad H., Asghar M.U., Asghar M.Z., Khan A. Customer Churn Prediction Using Composite Deep Learning Technique. Scientific Reports. 2023;13. https://doi.org/10.1038/s41598-023-44396-w</mixed-citation>
      </ref>
      <ref id="cit11">
        <label>11</label>
        <mixed-citation xml:lang="ru">Peng K., Peng Ya., Li W. Research on Customer Churn Prediction and Model Interpretability Analysis. PLoS ONE. 2023;18(12). https://doi.org/10.1371/journal.pone.0289724</mixed-citation>
      </ref>
      <ref id="cit12">
        <label>12</label>
        <mixed-citation xml:lang="ru">Risselada H., Verhoef P.C., Bijmolt T.H.A. Staying Power of Churn Prediction Models. Journal of Interactive Marketing. 2010;24(3):198–208. https://doi.org/10.1016/j.intmar.2010.04.002</mixed-citation>
      </ref>
    </ref-list>
    <fn-group>
      <fn fn-type="conflict">
        <p>The authors declare that there are no conflicts of interest present.</p>
      </fn>
    </fn-group>
  </back>
</article>