<?xml version="1.0" encoding="UTF-8"?>
<article article-type="research-article" dtd-version="1.3" xml:lang="ru" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="https://metafora.rcsi.science/xsd_files/journal3.xsd">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">moitvivt</journal-id>
      <journal-title-group>
        <journal-title xml:lang="ru">Моделирование, оптимизация и информационные технологии</journal-title>
        <trans-title-group xml:lang="en">
          <trans-title>Modeling, Optimization and Information Technology</trans-title>
        </trans-title-group>
      </journal-title-group>
      <issn pub-type="epub">2310-6018</issn>
      <publisher>
        <publisher-name>Издательство</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="doi">10.26102/2310-6018/2024.46.3.020</article-id>
      <article-id pub-id-type="custom" custom-type="elpub">1623</article-id>
      <title-group>
        <article-title xml:lang="ru">Оценка риска развития хронического гепатита C на основе эвристических алгоритмов классификации</article-title>
        <trans-title-group xml:lang="en">
          <trans-title>Estimation of the risk of developing chronic hepatitis C based on heuristic classification algorithms</trans-title>
        </trans-title-group>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <contrib-id contrib-id-type="orcid">0000-0001-9263-9407</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Палевская</surname>
              <given-names>Светлана Александровна</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Palevskaya</surname>
              <given-names>Svetlana Alexandrovna</given-names>
            </name>
          </name-alternatives>
          <email>s.a.palevskaya@samsmu.ru</email>
          <xref ref-type="aff">aff-1</xref>
        </contrib>
        <contrib contrib-type="author">
          <contrib-id contrib-id-type="orcid">0000-0002-6128-2334</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Гущин</surname>
              <given-names>Андрей Викторович</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Gushchin</surname>
              <given-names>Andrey Viktorovich</given-names>
            </name>
          </name-alternatives>
          <email>a.v.guschin@samsmu.ru</email>
          <xref ref-type="aff">aff-2</xref>
        </contrib>
        <contrib contrib-type="author">
          <contrib-id contrib-id-type="orcid">0000-0002-5021-5259</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Иванов</surname>
              <given-names>Дмитрий Владимирович</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Ivanov</surname>
              <given-names>Dmitriy Vladimirovich</given-names>
            </name>
          </name-alternatives>
          <email>dvi85@list.ru</email>
          <xref ref-type="aff">aff-3</xref>
        </contrib>
      </contrib-group>
      <aff-alternatives id="aff-1">
        <aff xml:lang="ru">Самарский государственный медицинский университет</aff>
        <aff xml:lang="en">Samara State Medical University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-2">
        <aff xml:lang="ru">Самарский государственный медицинский университет Самарский национальный исследовательский университет имени академика С.П. Королева</aff>
        <aff xml:lang="en">Samara State Medical University Samara National Research University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-3">
        <aff xml:lang="ru">Самарский национальный исследовательский университет имени академика С.П. Королева Самарский государственный университет путей сообщения</aff>
        <aff xml:lang="en">Samara National Research University Samara State University of Transport</aff>
      </aff-alternatives>
      <pub-date pub-type="epub">
        <day>01</day>
        <month>01</month>
        <year>2026</year>
      </pub-date>
      <volume>1</volume>
      <issue>1</issue>
      <elocation-id>10.26102/2310-6018/2024.46.3.020</elocation-id>
      <permissions>
        <copyright-statement>Copyright © Авторы, 2026</copyright-statement>
        <copyright-year>2026</copyright-year>
        <license license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/">
          <license-p>This work is licensed under a Creative Commons Attribution 4.0 International License</license-p>
        </license>
      </permissions>
      <self-uri xlink:href="https://moitvivt.ru/ru/journal/article?id=1623"/>
      <abstract xml:lang="ru">
        <p>Материалы статьи предназначены для специалистов в области машинного обучения для организации технологий повышения качества информационного восприятия и интерпретации измерений в практике принятия врачебных решений. В статье предлагается способ выбора, настройки и тестирования классификатора в условиях дефицита априорной информации используемых данных. Это актуально, когда на начальном этапе научных исследований формируются малые выборки измерений биологических объектов и их систем, нелинейные свойства которых часто приводят к несостоятельности статистических критериев. Тем не менее, согласованность «неудобных» распределений должна выражаться в адекватном ответе программы содействия врачебному решению. Исходя из этого, определяется цель – выбор метода решения из предлагаемого множества способов машинной настройки разделения признаков. Большая часть алгоритмов настройки – эвристические, где останов параметрического оценивания базируется на критериях минимизации энтропии как косвенной максимизации принятой информации. Главная задача – это определение алгоритма обучения и настройки регрессии классификации с явным прогностическим поведением подобия статистической сходимости минимизируемых ошибок. Это гарант повышения качества классификации рисков при тривиальном увеличении экземпляров обучения. Особенности рассматриваемого случая заключается в двойственности характера прогрессирования хронического гепатита C (ХГС) у детей: с коинфекцией ВИЧ и собственно ХГС. Отсюда и возникает проблема нахождения единых условий метрической минимизации ошибок при оценке риска развития ХГС на базе методов машинного обучения. На небольших выборках были исследованы данные с целью выявления значимых параметров для эвристической идентификации присутствия рисков развития основного и сопутствующих заболеваний. В этом исследовании применялось несколько методов неглубокого машинного обучения регрессий, в основном использующие эвристические решения вероятностного разделения признаков. В статье выборочно описано применение некоторых основных методов обучения с учетом их особенностей при технологической проверке классификаторов риска.</p>
      </abstract>
      <trans-abstract xml:lang="en">
        <p>The materials of the article are intended for specialists in the field of machine learning for the organization of technologies for improving the quality of information perception and interpretation of measurements in the practice of making medical decisions. The article proposes a method for selecting, tuning and testing a classifier under conditions of a deficit of a priori information in the data used. This is relevant when small samples of measurements of biological objects and their systems are formed at the initial stage of scientific research, the nonlinear properties of which often lead to the failure of statistical criteria. Nevertheless, the consistency of "inconvenient" distributions should be expressed in an adequate response of the program for assisting a medical decision. Based on this, the goal is determined - the choice of a solution method from the proposed set of methods for machine tuning of feature separation. Most tuning algorithms are heuristic, where the stop of parametric estimation is based on the criteria of entropy minimization as an indirect maximization of the received information. The main task is to determine the algorithm for learning and tuning the classification regression with an explicit predictive behavior of the similarity of the statistical convergence of the minimized errors. This guarantees an increase in the quality of risk classification with a trivial increase in training instances. The peculiarity of the case under consideration lies in the duality of the nature of chronic hepatitis C (CHC) progression in children: with HIV coinfection and CHC itself. This raises the problem of finding unified conditions for metric minimization of errors in еstimation the risk of developing CHC based on machine learning methods. Data sets were studied on small samples in order to identify significant parameters for heuristic identification of the presence of risks of developing the main and concomitant diseases. In this study, several methods of shallow machine learning of linear regressions were used, mainly using heuristic solutions for probabilistic separation of features. The article selectively describes the use of some basic learning methods taking into account their features in the technological verification of risk classifiers.</p>
      </trans-abstract>
      <kwd-group xml:lang="ru">
        <kwd>машинное обучение</kwd>
        <kwd>хронический гепатит C</kwd>
        <kwd>коинфекция ВИЧ</kwd>
        <kwd>бинарные классификаторы</kwd>
        <kwd>Lasso-регрессия</kwd>
        <kwd>сумма квадратов ошибок (MSE)</kwd>
        <kwd>регуляризация</kwd>
        <kwd>классификатор дерева решений</kwd>
        <kwd>ROC кривая</kwd>
        <kwd>площадь под ROC кривой (AUC)</kwd>
      </kwd-group>
      <kwd-group xml:lang="en">
        <kwd>machine learning</kwd>
        <kwd>chronic hepatitis C</kwd>
        <kwd>HIV coinfection</kwd>
        <kwd>binary classifiers</kwd>
        <kwd>Lasso regression</kwd>
        <kwd>sum of squared errors (MSE)</kwd>
        <kwd>regularization</kwd>
        <kwd>Decision Tree Classifier</kwd>
        <kwd>ROC curve</kwd>
        <kwd>Area Under Curve (AUC)</kwd>
      </kwd-group>
      <funding-group>
        <funding-statement xml:lang="ru">Исследование выполнено без спонсорской поддержки.</funding-statement>
        <funding-statement xml:lang="en">The study was performed without external funding.</funding-statement>
      </funding-group>
    </article-meta>
  </front>
  <back>
    <ref-list>
      <title>References</title>
      <ref id="cit1">
        <label>1</label>
        <mixed-citation xml:lang="ru">Hasan N., Bao Yu. Understanding current states of machine learning approaches in medical informatics: a systematic literature review. Health and Technology. 2021;11(3):471–482. https://doi.org/10.1007/s12553-021-00538-6</mixed-citation>
      </ref>
      <ref id="cit2">
        <label>2</label>
        <mixed-citation xml:lang="ru">Majzoobi M.M., Namdar S., Najafi-Vosough R., Hajilooi A.A., Mahjub H. Prediction of Hepatitis disease using ensemble learning methods. Journal of Preventive Medicine and Hygiene. 2022;63(3):E424–E428. https://doi.org/10.15167/2421-4248/jpmh2022.63.3.2515</mixed-citation>
      </ref>
      <ref id="cit3">
        <label>3</label>
        <mixed-citation xml:lang="ru">Moulaei K., Sharifi H., Bahaadinbeigy K., Haghdoost A.A., Nasiri N. Machine learning for prediction of viral hepatitis: A systematic review and meta-analysis. International Journal of Medical Informatics. 2023;179. https://doi.org/10.1016/j.ijmedinf.2023.105243</mixed-citation>
      </ref>
      <ref id="cit4">
        <label>4</label>
        <mixed-citation xml:lang="ru">Самоходская Л.М., Старостина Е.Е., Сулимов А.В., Краснова Т.Н., Розина Т.П., Авдеев В.Г., Савкин И.А., Сулимов В.Б., Мухин Н.А., Ткачук В.А., Садовничий В.А. Прогнозирование особенностей течения хронического гепатита C с использованием байесовских сетей. Терапевтический архив. 2019;91(2):32–39. https://doi.org/10.26442/00403660.2019.02.000076</mixed-citation>
      </ref>
      <ref id="cit5">
        <label>5</label>
        <mixed-citation xml:lang="ru">Kashif A.A., Bakhtawar B., Akhtar A., Akhtar S., Aziz N., Javeid M.S. Treatment Response Prediction in Hepatitis C Patients using Machine Learning Techniques. International Journal of Technology, Innovation and Management (IJTIM). 2021;1(2):79–89. https://doi.org/10.54489/ijtim.v1i2.24</mixed-citation>
      </ref>
      <ref id="cit6">
        <label>6</label>
        <mixed-citation xml:lang="ru">Rosen H.R. Chronic Hepatitis C Infection. New England Journal of Medicine. 2011;364(25):2429–2438. https://doi.org/10.1056/NEJMcp1006613</mixed-citation>
      </ref>
      <ref id="cit7">
        <label>7</label>
        <mixed-citation xml:lang="ru">Crisan D., Radu C., Grigorescu M.D., Lupsor M., Feier D., Grigorescu M. Prospective Non-Invasive Follow-up of Liver Fibrosis in Patients with Chronic hepatitis C. Journal of Gastrointestinal and Liver Diseases. 2012;21(4):375–382.</mixed-citation>
      </ref>
      <ref id="cit8">
        <label>8</label>
        <mixed-citation xml:lang="ru">Zhang D., Liu X., Shao M., Sun Y., Lian Q., Zhang H. The value of artificial intelligence and imaging diagnosis in the fight against COVID-19. Personal and Ubiquitous Computing. 2023;27(3):783–792. https://doi.org/10.1007/s00779-021-01522-7</mixed-citation>
      </ref>
      <ref id="cit9">
        <label>9</label>
        <mixed-citation xml:lang="ru">Pieczkiewicz D.S., Finkelstein S.M. Evaluating the decision accuracy and speed of clinical data visualizations. Journal of the American Medical Informatics Association. 2010;17(2):178–181. https://doi.org/10.1136/jamia.2009.001651</mixed-citation>
      </ref>
      <ref id="cit10">
        <label>10</label>
        <mixed-citation xml:lang="ru">Alizargar A., Chang Y.-L., Tan T.-H. Performance Comparison of Machine Learning Approaches on Hepatitis C Prediction Employing Data Mining Techniques. Bioengineering. 2023;10(4). https://doi.org/10.3390/bioengineering10040481</mixed-citation>
      </ref>
      <ref id="cit11">
        <label>11</label>
        <mixed-citation xml:lang="ru">Harabor V., Mogos R., Nechita A., Adam A.-M., Adam G., Melinte-Popescu A.-S., Melinte-Popescu M., Stuparu-Cretu M., Vasilache I.-A., Mihalceanu E., Carauleanu A., Bivoleanu A., Harabor A. Machine Learning Approaches for the Prediction of Hepatitis B and C Seropositivity. International Journal of Environmental Research and Public Health. 2023;20(3). https://doi.org/10.3390/ijerph20032380</mixed-citation>
      </ref>
      <ref id="cit12">
        <label>12</label>
        <mixed-citation xml:lang="ru">Krittanawong C., Virk H.U.H., Bangalore S., Wang Z., Johnson K.W., Pinotti R., Zhang H., Kaplin S., Narasimhan B., Kitai T., Baber U., Halperin J.L., Tang W.H.W.  Machine learning prediction in cardiovascular diseases: a meta-analysis. Scientific Reports. 2020;10. https://doi.org/10.1038/s41598-020-72685-1</mixed-citation>
      </ref>
      <ref id="cit13">
        <label>13</label>
        <mixed-citation xml:lang="ru">Konerman M.A., Beste L.A., Van T., Liu B., Zhang X., Zhu J., Saini S.D., Su G.L., Nallamothu B.K., Ioannou G.N., Waljee A.K. Machine learning models to predict disease progression among veterans with hepatitis C virus. PLoS One. 2019;14(1). https://doi.org/10.1371/journal.pone.0208141</mixed-citation>
      </ref>
      <ref id="cit14">
        <label>14</label>
        <mixed-citation xml:lang="ru">Roslina A.H., Noraziah A. Prediction of hepatitis prognosis using Support Vector Machines and Wrapper Method. In: 2010 Seventh International Conference on Fuzzy Systems and Knowledge Discovery, 10–12 August 2010, Yantai, China. IEEE; 2010. pp. 2209–2211. https://doi.org/10.1109/FSKD.2010.5569542</mixed-citation>
      </ref>
      <ref id="cit15">
        <label>15</label>
        <mixed-citation xml:lang="ru">Hossen M.S., Haque I., Sarkar P.R., Islam M.A., Fahim W.A., Khatun T. Examining The Risk Factors of Liver Disease: A Machine Learning Approach. In: 2022 7th International Conference on Communication and Electronics Systems (ICCES), 22–24 June 2022, Coimbatore, India. IEEE; 2022. pp. 1249–1257. https://doi.org/10.1109/ICCES54183.2022.9835732</mixed-citation>
      </ref>
      <ref id="cit16">
        <label>16</label>
        <mixed-citation xml:lang="ru">KayvanJoo A.H., Ebrahimi M., Haqshenas G. Prediction of hepatitis C virus interferon/ribavirin therapy outcome based on viral nucleotide attributes using machine learning algorithms. BMC Research Notes. 2014;7(1). https://doi.org/10.1186/1756-0500-7-565</mixed-citation>
      </ref>
      <ref id="cit17">
        <label>17</label>
        <mixed-citation xml:lang="ru">Park H., Lo-Ciganic W.-H., Huang J., Wu Y., Henry L., Peter J., Sulkowski M., Nelson D.R. Evaluation of machine learning algorithms for predicting direct-acting antiviral treatment failure among patients with chronic hepatitis C infection. Scientific Reports. 2022;12(1). https://doi.org/10.1038/s41598-022-22819-4</mixed-citation>
      </ref>
      <ref id="cit18">
        <label>18</label>
        <mixed-citation xml:lang="ru">Chen L., Ji P., Ma Y. Machine Learning Model for Hepatitis C Diagnosis Customized to Each Patient. IEEE Access. 2022;10:106655–106672. https://doi.org/10.1109/ACCESS.2022.3210347</mixed-citation>
      </ref>
      <ref id="cit19">
        <label>19</label>
        <mixed-citation xml:lang="ru">Singh K.R., Gupta R., Kadian R.K., Singh R. An Optimized XGBoost approach for Predicting Progression of Hepatitis C using Hyperparameter Tuning and Feature Interaction Constraint. In: 2022 2nd Asian Conference on Innovation in Technology (ASIANCON), 26–28 August 2022, Ravet, India. IEEE; 2022. pp. 1–8. https://doi.org/10.1109/ASIANCON55314.2022.9909086</mixed-citation>
      </ref>
      <ref id="cit20">
        <label>20</label>
        <mixed-citation xml:lang="ru">Singh U., Gourisaria M.K., Mishra B.K. A Dual Dataset approach for the diagnosis of Hepatitis C Virus using Machine Learning. In: 2022 IEEE International Conference on Electronics, Computing and Communication Technologies (CONECCT), 08–10 July 2022, Bangalore, India. IEEE; 2022. pp. 1–6. https://doi.org/10.1109/CONECCT55679.2022.9865758</mixed-citation>
      </ref>
      <ref id="cit21">
        <label>21</label>
        <mixed-citation xml:lang="ru">Farooq S.A. The Multi-Class Detection of Five Stages of Hepatitis C Using the Machine Learning Based Random Forest Algorithm. In: 2023 World Conference on Communication &amp; Computing (WCONF), 14–16 July 2023, Raipur, India. IEEE; 2023. pp. 1–6. https://doi.org/10.1109/WCONF58270.2023.10235157</mixed-citation>
      </ref>
      <ref id="cit22">
        <label>22</label>
        <mixed-citation xml:lang="ru">Lilhore U.K., Manoharan P., Sandhu J.K., Simaiya S., Dalal S., Baqasah A.M., Alsafyani M., Alroobaea R., Keshta I., Raahemifar K. Hybrid model for precise hepatitis-C classification using improved random forest and SVM method. Scientific Reports. 2023;13(1). https://doi.org/10.1038/s41598-023-36605-3</mixed-citation>
      </ref>
      <ref id="cit23">
        <label>23</label>
        <mixed-citation xml:lang="ru">Ali A.M., Hassan M.R., Aburub F., Alauthman M., Aldweesh A., Al-Qerem A., Jebreen I., Nabot A. Explainable Machine Learning Approach for Hepatitis C Diagnosis Using SFS Feature Selection. Machines. 2023;11(3). https://doi.org/10.3390/machines11030391</mixed-citation>
      </ref>
      <ref id="cit24">
        <label>24</label>
        <mixed-citation xml:lang="ru">Ara A., Sami A., Michael D.L., Bazgir E., Mandal P. Hepatitis C prediction using SVM, logistic regression and decision tree. World Journal of Advanced Research and Reviews. 2024;22(02):926–936. https://doi.org/10.30574/wjarr.2024.22.2.1483</mixed-citation>
      </ref>
      <ref id="cit25">
        <label>25</label>
        <mixed-citation xml:lang="ru">Mahmud M., Budiman I., Indriani F., Kartini D., Faisal M.R., Rozaq H.A.A., Yildiz O., Caesarendra W. Implementation of C5.0 Algorithm using Chi-Square Feature Selection for Early Detection of Hepatitis C Disease. Journal of Electronics, Electromedical Engineering, and Medical Informatics. 2024;6(2):116–124. https://doi.org/10.35882/jeeemi.v6i2.384</mixed-citation>
      </ref>
      <ref id="cit26">
        <label>26</label>
        <mixed-citation xml:lang="ru">Yefou U.N., Choudja P.O.M., Sow B., Adejumo A. Optimized Machine Learning Models for Hepatitis C Prediction: Leveraging Optuna for Hyperparameter Tuning and Streamlit for Model Deployment. In: Pan-African Conference on Artificial Intelligence: Part I, 5–6 October 2023, Addis Ababa, Ethiopia. Cham: Springer; 2023. pp. 88–100. https://doi.org/10.1007/978-3-031-57624-9_5</mixed-citation>
      </ref>
      <ref id="cit27">
        <label>27</label>
        <mixed-citation xml:lang="ru">Zhang L., Wang J., Chang R., Wang W. Investigation of the effectiveness of a classification method based on improved DAE feature extraction for hepatitis C prediction. Scientific Reports. 2024;14(1). https://doi.org/10.1038/s41598-024-59785-y</mixed-citation>
      </ref>
      <ref id="cit28">
        <label>28</label>
        <mixed-citation xml:lang="ru">Бакулин И.Г., Дианова Н.Х., Сандлер Ю.Г., Простов М.Ю. Математические модели прогнозирования лейкопении и нейтропении у больных хроническим гепатитом С на фоне интерферон-содержащих схем. Архивъ внутренней медицины. 2016;6(5):53–62. https://doi.org/10.20514/2226-6704-2016-6-5-53-62</mixed-citation>
      </ref>
      <ref id="cit29">
        <label>29</label>
        <mixed-citation xml:lang="ru">Астафьев А.Н. Методика дифференциальной диагностики нозологической формы вирусного гепатита с применением нейронной сети каскадной корреляции. Моделирование, оптимизация и информационные технологии. 2019;7(3). https://doi.org/10.26102/2310-6018/2019.26.3.028</mixed-citation>
      </ref>
      <ref id="cit30">
        <label>30</label>
        <mixed-citation xml:lang="ru">Теряева М.А., Борисова О.В., Палевская С.А., Гущин А.В.; заявитель Федеральное государственное бюджетное образовательное учреждение высшего образования «Самарский государственный медицинский университет» Министерства здравоохранения Российской Федерации. Программа оценки риска прогрессирования хронического гепатита С у детей с коинфекцией ВИЧ № 2023668604: опубл. 30.08.2023. Свидетельство о государственной регистрации программы для ЭВМ № 2023616384 Российская Федерация. Зарегистрировано в реестре программ для ЭВМ.</mixed-citation>
      </ref>
    </ref-list>
    <fn-group>
      <fn fn-type="conflict">
        <p>The authors declare that there are no conflicts of interest present.</p>
      </fn>
    </fn-group>
  </back>
</article>