<?xml version="1.0" encoding="UTF-8"?>
<article article-type="research-article" dtd-version="1.3" xml:lang="ru" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="https://metafora.rcsi.science/xsd_files/journal3.xsd">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">moitvivt</journal-id>
      <journal-title-group>
        <journal-title xml:lang="ru">Моделирование, оптимизация и информационные технологии</journal-title>
        <trans-title-group xml:lang="en">
          <trans-title>Modeling, Optimization and Information Technology</trans-title>
        </trans-title-group>
      </journal-title-group>
      <issn pub-type="epub">2310-6018</issn>
      <publisher>
        <publisher-name>Издательство</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="doi"/>
      <article-id pub-id-type="custom" custom-type="elpub">437</article-id>
      <title-group>
        <article-title xml:lang="ru">ПРИМЕНЕНИЕ БАЙЕСОВСКОГО КЛАССИФИКАТОРА ДЛЯ ОПРЕДЕЛЕНИЯ ТЕМАТИКИ ТЕКСТА</article-title>
        <trans-title-group xml:lang="en">
          <trans-title>APPLICATION OF THE BAYESOV CLASSIFIER FOR THE DEFINITION OF THE THEMATICS OF THE TEXT</trans-title>
        </trans-title-group>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author" corresp="yes">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Чупин</surname>
              <given-names>Павел Георгиевич</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Chupin</surname>
              <given-names>Pavel Georgievich</given-names>
            </name>
          </name-alternatives>
          <email>pavelchupin94@yandex.ru</email>
          <xref ref-type="aff">aff-1</xref>
        </contrib>
        <contrib contrib-type="author" corresp="yes">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Афонин</surname>
              <given-names>Александр Юрьевич</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Afonin</surname>
              <given-names>Alexander Yurievich</given-names>
            </name>
          </name-alternatives>
          <email>afonin@pnzgu.ru</email>
          <xref ref-type="aff">aff-2</xref>
        </contrib>
        <contrib contrib-type="author" corresp="yes">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Шанов</surname>
              <given-names>Сергей Владимирович</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Shanov</surname>
              <given-names>Sergey Vladimirovich</given-names>
            </name>
          </name-alternatives>
          <email>aesfur@gmail.com</email>
          <xref ref-type="aff">aff-3</xref>
        </contrib>
      </contrib-group>
      <aff-alternatives id="aff-1">
        <aff xml:lang="ru">Пензенский государственный университет</aff>
        <aff xml:lang="en">Penza State University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-2">
        <aff xml:lang="ru">Пензенский государственный университет</aff>
        <aff xml:lang="en">Penza state University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-3">
        <aff xml:lang="ru">Пензенский государственный университет</aff>
        <aff xml:lang="en">Penza State University</aff>
      </aff-alternatives>
      <pub-date pub-type="epub">
        <day>01</day>
        <month>01</month>
        <year>2026</year>
      </pub-date>
      <volume>1</volume>
      <issue>1</issue>
      <elocation-id>e437</elocation-id>
      <permissions>
        <copyright-statement>Copyright © Авторы, 2026</copyright-statement>
        <copyright-year>2026</copyright-year>
        <license license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/">
          <license-p>This work is licensed under a Creative Commons Attribution 4.0 International License</license-p>
        </license>
      </permissions>
      <self-uri xlink:href="https://moitvivt.ru/ru/journal/article?id=437"/>
      <abstract xml:lang="ru">
        <p>Актуальность исследования обусловлена потребностью современного&#13;
общества в автоматической классификации данных. В данной работе рассмотрен&#13;
байесовский алгоритм на примере определения тематики текста. Целью работы&#13;
является разработка, выявление и решение проблем, возникающих во время реализации&#13;
и непосредственной работы классификатора, а также оценка его эффективности.&#13;
Выявлены проблемы арифметического переполнения и появления нулевой вероятности&#13;
в результате. Предложено их решение с помощью сглаживания Лапласа и свойства&#13;
логарифмов. Также представлены подходы по оптимизации и увеличению скорости&#13;
работы программного модуля. В результате был реализован байесовский&#13;
классификатор. Его обучение проводилось на базе наборов статей 10 различных&#13;
тематик. На основе полученных данных проведена тестовая классификация и&#13;
выполнена проверка корректности данной операции. Материалы статьи&#13;
представляют практическую ценность для тех, кто собирается применить&#13;
рассмотренный алгоритм или подобные ему в своих исследованиях.</p>
      </abstract>
      <trans-abstract xml:lang="en">
        <p>The relevance of the study is conditioned by the need of modern society in the&#13;
automatic classification of data. In this paper, we consider a Bayesian algorithm for the case&#13;
of determining the subject matter of a text. The purpose of the work is to develop, identify and&#13;
solve problems arising during the implementation and work of the classifier, as well as to&#13;
evaluate its effectiveness. Identified problems of arithmetic overflow and the appearance of&#13;
zero probability as a result. Their solution is proposed by means of Laplace smoothing and&#13;
the properties of logarithms. Approaches to optimizing and increasing the speed of the&#13;
program module are also presented. As a result, a Bayesian classifier was implemented. His&#13;
study was conducted on the basis of sets of articles of 10 different subjects. Based on the&#13;
results of analytical and test verification. The materials of the article are of practical value&#13;
for those who are going to apply the algorithm considered or to them in their research.</p>
      </trans-abstract>
      <kwd-group xml:lang="ru">
        <kwd>наивный байесовский классификатор</kwd>
        <kwd>text mining</kwd>
        <kwd>алгоритм</kwd>
        <kwd>теорема  байеса</kwd>
        <kwd>анализ документа</kwd>
      </kwd-group>
      <kwd-group xml:lang="en">
        <kwd>naive bayesian classifier</kwd>
        <kwd>text mining</kwd>
        <kwd>algorithm</kwd>
        <kwd>bayes theorem</kwd>
        <kwd>document analysis</kwd>
      </kwd-group>
      <funding-group>
        <funding-statement xml:lang="ru">Исследование выполнено без спонсорской поддержки.</funding-statement>
        <funding-statement xml:lang="en">The study was performed without external funding.</funding-statement>
      </funding-group>
    </article-meta>
  </front>
  <back>
    <ref-list>
      <title>References</title>
      <ref id="cit1">
        <label>1</label>
        <mixed-citation xml:lang="ru">Text Mining [Электронный ресурс]. – Режим доступа:&#13;
https://sites.google.com/site/upravlenieznaniami/tehnologii-upravleniaznaniami/text-mining-web-mining/text-mining Управление знаниями –&#13;
(Дата обращения: 04.02.2018).</mixed-citation>
      </ref>
      <ref id="cit2">
        <label>2</label>
        <mixed-citation xml:lang="ru">А. С. Епрев Автоматическая классификация текстовых документов. //&#13;
Математические структуры и моделирование 2010, вып. 21, с.65 - 81</mixed-citation>
      </ref>
      <ref id="cit3">
        <label>3</label>
        <mixed-citation xml:lang="ru">Наивный байесовский классификатор [Электронный ресурс]. –&#13;
Режим доступа: http://bazhenov.me/blog/2012/06/11/naive-bayes –&#13;
(Дата обращения: 04.02.2018).</mixed-citation>
      </ref>
      <ref id="cit4">
        <label>4</label>
        <mixed-citation xml:lang="ru">А. А. Алексеев, А. С, Катасёв, А. Е. Кириллов, А. П. Кирпичников&#13;
Классификация текстовых документов на основе Text Minig //&#13;
Вестник технологического университета. 2016. Т.19, №18 стр 116 –&#13;
119.&#13;
</mixed-citation>
      </ref>
      <ref id="cit5">
        <label>5</label>
        <mixed-citation xml:lang="ru">Морфологический анализатор pymorphy2 [Электронный ресурс]. –&#13;
Режим доступа: https://pymorphy2.readthedocs.io/en/latest/ – (Дата&#13;
обращения: 04.02.2018).</mixed-citation>
      </ref>
    </ref-list>
    <fn-group>
      <fn fn-type="conflict">
        <p>The authors declare that there are no conflicts of interest present.</p>
      </fn>
    </fn-group>
  </back>
</article>