<?xml version="1.0" encoding="UTF-8"?>
<article article-type="research-article" dtd-version="1.3" xml:lang="ru" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="https://metafora.rcsi.science/xsd_files/journal3.xsd">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">moitvivt</journal-id>
      <journal-title-group>
        <journal-title xml:lang="ru">Моделирование, оптимизация и информационные технологии</journal-title>
        <trans-title-group xml:lang="en">
          <trans-title>Modeling, Optimization and Information Technology</trans-title>
        </trans-title-group>
      </journal-title-group>
      <issn pub-type="epub">2310-6018</issn>
      <publisher>
        <publisher-name>Издательство</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="doi">10.26102/2310-6018/2018.23.4.011</article-id>
      <article-id pub-id-type="custom" custom-type="elpub">521</article-id>
      <title-group>
        <article-title xml:lang="ru">ПОСТРОЕНИЕ ЛОГИЧЕСКОГО АЛГОРИТМА ВЫЯВЛЕНИЯ ВЫБРОСОВ В ЗАШУМЛЕННЫХ ДАННЫХ</article-title>
        <trans-title-group xml:lang="en">
          <trans-title>CONSTRUCTION OF A LOGICAL ALGORITHM FOR DETECTING EMISSIONS INTO A DISTURBABLE DATA</trans-title>
        </trans-title-group>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author" corresp="yes">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Лютикова</surname>
              <given-names>Лариса Адольфовна</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Lutikova</surname>
              <given-names>Larisa Adolfovna</given-names>
            </name>
          </name-alternatives>
          <email>lylarisa@yandex.ru</email>
          <xref ref-type="aff">aff-1</xref>
        </contrib>
      </contrib-group>
      <aff-alternatives id="aff-1">
        <aff xml:lang="ru">Кабардино-Балкарский научный центр РАН</aff>
        <aff xml:lang="en">Institute of Applied Mathematics and Automation of Kabardino-Balkarian Scientific Center</aff>
      </aff-alternatives>
      <pub-date pub-type="epub">
        <day>01</day>
        <month>01</month>
        <year>2026</year>
      </pub-date>
      <volume>1</volume>
      <issue>1</issue>
      <elocation-id>10.26102/2310-6018/2018.23.4.011</elocation-id>
      <permissions>
        <copyright-statement>Copyright © Авторы, 2026</copyright-statement>
        <copyright-year>2026</copyright-year>
        <license license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/">
          <license-p>This work is licensed under a Creative Commons Attribution 4.0 International License</license-p>
        </license>
      </permissions>
      <self-uri xlink:href="https://moitvivt.ru/ru/journal/article?id=521"/>
      <abstract xml:lang="ru">
        <p>В работе предложен логический подход к анализу качества данных для решения задач&#13;
машинного обучения. При разработке алгоритмов машинного обучения часть&#13;
исходных данных решаемой задачи объединяют в обучающую выборку. Как правило,&#13;
качество этих данных не вляется идиальным, и это дастаточно острая проблема&#13;
возникающая при построении обучающих систем распознавания. Так как построение&#13;
модели распознования является результатом последовательного предъявления&#13;
исходного набора данных, то их некорректность может существенно искозить&#13;
конечную модель, что скакжется на результатах работы алгоритмов распознования.&#13;
Данные, которые вносят искажения при построении модели называют выбросами.&#13;
Причиной возникновения выбросов являются помехи аппаратуры, неверная&#13;
интерпритация эксперта, шумы и т.д. В связи с этим возникает задача анализа&#13;
данных на предмет выявления выбросов и ослобления их влияния на процесс&#13;
формирования (обучения) рабочей модели. В то же время важно отделять&#13;
индивидуальные особенности распозноваемых объектов от аномальных данных. В&#13;
настоящей работе предложены логические методы анализа данных, позволяющие&#13;
провести классификацию данных. В качестве функции классификатора строится&#13;
функция, которая является логической комбинацией продукионных правил. Она&#13;
решает ряд проблем, строит все возможные классы, выявляет индивидуальные&#13;
характеристики объектов, входящих во множество данных, выявляет объекты и их&#13;
признаки, которые являются выросами. Основываясь на результатах работы&#13;
построенного классификатора можно выявленные подозрительные объекты&#13;
дополнительно исследовать на предмет принадлежности множеству выбросов с&#13;
учетом полученной оценки. Предложенный подход позволяет не только произвести&#13;
обучающей выборки на классы, но и выявить выбросы, объекты, которые не могут&#13;
выступать в качестве эталонов обучающей выборки. Предложенный в настоящей&#13;
работе метод может служить основой для построения процедуры, повышающей&#13;
информативное качество обучающей выборки в исследуемой предметной области.</p>
      </abstract>
      <trans-abstract xml:lang="en">
        <p>The paper proposes a logical approach to data quality analysis for solving machine-learning&#13;
problems. When developing machine-learning algorithms, a part of the initial data of the&#13;
problem being solved is combined into a training sample. As a rule, the quality of this data is&#13;
not ideal, and this is a rather acute problem arising in the construction of training&#13;
recognition systems. Since the construction of the recognition model is the result of the&#13;
sequential presentation of the initial data set, their incorrectness can significantly distort the&#13;
final model, which stresses the results of the recognition algorithms. The data that introduce&#13;
distortions in building a model is called outliers. The cause of emissions is the interference of&#13;
the equipment, incorrect interpretation of the expert, noise, etc. In this regard, the task of&#13;
analyzing data to identify emissions and reducing their influence on the process of formation&#13;
(training) of the working model arises. At the same time, it is important to separate the&#13;
individual features of recognized objects from abnormal data. In the present work, logical&#13;
methods of data analysis are proposed, allowing data to be classified. As a classifier function,&#13;
a function is constructed that is a logical combination of production rules. It solves a number&#13;
of problems, builds all possible classes, reveals the individual characteristics of objects&#13;
included in the data set, identifies objects and their signs that are grown. Based on the results&#13;
of the constructed classifier, the identified suspicious objects can be additionally investigated&#13;
for belonging to a set of emissions, taking into account the obtained estimate. The proposed&#13;
approach allows not only to make a training sample for classes, but also to identify emissions,&#13;
objects that can not act as standards of the training sample. The method proposed in this&#13;
paper can serve as the basis for constructing a procedure that enhances the informative&#13;
quality of a training sample in the pre-project area under study.</p>
      </trans-abstract>
      <kwd-group xml:lang="ru">
        <kwd>объект</kwd>
        <kwd>класс</kwd>
        <kwd>база знаний</kwd>
        <kwd>выбросы</kwd>
        <kwd>информативный вес</kwd>
      </kwd-group>
      <kwd-group xml:lang="en">
        <kwd>object</kwd>
        <kwd>class</kwd>
        <kwd>knowledge base</kwd>
        <kwd>emissions</kwd>
        <kwd>informative weight</kwd>
      </kwd-group>
      <funding-group>
        <funding-statement xml:lang="ru">Исследование выполнено без спонсорской поддержки.</funding-statement>
        <funding-statement xml:lang="en">The study was performed without external funding.</funding-statement>
      </funding-group>
    </article-meta>
  </front>
  <back>
    <ref-list>
      <title>References</title>
      <ref id="cit1">
        <label>1</label>
        <mixed-citation xml:lang="ru">Дьякoнoв A.Г., Гoлoвина A.M. Выявление аномалий в работе&#13;
механизмов методами машинного обучения//Аналитика и управление&#13;
данными в областях с интенсивным использованием данных: труды&#13;
XIX Международной конференции DAMDID/RCDL'2017,2017. С. 469–&#13;
476.</mixed-citation>
      </ref>
      <ref id="cit2">
        <label>2</label>
        <mixed-citation xml:lang="ru">Журавлёв Ю.И. Об алгебраическом подходе к решению задач&#13;
распознавания или классификации//Проблемы кибернетики. 1978. Т. 33.&#13;
С. 5–68.</mixed-citation>
      </ref>
      <ref id="cit3">
        <label>3</label>
        <mixed-citation xml:lang="ru">Лютикoва Л.А., Шматoва Е.В. Анализ и синтез алгоритмов&#13;
распознавания образов с использованием переменно-значной логики //&#13;
Информационные технологии. №4. Том 22. 2016. С. 292—297.</mixed-citation>
      </ref>
      <ref id="cit4">
        <label>4</label>
        <mixed-citation xml:lang="ru">Лютикова Л.А., Шматoва Е.В. Логический подход к коррекции&#13;
результатов работы $\Sigma\Pi$-нейронных сетей//Информационные&#13;
технологии. 2018. Т. 24. №2. С. 110-116.</mixed-citation>
      </ref>
      <ref id="cit5">
        <label>5</label>
        <mixed-citation xml:lang="ru">Шибзухoв З.М. O принципе минимизации эмпирического риска на&#13;
основе усредняющих агрегирующих функций//Доклады РАН. 2017.&#13;
Т.476. №5. C. 495-499.</mixed-citation>
      </ref>
      <ref id="cit6">
        <label>6</label>
        <mixed-citation xml:lang="ru">Флax П. Машиннoе обучение. Наука и искусство пoстрoения&#13;
алгoритмoв, которые извлекают знания из данных. М.: МДК Прecc,&#13;
2015. 400 c.</mixed-citation>
      </ref>
    </ref-list>
    <fn-group>
      <fn fn-type="conflict">
        <p>The authors declare that there are no conflicts of interest present.</p>
      </fn>
    </fn-group>
  </back>
</article>