<?xml version="1.0" encoding="UTF-8"?>
<article article-type="research-article" dtd-version="1.3" xml:lang="ru" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="https://metafora.rcsi.science/xsd_files/journal3.xsd">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">moitvivt</journal-id>
      <journal-title-group>
        <journal-title xml:lang="ru">Моделирование, оптимизация и информационные технологии</journal-title>
        <trans-title-group xml:lang="en">
          <trans-title>Modeling, Optimization and Information Technology</trans-title>
        </trans-title-group>
      </journal-title-group>
      <issn pub-type="epub">2310-6018</issn>
      <publisher>
        <publisher-name>Издательство</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="doi">10.26102/2310-6018/2023.42.3.023</article-id>
      <article-id pub-id-type="custom" custom-type="elpub">1413</article-id>
      <title-group>
        <article-title xml:lang="ru">Разработка системы информационного поиска для сопоставления с уровнем техники</article-title>
        <trans-title-group xml:lang="en">
          <trans-title>The development of the information retrieval system for state of art assessment</trans-title>
        </trans-title-group>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author" corresp="yes">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Бобунов</surname>
              <given-names>Артем Владимирович</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Bobunov</surname>
              <given-names>Artem Vladimirovich</given-names>
            </name>
          </name-alternatives>
          <xref ref-type="aff">aff-1</xref>
        </contrib>
        <contrib contrib-type="author" corresp="yes">
          <contrib-id contrib-id-type="orcid">0000-0002-4684-1011</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Коробкин</surname>
              <given-names>Дмитрий Михайлович</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Korobkin</surname>
              <given-names>Dmitry Mikhailovich</given-names>
            </name>
          </name-alternatives>
          <xref ref-type="aff">aff-2</xref>
        </contrib>
        <contrib contrib-type="author" corresp="yes">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Фоменков</surname>
              <given-names>Сергей Алексеевич</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Fomenkov</surname>
              <given-names>Sergey Alekseevich</given-names>
            </name>
          </name-alternatives>
          <xref ref-type="aff">aff-3</xref>
        </contrib>
      </contrib-group>
      <aff-alternatives id="aff-1">
        <aff xml:lang="ru">Волгоградский государственный технический университет</aff>
        <aff xml:lang="en">Volgograd State Technical University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-2">
        <aff xml:lang="ru">Волгоградский государственный технический университет</aff>
        <aff xml:lang="en">Volgograd State Technical University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-3">
        <aff xml:lang="ru">Волгоградский государственный технический университет</aff>
        <aff xml:lang="en">Volgograd State Technical University</aff>
      </aff-alternatives>
      <pub-date pub-type="epub">
        <day>01</day>
        <month>01</month>
        <year>2026</year>
      </pub-date>
      <volume>1</volume>
      <issue>1</issue>
      <elocation-id>10.26102/2310-6018/2023.42.3.023</elocation-id>
      <permissions>
        <copyright-statement>Copyright © Авторы, 2026</copyright-statement>
        <copyright-year>2026</copyright-year>
        <license license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/">
          <license-p>This work is licensed under a Creative Commons Attribution 4.0 International License</license-p>
        </license>
      </permissions>
      <self-uri xlink:href="https://moitvivt.ru/ru/journal/article?id=1413"/>
      <abstract xml:lang="ru">
        <p>Актуальность данного исследования заключается в повышении эффективности извлечения ключевых фраз и слов из русскоязычного патентного массива. В настоящее время эксперты патентного ведомства вынуждены проводить анализ текста патентных заявок вручную, чтобы определить ключевые фразы и слова, которые затем используются для поиска патентов-аналогов. Этот процесс требует значительных временных затрат и может быть подвержен ошибкам. Другая проблема заключается в отсутствии системы, аналогичной Google Patents, но для русскоязычных патентов. В настоящее время не существует надежного и эффективного инструмента для автоматического определения ключевых патентных фраз и слов в русскоязычных патентах. Это ограничивает возможности экспертов при поиске и анализе патентных аналогов, а также при принятии решений о патентовании. Повышение эффективности извлечения ключевых фраз и слов из русскоязычного патентного массива имеет большое практическое значение. Это позволит сократить временные затраты на анализ патентных заявок, повысить точность поиска патентов-аналогов и обеспечить более надежные решения о патентовании. Такой инструмент будет полезен для патентных ведомств, юридических консультантов, инженеров и исследователей, которые работают с русскоязычными патентами. В целом данное исследование обусловлено необходимостью совершенствования и автоматизации процесса анализа патентных заявок, что приведет к повышению эффективности и точности работы с русскоязычным патентным массивом и сделает его более доступным и удобным для пользователей.</p>
      </abstract>
      <trans-abstract xml:lang="en">
        <p>The relevance of this study is due to the need to improve the efficiency of extracting key phrases and words from the Russian-language patent array. Currently, patent office experts have to analyze texts of patent applications manually in order to identify key phrases and words that are then used to search for patent counterparts. This process is time-consuming and can be error-prone. Another problem is the lack of a system similar to Google Patents but for Russian-language patents. Currently, there is no reliable and effective tool for automatic identification of key patent phrases and words in Russian-language patents. This limits the ability of experts to search and analyze patent analogues as well as to make decisions on patenting. Improving the efficiency of extracting key phrases and words from the Russian-language patent array is of great practical importance. This will reduce the time spent on the analysis of patent applications, improve the accuracy of the search for similar patents and provide more reliable patenting solutions. Such a tool will be useful for patent offices, legal consultants, engineers and researchers who work with Russian-language patents. In general, this study is conditioned by the need to improve and automate the process of analyzing patent applications, which will lead to an increase in the efficiency and accuracy of managing the Russian-language patent array and make it more accessible and user-friendly.</p>
      </trans-abstract>
      <kwd-group xml:lang="ru">
        <kwd>патенты</kwd>
        <kwd>патентный поиск</kwd>
        <kwd>извлечение ключевых фраз и слов</kwd>
        <kwd>полнотекстовый поиск</kwd>
        <kwd>HDFS</kwd>
        <kwd>Apache Solr</kwd>
        <kwd>Django</kwd>
        <kwd>keyT5</kwd>
      </kwd-group>
      <kwd-group xml:lang="en">
        <kwd>patents</kwd>
        <kwd>patent search</kwd>
        <kwd>keyword extraction</kwd>
        <kwd>full-text search</kwd>
        <kwd>HDFS</kwd>
        <kwd>Apache Solr</kwd>
        <kwd>Django</kwd>
        <kwd>keyT5</kwd>
      </kwd-group>
      <funding-group>
        <funding-statement xml:lang="ru">Исследование выполнено за счет гранта Российского научного фонда № 23-21-00464, https://rscf.ru/project/23-21-00464/</funding-statement>
        <funding-statement xml:lang="en">The research was funded by a grant from Russian Science Foundation (No. 23-21-00464, https://rscf.ru/project/23-21-00464/).</funding-statement>
      </funding-group>
    </article-meta>
  </front>
  <back>
    <ref-list>
      <title>References</title>
      <ref id="cit1">
        <label>1</label>
        <mixed-citation xml:lang="ru">Жарова А.К. Интеллектуальное право. Защита интеллектуальной собственности. М.: Издательство «Юрайт»; 2023. 379 с.</mixed-citation>
      </ref>
      <ref id="cit2">
        <label>2</label>
        <mixed-citation xml:lang="ru">Ишков А. Д., Степанов А.В. Промышленная собственность. Оформление заявки на выдачу патента на полезную модель. М.: Флинта; 2013. 98 с.</mixed-citation>
      </ref>
      <ref id="cit3">
        <label>3</label>
        <mixed-citation xml:lang="ru">Zhiwei F. Formal Analysis for Natural Language Processing: A Handbook. Singapore, Springer; 2023. 796 p.</mixed-citation>
      </ref>
      <ref id="cit4">
        <label>4</label>
        <mixed-citation xml:lang="ru">Романадзе Е.Л., Судаков В.А., Кислинский В.Г. Разработка метода извлечения ключевых слов на основе вероятностной тематической модели. Моделирование и анализ данных. 2022;12(2). URL: https://psyjournals.ru/journals/mda/archive/2022_n2/Romanadze_et_al. DOI: 10.17759/mda.2022120202 (дата обращения: 22.07.22).</mixed-citation>
      </ref>
      <ref id="cit5">
        <label>5</label>
        <mixed-citation xml:lang="ru">Феногенова А., Тихонова М., Михайлов В. Русский SuperGLUE 1.1: пересмотр уроков, не усвоенных российскими моделями НЛП. ArXiv. 2022; 2202.07791. URL: https://arxiv.org/abs/2202.07791. DOI: 10.28995/2075-7182-2021-20-235-245 (дата обращения: 12.11.2022).</mixed-citation>
      </ref>
      <ref id="cit6">
        <label>6</label>
        <mixed-citation xml:lang="ru">Koitzsch K. Advanced Search Techniques with Hadoop, Lucene, and Solr. In: Pro Hadoop Data Analytics. Berkeley, Apress; 2017. 298 p. DOI: 10.1007/978-1-4842-1910-2.</mixed-citation>
      </ref>
      <ref id="cit7">
        <label>7</label>
        <mixed-citation xml:lang="ru">Wadkar S., Siddalingaiah M. Pro Apache Hadoop. CA: Apress Berkeley; 2014. 413 p. DOI: 10.1007/978-1-4302-4864-4.</mixed-citation>
      </ref>
      <ref id="cit8">
        <label>8</label>
        <mixed-citation xml:lang="ru">Abu-Salih B., Wongthongtham P., Zhu D., Chan K.Y., Rudra A. Introduction to Big Data Technology. Singapore, Springer; 2021. 218 p.</mixed-citation>
      </ref>
      <ref id="cit9">
        <label>9</label>
        <mixed-citation xml:lang="ru">Дудченко П.В. Метрики оценки классификаторов в задачах медицинской диагностики. Молодежь и современные информационные технологии: сборник трудов XVI Международной научно-практической конференции студентов, аспирантов и молодых учёных, 3–7 декабря 2018, Томск. Томск: Изд-во ТПУ; 2019. Режим доступа: http://earchive.tpu.ru/handle/11683/52692 (дата обращения: 12.02.2023).</mixed-citation>
      </ref>
      <ref id="cit10">
        <label>10</label>
        <mixed-citation xml:lang="ru">Николаев А.С. Патентная аналитика: учебно-методическое пособие. СПб: Университет ИТМО; 2022. 98 с.</mixed-citation>
      </ref>
    </ref-list>
    <fn-group>
      <fn fn-type="conflict">
        <p>The authors declare that there are no conflicts of interest present.</p>
      </fn>
    </fn-group>
  </back>
</article>