<?xml version="1.0" encoding="UTF-8"?>
<article article-type="research-article" dtd-version="1.3" xml:lang="ru" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="https://metafora.rcsi.science/xsd_files/journal3.xsd">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">moitvivt</journal-id>
      <journal-title-group>
        <journal-title xml:lang="ru">Моделирование, оптимизация и информационные технологии</journal-title>
        <trans-title-group xml:lang="en">
          <trans-title>Modeling, Optimization and Information Technology</trans-title>
        </trans-title-group>
      </journal-title-group>
      <issn pub-type="epub">2310-6018</issn>
      <publisher>
        <publisher-name>Издательство</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="doi">10.26102/2310-6018/2024.47.4.026</article-id>
      <article-id pub-id-type="custom" custom-type="elpub">1748</article-id>
      <title-group>
        <article-title xml:lang="ru">Метод подготовки данных по научным публикациям для интеллектуальной поддержки принятия решений при оценке экспертности рецензентов</article-title>
        <trans-title-group xml:lang="en">
          <trans-title>Method of preparing data on scientific publications for intelligent decision-making support in evaluating expertise of peer reviewers</trans-title>
        </trans-title-group>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <contrib-id contrib-id-type="orcid">0000-0003-3063-105X</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Латыпова</surname>
              <given-names>Виктория Александровна</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Latypova</surname>
              <given-names>Viktoriya Aleksandrovna</given-names>
            </name>
          </name-alternatives>
          <email>vikalaty@yandex.ru</email>
          <xref ref-type="aff">aff-1</xref>
        </contrib>
      </contrib-group>
      <aff-alternatives id="aff-1">
        <aff xml:lang="ru">Уфимский университет науки и технологий</aff>
        <aff xml:lang="en">Ufa University of Science and Technology</aff>
      </aff-alternatives>
      <pub-date pub-type="epub">
        <day>01</day>
        <month>01</month>
        <year>2026</year>
      </pub-date>
      <volume>1</volume>
      <issue>1</issue>
      <elocation-id>10.26102/2310-6018/2024.47.4.026</elocation-id>
      <permissions>
        <copyright-statement>Copyright © Авторы, 2026</copyright-statement>
        <copyright-year>2026</copyright-year>
        <license license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/">
          <license-p>This work is licensed under a Creative Commons Attribution 4.0 International License</license-p>
        </license>
      </permissions>
      <self-uri xlink:href="https://moitvivt.ru/ru/journal/article?id=1748"/>
      <abstract xml:lang="ru">
        <p>Одним из основных факторов при назначении рецензента является его экспертность по теме рукописи (наличие соответствующих публикаций). Поддержка принятия решений, базирующаяся на применении интеллектуального анализа данных наукометрических баз по научным публикациям, ускоряет и делает менее трудоемким процесс оценки экспертности рецензентов. Однако критическим пунктом в данном случае является корректность данных по научным публикациям, подвергающихся интеллектуальному анализу. В настоящий момент исследователи активно занимаются вопросом определения корректности данных наукометрических баз и способам ее обеспечения, осуществляя различные процедуры очистки в рамках подготовки данных. Тем не менее, в существующих работах не учитывается специфика задачи, для решения которой собираются данные по научным публикациям. Для решения данной проблемы в статье предлагается метод подготовки данных по научным публикациям для интеллектуальной поддержки принятия решений при оценке экспертности рецензентов, учитывающий особенности, связанные с необходимостью определения семантической близости текста данных по публикациям. Метод успешно апробирован при подготовке данных по научным публикациям членов редколлегии журнала «Системная инженерия и информационные технологии» с привлечением содержимого их профилей в наукометрических базах «РИНЦ» и «Академия Google».</p>
      </abstract>
      <trans-abstract xml:lang="en">
        <p>One of the main factors in assigning a peer reviewer is his expertise on the manuscript topic (the existence of the relevant publicatios). Decision-making support, based on the usage of mining scientometric base data on scientific publications, speeds up the process of evaluating the expertise of peer reviewers and makes it less time-consuming. However, the critical point in this case is the correctness of the data on scientific publications subject to intellectual analysis. At present, researchers actively deal with the question of defining the scientometric base data correctness and means of ensuring it, conducting different procedures of cleaning within data preparation. Yet in the existing works, the specifics of the task, for which data on scientific publications are gathered, is not taken into account. To address the problem, a method of preparing data on scientific publications for intelligent decision-making support in evaluating expertise of peer reviewers, considering features associated with the need to define the semantic similarity of text of data on publications, is suggested in the paper. The method was successfully tested when preparing data on scientific publications of members of the academic journal “Systems Engineering and Information Technologies” editorial board, involving the content of their profiles in scientometric bases “RISC” and “Google Scholar”.</p>
      </trans-abstract>
      <kwd-group xml:lang="ru">
        <kwd>подготовка данных</kwd>
        <kwd>поддержка принятия решений</kwd>
        <kwd>интеллектуальный анализ данных</kwd>
        <kwd>рецензент</kwd>
        <kwd>научная публикация</kwd>
      </kwd-group>
      <kwd-group xml:lang="en">
        <kwd>data preparation</kwd>
        <kwd>decision-making support</kwd>
        <kwd>data mining</kwd>
        <kwd>peer reviewer</kwd>
        <kwd>scientific publication</kwd>
      </kwd-group>
      <funding-group>
        <funding-statement xml:lang="ru">Исследование выполнено без спонсорской поддержки.</funding-statement>
        <funding-statement xml:lang="en">The study was performed without external funding.</funding-statement>
      </funding-group>
    </article-meta>
  </front>
  <back>
    <ref-list>
      <title>References</title>
      <ref id="cit1">
        <label>1</label>
        <mixed-citation xml:lang="ru">Sharifyanov N., Latypova V. A Method of Filling Missing Values in Data using Data Mining. In: 2023 IX International Conference on Information Technology and Nanotechnology (ITNT), 17–21 April 2023, Samara, Russian Federation. IEEE; 2023. pp. 1–5. https://doi.org/10.1109/ITNT57377.2023.10139280</mixed-citation>
      </ref>
      <ref id="cit2">
        <label>2</label>
        <mixed-citation xml:lang="ru">Okafor N.U., Delaney D.T. Missing Data Imputation on IoT Sensor Networks: Implications for on-Site Sensor Calibration. IEEE Sensors Journal. 2021;21(20):22833–22845. https://doi.org/10.1109/JSEN.2021.3105442</mixed-citation>
      </ref>
      <ref id="cit3">
        <label>3</label>
        <mixed-citation xml:lang="ru">McCombe N., Liu S., Ding X., Prasad G., Bucholc M., Finn D.P. Practical Strategies for Extreme Missing Data Imputation in Dementia Diagnosis. IEEE Journal of Biomedical and Health Informatics. 2022;26(2):818–827. https://doi.org/10.1109/JBHI.2021.3098511</mixed-citation>
      </ref>
      <ref id="cit4">
        <label>4</label>
        <mixed-citation xml:lang="ru">Шарифьянов Н.В., Латыпова В.А. Формирование данных в фиксациях моделей нефтегазовых скважин на основе применения интеллектуального метода заполнения пропущенных значений. Моделирование, оптимизация и информационные технологии. 2023;11(2). https://doi.org/10.26102/2310-6018/2023.41.2.022</mixed-citation>
      </ref>
      <ref id="cit5">
        <label>5</label>
        <mixed-citation xml:lang="ru">Hunko M., Tkachov V., Liashenko O., Rabčan J. Application Architecture For Obtaining Data From Scientometric Databases. In: 2022 IEEE 3rd KhPI Week on Advanced Technology (KhPIWeek), 03–07 October 2022, Kharkiv, Ukraine. IEEE; 2022. pp. 1–4. https://doi.org/10.1109/KhPIWeek57572.2022.9916398</mixed-citation>
      </ref>
      <ref id="cit6">
        <label>6</label>
        <mixed-citation xml:lang="ru">Wan H., Zhang Y., Zhang J., Tang J. AMiner: Search and Mining of Academic Social Networks. Data Intelligence. 2019;1(1):58–76. https://doi.org/10.1162/dint_a_00006</mixed-citation>
      </ref>
      <ref id="cit7">
        <label>7</label>
        <mixed-citation xml:lang="ru">Sauvayre R. Types of Errors Hiding in Google Scholar Data. Journal of Medical Internet Research. 2022;24(5). https://doi.org/10.2196/28354</mixed-citation>
      </ref>
      <ref id="cit8">
        <label>8</label>
        <mixed-citation xml:lang="ru">Van Eck N.J., Waltman L. Accuracy of citation data in Web of Science and Scopus. ArXiv. URL: https://doi.org/10.48550/arXiv.1906.07011 [Accessed 10th August 2024].</mixed-citation>
      </ref>
      <ref id="cit9">
        <label>9</label>
        <mixed-citation xml:lang="ru">Selivanova I.V., Kosyakov D.V., Guskov A.E. The Impact of Errors in the Sсopus Database on the Research Assessment. Scientific and Technical Information Processing. 2019;46(3):204–212. https://doi.org/10.3103/S0147688219030109</mixed-citation>
      </ref>
      <ref id="cit10">
        <label>10</label>
        <mixed-citation xml:lang="ru">Zhang J., Tang J. Name disambiguation in AMiner.  Science China Information Sciences. 2020;64(4). https://doi.org/10.1007/s11432-019-9884-y</mixed-citation>
      </ref>
      <ref id="cit11">
        <label>11</label>
        <mixed-citation xml:lang="ru">Zhang Y., Zhang F., Yao P., Tang J. Name Disambiguation in AMiner: Clustering, Maintenance, and Human in the Loop. In: KDD '18: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery &amp; Data Mining, 19–23 August 2018, London, United Kingdom. New York: Association for Computing Machinery; 2018. pp. 1002–1011. https://doi.org/10.1145/3219819.3219859</mixed-citation>
      </ref>
      <ref id="cit12">
        <label>12</label>
        <mixed-citation xml:lang="ru">Müller M.-C., Reitz F., Roy N. Data sets for author name disambiguation: an empirical analysis and a new resource. Scientometrics. 2017;111(3):1467–1500. https://doi.org/10.1007/s11192-017-2363-5</mixed-citation>
      </ref>
      <ref id="cit13">
        <label>13</label>
        <mixed-citation xml:lang="ru">Maddi A., Baudoin L. The quality of the web of science data: a longitudinal study on the completeness of authors-addresses links. Scientometrics. 2022;127(11):6279–6292. https://doi.org/10.1007/s11192-022-04525-0</mixed-citation>
      </ref>
      <ref id="cit14">
        <label>14</label>
        <mixed-citation xml:lang="ru">Liu W., Hu G., Tang L. Missing author address information in Web of Science – An explorative study. Journal of Informetrics. 2018;12(3):985–997. https://doi.org/10.1016/j.joi.2018.07.008</mixed-citation>
      </ref>
      <ref id="cit15">
        <label>15</label>
        <mixed-citation xml:lang="ru">Аксентьева М.С., Чебуков Д.Е. Влияние ошибок в списках литературы в базе данных Web of Science на цитируемость и импакт-фактор научных журналов. В сборнике: Научное издание международного уровня – 2019: стратегия и тактика управления и развития: Материалы 8-й Международной научно-практической конференции, 23–26 апреля 2019 года, Москва, Россия. Екатеринбург: Изд-во Урал. ун-та; 2019. С. 7–16. https://doi.org/10.24069/konf-23-26-04-2019.01</mixed-citation>
      </ref>
      <ref id="cit16">
        <label>16</label>
        <mixed-citation xml:lang="ru">Cioffi A., Coppini S., Massari A., Moretti A., Peroni S., Santini C., Asadi N.S. Identifying and correcting invalid citations due to DOI errors in Crossref data. Scientometrics. 2022;127(6):3593–3612. https://doi.org/10.1007/s11192-022-04367-w</mixed-citation>
      </ref>
      <ref id="cit17">
        <label>17</label>
        <mixed-citation xml:lang="ru">Rodrigues D., Lopes A.L., Batista F. Web of Science Citation Gaps: An Automatic Approach to Detect Indexed but Missing Citations. In: 12th Symposium on Languages, Applications and Technologies (SLATE 2023), 26–28 June 2023, Vila do Conde, Portugal. Schloss Dagstuhl – Leibniz-Zentrum für Informatik; 2023. pp. 5:1–5:11. https://doi.org/10.4230/OASIcs.SLATE.2023.5</mixed-citation>
      </ref>
      <ref id="cit18">
        <label>18</label>
        <mixed-citation xml:lang="ru">Латыпова В.А. Метод поддержки принятия решений при многокритериальном выборе рецензентов с использованием интегральной оценки и методов обработки естественного языка в научном журнале. Моделирование, оптимизация и информационные технологии. 2023;11(4). https://doi.org/10.26102/2310-6018/2023.43.4.035</mixed-citation>
      </ref>
      <ref id="cit19">
        <label>19</label>
        <mixed-citation xml:lang="ru">Schock C., Dumler J., Doepper F. Data Acquisition and Preparation – Enabling Data Analytics Projects within Production. Procedia CIRP. 2021;104:636–640. https://doi.org/10.1016/j.procir.2021.11.107</mixed-citation>
      </ref>
      <ref id="cit20">
        <label>20</label>
        <mixed-citation xml:lang="ru">Гринёв А.В. Проблемы наукометрии и ее пригодность для управления научной деятельностью в современной России. Управленческие науки. 2024;14(1):117–132. https://doi.org/10.26794/2404-022X-2024-14-1-117-132</mixed-citation>
      </ref>
      <ref id="cit21">
        <label>21</label>
        <mixed-citation xml:lang="ru">López-Cózar E.D., Orduna-Malea E., Martín-Martín A., Ayllón J.M. Google Scholar: The Big Data Bibliographic Tool. In: Research Analytics. Boosting University Productivity and Competitiveness through Scientometrics: Chapter 4. New York: Auerbach Publications; 2017. pp. 59–80. https://doi.org/10.1201/9781315155890-4</mixed-citation>
      </ref>
    </ref-list>
    <fn-group>
      <fn fn-type="conflict">
        <p>The authors declare that there are no conflicts of interest present.</p>
      </fn>
    </fn-group>
  </back>
</article>