<?xml version="1.0" encoding="UTF-8"?>
<article article-type="research-article" dtd-version="1.3" xml:lang="ru" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="https://metafora.rcsi.science/xsd_files/journal3.xsd">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">moitvivt</journal-id>
      <journal-title-group>
        <journal-title xml:lang="ru">Моделирование, оптимизация и информационные технологии</journal-title>
        <trans-title-group xml:lang="en">
          <trans-title>Modeling, Optimization and Information Technology</trans-title>
        </trans-title-group>
      </journal-title-group>
      <issn pub-type="epub">2310-6018</issn>
      <publisher>
        <publisher-name>Издательство</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="doi">10.26102/2310-6018/2026.57.6.001</article-id>
      <article-id pub-id-type="custom" custom-type="elpub">2342</article-id>
      <title-group>
        <article-title xml:lang="ru">Архитектурная модель аудиомодуля онлайн-словаря тундрового ненецкого языка</article-title>
        <trans-title-group xml:lang="en">
          <trans-title>Architectural model of the audio module of the Tundra Nenets online dictionary</trans-title>
        </trans-title-group>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <contrib-id contrib-id-type="orcid">0009-0004-5147-6647</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Шняков</surname>
              <given-names>Павел Евгеньевич</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Shnyakov</surname>
              <given-names>Pavel Yevgenyevich</given-names>
            </name>
          </name-alternatives>
          <email>p.shnyakov@narfu.ru</email>
          <xref ref-type="aff">aff-1</xref>
        </contrib>
        <contrib contrib-type="author">
          <contrib-id contrib-id-type="orcid">0000-0001-6623-5636</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Коканова</surname>
              <given-names>Елена Сергеевна</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Kokanova</surname>
              <given-names>Elena Sergeevna</given-names>
            </name>
          </name-alternatives>
          <email>e.s.kokanova@narfu.ru</email>
          <xref ref-type="aff">aff-2</xref>
        </contrib>
      </contrib-group>
      <aff-alternatives id="aff-1">
        <aff xml:lang="ru">Северный (Арктический) федеральный университет имени М.В. Ломоносова</aff>
        <aff xml:lang="en">Northern (Arctic) Federal University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-2">
        <aff xml:lang="ru">Северный (Арктический) федеральный университет имени М.В. Ломоносова</aff>
        <aff xml:lang="en">Northern (Arctic) Federal University</aff>
      </aff-alternatives>
      <pub-date pub-type="epub">
        <day>01</day>
        <month>01</month>
        <year>2026</year>
      </pub-date>
      <volume>1</volume>
      <issue>1</issue>
      <elocation-id>10.26102/2310-6018/2026.57.6.001</elocation-id>
      <permissions>
        <copyright-statement>Copyright © Авторы, 2026</copyright-statement>
        <copyright-year>2026</copyright-year>
        <license license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/">
          <license-p>This work is licensed under a Creative Commons Attribution 4.0 International License</license-p>
        </license>
      </permissions>
      <self-uri xlink:href="https://moitvivt.ru/ru/journal/article?id=2342"/>
      <abstract xml:lang="ru">
        <p>Цифровизация языковых ресурсов малоресурсных языков требует формализованной организации сбора, описания, контроля качества и публикации аудиоданных. В связи с этим целью исследования является разработка модели данных аудиомодуля для ненецко-русского и русско-ненецкого онлайн-словаря и контура поддержки принятия решений, обеспечивающего отбор лексических единиц для записи, их постобработку и интеграцию в словарную систему. Материалы исследования составили корпусные и словарные ресурсы, учебные и тематические материалы, ранее созданные аудиоресурсы, а также результаты полевого исследования, выполненного в Нарьян-Маре в декабре 2025 года. Методическая основа работы включает системный анализ, формализацию информационных потоков, многокритериальную приоритизацию лексики и описание воспроизводимой процессной схемы работы с аудиоматериалами. В результате определены сущности модели данных аудиомодуля, контур контроля качества и контур поддержки принятия решений по развитию аудиопокрытия словаря. Для списка из 542 единиц выполнено профилирование по типам единиц, частям речи, тематикам и микротематикам; дополнительно охарактеризованы состав информантов, структура аудиоматериалов, правила именования файлов и статусы контроля качества. Предложенное решение может использоваться при разработке цифровых словарей и речевых ресурсов для малоресурсных языков.</p>
      </abstract>
      <trans-abstract xml:lang="en">
        <p>The digitalization of language resources for low-resource languages requires a formal organization of audio data collection, description, quality control, and publication. In this context, the study aims to develop a data model for the audio module of the Tundra Nenets online dictionary, i.e. the Nenets-Russian and Russian-Nenets online dictionary, and a decision support framework for selecting lexical units for recording, post-processing audio materials, and integrating them into the dictionary system. The empirical base includes corpus and dictionary resources, educational and thematic materials, previously created audio resources, and the results of fieldwork conducted in Naryan-Mar in December 2025. The methodological framework combines systems analysis, formalization of information flows, multicriteria prioritization of lexical items, and a reproducible workflow for processing audio materials. The study identifies the core entities of the audio module data model, the quality control framework, and the decision support framework for expanding the dictionary’s audio coverage. A list of 542 units was profiled by unit type, part of speech, theme, and microtheme; the paper also characterizes the composition of informants, the structure of audio materials, file naming conventions, and quality control statuses. The proposed solution can be applied to the development of digital dictionaries and speech resources for low-resource languages.</p>
      </trans-abstract>
      <kwd-group xml:lang="ru">
        <kwd>информационная система</kwd>
        <kwd>онлайн-словарь</kwd>
        <kwd>аудиомодуль</kwd>
        <kwd>поддержка принятия решений</kwd>
        <kwd>метаданные</kwd>
        <kwd>малоресурсный язык</kwd>
        <kwd>тундровый ненецкий язык</kwd>
      </kwd-group>
      <kwd-group xml:lang="en">
        <kwd>information system</kwd>
        <kwd>online dictionary</kwd>
        <kwd>audio module</kwd>
        <kwd>decision support</kwd>
        <kwd>metadata</kwd>
        <kwd>low-resource language</kwd>
        <kwd>Tundra Nenets language</kwd>
      </kwd-group>
      <funding-group>
        <funding-statement xml:lang="ru">Авторы выражают признательность Марине Дмитриевне Люблинской за содействие, поддержку и предоставление доступа к русско-ненецкому озвученному разговорнику, а также носителям ненецкого языка, участвовавшим в пилотном полевом исследовании, за вклад в создание и развитие языкового ресурса. Работа выполнена в рамках проекта (гранта) «Сохранение и развитие тундрового ненецкого языка в цифровой среде».</funding-statement>
        <funding-statement xml:lang="en">The authors express their gratitude to Marina Dmitrievna Lyublinskaya for her assistance, support, and for providing access to the Russian-Nenets audio phrasebook, as well as to the Nenets language speakers who participated in the pilot field study for their contribution to the creation and development of the language resource. The study was carried out within the framework of the project (grant) "Preservation and Development of the Tundra Nenets Language in the Digital Environment".</funding-statement>
      </funding-group>
    </article-meta>
  </front>
  <back>
    <ref-list>
      <title>References</title>
      <ref id="cit1">
        <label>1</label>
        <mixed-citation xml:lang="ru">Епимахова А.С., Коканова Е.С. Ненецкий язык в цифровом пространстве. Журнал Сибирского федерального университета. Гуманитарные науки. 2025;18(10):1924–1931. (На англ.).</mixed-citation>
      </ref>
      <ref id="cit2">
        <label>2</label>
        <mixed-citation xml:lang="ru">Коканова Е.С., Шняков П.Е. Специфика разработки ненецко-русского и русско-ненецкого онлайн-словаря. Этнопсихолингвистика. 2025;(3):61–75.</mixed-citation>
      </ref>
      <ref id="cit3">
        <label>3</label>
        <mixed-citation xml:lang="ru">Malashina A.G. Possibility of Recovering Message Segments Based on Side Information about Original Characters. Doklady Mathematics. 2023;108(S2):S282–S292. https://doi.org/10.1134/S106456242370151X</mixed-citation>
      </ref>
      <ref id="cit4">
        <label>4</label>
        <mixed-citation xml:lang="ru">Макарова Е.А. Обработка слабоструктурированных текстовых данных для использования в моделях анализа. Информационные и математические технологии в науке и управлении. 2023;(1):178–189. https://doi.org/10.25729/ESI.2023.29.1.015</mixed-citation>
      </ref>
      <ref id="cit5">
        <label>5</label>
        <mixed-citation xml:lang="ru">Петров В.А., Филиппов А.А. Анализ методов классификации текстов на естественном языке. Вестник Ульяновского государственного технического университета. 2024;(3):40–44.</mixed-citation>
      </ref>
      <ref id="cit6">
        <label>6</label>
        <mixed-citation xml:lang="ru">Onwujekwe G., Weistroffer H.R. Intelligent Decision Support Systems: An Analysis of the Literature and a Framework for Development. Information Systems Frontiers. 2025;27(5):2027–2058. https://doi.org/10.1007/s10796-024-10571-1</mixed-citation>
      </ref>
      <ref id="cit7">
        <label>7</label>
        <mixed-citation xml:lang="ru">Van Kampen A.H.C., Mahamune U., Jongejan A., et al. ENCORE: a practical implementation to improve reproducibility and transparency of computational research. Nature Communications. 2024;15(1). https://doi.org/10.1038/s41467-024-52446-8</mixed-citation>
      </ref>
      <ref id="cit8">
        <label>8</label>
        <mixed-citation xml:lang="ru">Dirdal H., Johansen S.H., Durrant Ph. Representativeness and metadata presentation in learner/child corpora: Lessons from the GiG and TRAWL corpora. Research Methods in Applied Linguistics. 2024;3(3). https://doi.org/10.1016/j.rmal.2024.100145</mixed-citation>
      </ref>
      <ref id="cit9">
        <label>9</label>
        <mixed-citation xml:lang="ru">Ackoff R.L., Magidson J., Addison H.J. Idealized Design: Creating an Organization’s Future. Upper Saddle River: Wharton School Publishing; 2006. 336 p.</mixed-citation>
      </ref>
      <ref id="cit10">
        <label>10</label>
        <mixed-citation xml:lang="ru">Гренобль Л. Новые горизонты в исследовании эвенского языка. Северо-Восточный гуманитарный вестник. 2024;(3):23–31. https://doi.org/10.25693/SVGV.2024.48.3.002</mixed-citation>
      </ref>
      <ref id="cit11">
        <label>11</label>
        <mixed-citation xml:lang="ru">Wieczorkowska A. Methodology for Obtaining High-Quality Speech Corpora. Applied Sciences. 2025;15(4). https://doi.org/10.3390/app15041848</mixed-citation>
      </ref>
      <ref id="cit12">
        <label>12</label>
        <mixed-citation xml:lang="ru">Gibbon D., Moore R., Winski R. Handbook of Standards and Resources for Spoken Language Systems. Berlin, New York: Mouton de Gruyter; 1997. 886 p.</mixed-citation>
      </ref>
      <ref id="cit13">
        <label>13</label>
        <mixed-citation xml:lang="ru">Сабуров А.А., Никифоров А.С., Минчук О.В. Состояние сохранности ненецкого языка в Ненецком автономном округе: по материалам социологического исследования. Арктика и Север. 2023;(50):189–210. https://doi.org/10.37482/issn2221-2698.2023.50.189</mixed-citation>
      </ref>
    </ref-list>
    <fn-group>
      <fn fn-type="conflict">
        <p>The authors declare that there are no conflicts of interest present.</p>
      </fn>
    </fn-group>
  </back>
</article>