Архитектурная модель аудиомодуля онлайн-словаря тундрового ненецкого языка
Работая с сайтом, я даю свое согласие на использование файлов cookie. Это необходимо для нормального функционирования сайта, показа целевой рекламы и анализа трафика. Статистика использования сайта обрабатывается системой Яндекс.Метрика
Научный журнал Моделирование, оптимизация и информационные технологииThe scientific journal Modeling, Optimization and Information Technology
cетевое издание
issn 2310-6018

Архитектурная модель аудиомодуля онлайн-словаря тундрового ненецкого языка

idШняков П.Е., idКоканова Е.С.

УДК [81’374(=811.511.2):004.89](045)
DOI: 10.26102/2310-6018/2026.57.6.001

  • Аннотация
  • Список литературы
  • Об авторах

Цифровизация языковых ресурсов малоресурсных языков требует формализованной организации сбора, описания, контроля качества и публикации аудиоданных. В связи с этим целью исследования является разработка модели данных аудиомодуля для ненецко-русского и русско-ненецкого онлайн-словаря и контура поддержки принятия решений, обеспечивающего отбор лексических единиц для записи, их постобработку и интеграцию в словарную систему. Материалы исследования составили корпусные и словарные ресурсы, учебные и тематические материалы, ранее созданные аудиоресурсы, а также результаты полевого исследования, выполненного в Нарьян-Маре в декабре 2025 года. Методическая основа работы включает системный анализ, формализацию информационных потоков, многокритериальную приоритизацию лексики и описание воспроизводимой процессной схемы работы с аудиоматериалами. В результате определены сущности модели данных аудиомодуля, контур контроля качества и контур поддержки принятия решений по развитию аудиопокрытия словаря. Для списка из 542 единиц выполнено профилирование по типам единиц, частям речи, тематикам и микротематикам; дополнительно охарактеризованы состав информантов, структура аудиоматериалов, правила именования файлов и статусы контроля качества. Предложенное решение может использоваться при разработке цифровых словарей и речевых ресурсов для малоресурсных языков.

1. Епимахова А.С., Коканова Е.С. Ненецкий язык в цифровом пространстве. Журнал Сибирского федерального университета. Гуманитарные науки. 2025;18(10):1924–1931. (На англ.).

2. Коканова Е.С., Шняков П.Е. Специфика разработки ненецко-русского и русско-ненецкого онлайн-словаря. Этнопсихолингвистика. 2025;(3):61–75.

3. Malashina A.G. Possibility of Recovering Message Segments Based on Side Information about Original Characters. Doklady Mathematics. 2023;108(S2):S282–S292. https://doi.org/10.1134/S106456242370151X

4. Макарова Е.А. Обработка слабоструктурированных текстовых данных для использования в моделях анализа. Информационные и математические технологии в науке и управлении. 2023;(1):178–189. https://doi.org/10.25729/ESI.2023.29.1.015

5. Петров В.А., Филиппов А.А. Анализ методов классификации текстов на естественном языке. Вестник Ульяновского государственного технического университета. 2024;(3):40–44.

6. Onwujekwe G., Weistroffer H.R. Intelligent Decision Support Systems: An Analysis of the Literature and a Framework for Development. Information Systems Frontiers. 2025;27(5):2027–2058. https://doi.org/10.1007/s10796-024-10571-1

7. Van Kampen A.H.C., Mahamune U., Jongejan A., et al. ENCORE: a practical implementation to improve reproducibility and transparency of computational research. Nature Communications. 2024;15(1). https://doi.org/10.1038/s41467-024-52446-8

8. Dirdal H., Johansen S.H., Durrant Ph. Representativeness and metadata presentation in learner/child corpora: Lessons from the GiG and TRAWL corpora. Research Methods in Applied Linguistics. 2024;3(3). https://doi.org/10.1016/j.rmal.2024.100145

9. Ackoff R.L., Magidson J., Addison H.J. Idealized Design: Creating an Organization’s Future. Upper Saddle River: Wharton School Publishing; 2006. 336 p.

10. Гренобль Л. Новые горизонты в исследовании эвенского языка. Северо-Восточный гуманитарный вестник. 2024;(3):23–31. https://doi.org/10.25693/SVGV.2024.48.3.002

11. Wieczorkowska A. Methodology for Obtaining High-Quality Speech Corpora. Applied Sciences. 2025;15(4). https://doi.org/10.3390/app15041848

12. Gibbon D., Moore R., Winski R. Handbook of Standards and Resources for Spoken Language Systems. Berlin, New York: Mouton de Gruyter; 1997. 886 p.

13. Сабуров А.А., Никифоров А.С., Минчук О.В. Состояние сохранности ненецкого языка в Ненецком автономном округе: по материалам социологического исследования. Арктика и Север. 2023;(50):189–210. https://doi.org/10.37482/issn2221-2698.2023.50.189

Шняков Павел Евгеньевич

Email: p.shnyakov@narfu.ru

WoS | ORCID | РИНЦ |

Северный (Арктический) федеральный университет имени М.В. Ломоносова

Архангельск, Российская Федерация

Коканова Елена Сергеевна
Кандидат филологических наук, доцент
Email: e.s.kokanova@narfu.ru

WoS | Scopus | ORCID | РИНЦ |

Северный (Арктический) федеральный университет имени М.В. Ломоносова

Архангельск, Российская Федерация

Ключевые слова: информационная система, онлайн-словарь, аудиомодуль, поддержка принятия решений, метаданные, малоресурсный язык, тундровый ненецкий язык

Источники финансирования: Авторы выражают признательность Марине Дмитриевне Люблинской за содействие, поддержку и предоставление доступа к русско-ненецкому озвученному разговорнику, а также носителям ненецкого языка, участвовавшим в пилотном полевом исследовании, за вклад в создание и развитие языкового ресурса. Работа выполнена в рамках проекта (гранта) «Сохранение и развитие тундрового ненецкого языка в цифровой среде».

Для цитирования: Шняков П.Е., Коканова Е.С. Архитектурная модель аудиомодуля онлайн-словаря тундрового ненецкого языка. Моделирование, оптимизация и информационные технологии. 2026;14(6). URL: https://moitvivt.ru/ru/journal/article?id=2342 DOI: 10.26102/2310-6018/2026.57.6.001

© Шняков П.Е., Коканова Е.С. Статья опубликована на условиях лицензии Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NS 4.0)
20

Полный текст статьи в PDF

Скачать JATS XML

Поступила в редакцию 08.04.2026

Поступила после рецензирования 27.05.2026

Принята к публикации 09.06.2026