Цифровизация языковых ресурсов малоресурсных языков требует формализованной организации сбора, описания, контроля качества и публикации аудиоданных. В связи с этим целью исследования является разработка модели данных аудиомодуля для ненецко-русского и русско-ненецкого онлайн-словаря и контура поддержки принятия решений, обеспечивающего отбор лексических единиц для записи, их постобработку и интеграцию в словарную систему. Материалы исследования составили корпусные и словарные ресурсы, учебные и тематические материалы, ранее созданные аудиоресурсы, а также результаты полевого исследования, выполненного в Нарьян-Маре в декабре 2025 года. Методическая основа работы включает системный анализ, формализацию информационных потоков, многокритериальную приоритизацию лексики и описание воспроизводимой процессной схемы работы с аудиоматериалами. В результате определены сущности модели данных аудиомодуля, контур контроля качества и контур поддержки принятия решений по развитию аудиопокрытия словаря. Для списка из 542 единиц выполнено профилирование по типам единиц, частям речи, тематикам и микротематикам; дополнительно охарактеризованы состав информантов, структура аудиоматериалов, правила именования файлов и статусы контроля качества. Предложенное решение может использоваться при разработке цифровых словарей и речевых ресурсов для малоресурсных языков.
1. Епимахова А.С., Коканова Е.С. Ненецкий язык в цифровом пространстве. Журнал Сибирского федерального университета. Гуманитарные науки. 2025;18(10):1924–1931. (На англ.).
2. Коканова Е.С., Шняков П.Е. Специфика разработки ненецко-русского и русско-ненецкого онлайн-словаря. Этнопсихолингвистика. 2025;(3):61–75.
3. Malashina A.G. Possibility of Recovering Message Segments Based on Side Information about Original Characters. Doklady Mathematics. 2023;108(S2):S282–S292. https://doi.org/10.1134/S106456242370151X
4. Макарова Е.А. Обработка слабоструктурированных текстовых данных для использования в моделях анализа. Информационные и математические технологии в науке и управлении. 2023;(1):178–189. https://doi.org/10.25729/ESI.2023.29.1.015
5. Петров В.А., Филиппов А.А. Анализ методов классификации текстов на естественном языке. Вестник Ульяновского государственного технического университета. 2024;(3):40–44.
6. Onwujekwe G., Weistroffer H.R. Intelligent Decision Support Systems: An Analysis of the Literature and a Framework for Development. Information Systems Frontiers. 2025;27(5):2027–2058. https://doi.org/10.1007/s10796-024-10571-1
7. Van Kampen A.H.C., Mahamune U., Jongejan A., et al. ENCORE: a practical implementation to improve reproducibility and transparency of computational research. Nature Communications. 2024;15(1). https://doi.org/10.1038/s41467-024-52446-8
8. Dirdal H., Johansen S.H., Durrant Ph. Representativeness and metadata presentation in learner/child corpora: Lessons from the GiG and TRAWL corpora. Research Methods in Applied Linguistics. 2024;3(3). https://doi.org/10.1016/j.rmal.2024.100145
9. Ackoff R.L., Magidson J., Addison H.J. Idealized Design: Creating an Organization’s Future. Upper Saddle River: Wharton School Publishing; 2006. 336 p.
10. Гренобль Л. Новые горизонты в исследовании эвенского языка. Северо-Восточный гуманитарный вестник. 2024;(3):23–31. https://doi.org/10.25693/SVGV.2024.48.3.002
11. Wieczorkowska A. Methodology for Obtaining High-Quality Speech Corpora. Applied Sciences. 2025;15(4). https://doi.org/10.3390/app15041848
12. Gibbon D., Moore R., Winski R. Handbook of Standards and Resources for Spoken Language Systems. Berlin, New York: Mouton de Gruyter; 1997. 886 p.
13. Сабуров А.А., Никифоров А.С., Минчук О.В. Состояние сохранности ненецкого языка в Ненецком автономном округе: по материалам социологического исследования. Арктика и Север. 2023;(50):189–210. https://doi.org/10.37482/issn2221-2698.2023.50.189
Шняков Павел Евгеньевич
Email: p.shnyakov@narfu.ru
WoS | ORCID | РИНЦ |
Северный (Арктический) федеральный университет имени М.В. Ломоносова
Архангельск, Российская Федерация
Коканова Елена Сергеевна
Кандидат филологических наук, доцент
Email: e.s.kokanova@narfu.ru
WoS | Scopus | ORCID | РИНЦ |
Северный (Арктический) федеральный университет имени М.В. Ломоносова
Архангельск, Российская Федерация