Интеграция RAG-системы для автоматизации поиска связей показателей и мероприятий национальных проектов
Работая с сайтом, я даю свое согласие на использование файлов cookie. Это необходимо для нормального функционирования сайта, показа целевой рекламы и анализа трафика. Статистика использования сайта обрабатывается системой Яндекс.Метрика
Научный журнал Моделирование, оптимизация и информационные технологииThe scientific journal Modeling, Optimization and Information Technology
cетевое издание
issn 2310-6018

Интеграция RAG-системы для автоматизации поиска связей показателей и мероприятий национальных проектов

idКаширина И.Л., idКириллов В.В., idАлбычев А.С., idСтаричкова Ю.В., idМагомедов Ш.Г., idЧервяков А.А.

УДК 004.8
DOI: 10.26102/2310-6018/2025.50.3.027

  • Аннотация
  • Список литературы
  • Об авторах

В условиях возрастающей сложности управления Национальными проектами, направленными на достижение Национальных целей развития РФ, актуальной задачей становится автоматизация анализа взаимосвязей между запланированными в рамках этих проектов мероприятиями и показателями, которые отражают степень достижения поставленных в проекте задач. Традиционные методы ручной обработки документов характеризуются высокой трудоемкостью, субъективностью и значительными временными затратами, что обусловливает необходимость разработки интеллектуальных систем поддержки принятия решений. В данной статье представлен подход к автоматизации анализа связей и показателей национальных проектов, который позволяет автоматически выявлять и верифицировать семантические связи «мероприятие-показатель» в документах национальных проектов, значительно повышая эффективность аналитической работы. Данный подход основан на использовании Retrieval-Augmented Generation (RAG) системы, сочетающей локально адаптированную языковую модель с технологиями векторного поиска. Работа демонстрирует, что интеграция RAG-подхода с векторным поиском и учетом онтологии проектов позволяет достичь необходимой точности и релевантности анализа. Особую ценность системе придает не только способность генерировать интерпретируемые обоснования выявленных связей, но и возможность определять ключевые мероприятия, влияющие на достижение показателей сразу нескольких национальных проектов, включая те из них, чье воздействие на реализацию данных показателей неочевидно. Предложенное решение открывает новые возможности для цифровизации государственного управления и может быть адаптировано для других задач, например, определения рисков реализации мероприятий и генерации новых мероприятий.

1. Lewis P., Perez E., Piktus A., et al. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. In: Advances in Neural Information Processing Systems 33: Annual Conference on Neural Information Processing Systems 2020, NeurIPS 2020, 06–12 December 2020, Online. 2020. https://doi.org/10.48550/arXiv.2005.11401

2. Mishra A., Vishwakarma S. Analysis of TF-IDF Model and Its Variant for Document Retrieval. In: 2015 International Conference on Computational Intelligence and Communication Networks (CICN), 02–14 December 2015, Jabalpur, India. IEEE; 2015. P. 772–776. https://doi.org/10.1109/CICN.2015.157

3. Mikolov T., Sutskever I., Chen K., Corrado G.S., Dean J. Distributed Representations of Words and Phrases and Their Compositionality. In: Advances in Neural Information Processing Systems 26: 27th Annual Conference on Neural Information Processing Systems 2013, 05–08 December 2013, Lake Tahoe, NV, USA. 2013. https://doi.org/10.48550/arXiv.1310.4546

4. Ouyang L., Wu J., Jiang X., et al. Training Language Models to Follow Instructions with Human Feedback. In: Advances in Neural Information Processing Systems 35: Annual Conference on Neural Information Processing Systems 2022, NeurIPS 2022, 28 November – 9 December 2022, New Orleans, LA, USA. 2022. https://doi.org/10.48550/arXiv.2203.02155

5. Guu K., Lee K., Tung Z., Pasupat P., Chang M.-W. REALM: Retrieval-Augmented Language Model Pre-Training. arXiv. URL: https://doi.org/10.48550/arXiv.2002.08909 [Accessed 13th May 2025].

6. Gao Yu., Xiong Yu., Gao X., et al. Retrieval-Augmented Generation for Large Language Models: A Survey. arXiv. URL: https://doi.org/10.48550/arXiv.2312.10997 [Accessed 13th May 2025].

7. Brown T.B., Mann B., Ryder N., et al. Language Models are Few-Shot Learners. In: Advances in Neural Information Processing Systems 33: Annual Conference on Neural Information Processing Systems 2020, NeurIPS 2020, 06–12 December 2020, Online. 2020. https://doi.org/10.48550/arXiv.2005.14165

8. Eremeev M., Vorontsov K.V. Lexical Quantile-Based Text Complexity Measure. In: Proceedings of the International Conference on Recent Advances in Natural Language Processing, RANLP 2019, 02–04 September 2019, Varna, Bulgaria. INCOMA Ltd.; 2019. P. 270–275. https://doi.org/10.26615/978-954-452-056-4_031

9. Jin R., Du J., Huang W., et al. A Comprehensive Evaluation of Quantization Strategies for Large Language Models. In: Findings of the Association for Computational Linguistics, ACL 2024, 11–16 August 2024, Bangkok, Thailand. Association for Computational Linguistics; 2014. P. 12186–12215.

10. Izacard G., Grave E. Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering. In: Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume, EACL 2021, 19–23 April 2021, Online. Association for Computational Linguistics; 2021. P. 874–880. https://doi.org/10.48550/arXiv.2007.01282

Каширина Ирина Леонидовна
Доктор технических наук, профессор

WoS | Scopus | ORCID | РИНЦ |

МИРЭА - Российский технологический университет

Москва, Российская Федерация

Кириллов Вадим Витальевич

ORCID |

МИРЭА – Российский технологический университет

Москва, Российская Федерация

Албычев Александр Сергеевич

ORCID |

Федеральное Казначейство
МИРЭА - Российский технологический университет

Москва, Российская Федерация

Старичкова Юлия Викторовна
Кандидат технических наук, доцент

ORCID |

МИРЭА - Российский технологический университет

Москва, Российская Федерация

Магомедов Шамиль Гасангусейнович
Доктор технических наук, доцент

ORCID |

МИРЭА - Российский технологический университет

Москва, Российская Федерация

Червяков Александр Александрович
Кандидат технических наук

ORCID |

Федеральное Казначейство

Москва, Российская Федерация

Ключевые слова: RAG-системы, большие языковые модели, национальные проекты, семантический поиск, автоматизация, национальные цели, искусственный интеллект в государственном управлении

Для цитирования: Каширина И.Л., Кириллов В.В., Албычев А.С., Старичкова Ю.В., Магомедов Ш.Г., Червяков А.А. Интеграция RAG-системы для автоматизации поиска связей показателей и мероприятий национальных проектов. Моделирование, оптимизация и информационные технологии. 2025;13(3). URL: https://moitvivt.ru/ru/journal/pdf?id=2001 DOI: 10.26102/2310-6018/2025.50.3.027

46

Полный текст статьи в PDF

Поступила в редакцию 18.06.2025

Поступила после рецензирования 11.07.2025

Принята к публикации 29.07.2025