References

moitvivt

Моделирование, оптимизация и информационные технологии

Modeling, Optimization and Information Technology

2310-6018

Издательство

10.26102/2310-6018/2026.53.2.005

2169

Практические аспекты построения приватных мультимодальных генеративных моделей: методы, ограничения и инструменты

Practical aspects of building private multimodal generative models: methods, constraints, and tools

0000-0002-6318-2476

Ледовская

Екатерина Валерьевна

Ledovskaya

Ekaterina

ekvaled@mail.ru aff-1

МИРЭА - Российский технологический университет MIREA – Russian Technological University

01 01 2026

1 1

10.26102/2310-6018/2026.53.2.005

2026

This work is licensed under a Creative Commons Attribution 4.0 International License

В статье рассматривается актуальная проблема разработки генеративных систем искусственного интеллекта, способных работать с разнородными данными (текст, изображение, аудио) без нарушения конфиденциальности исходных обучающих наборов. Цель работы – систематизировать и представить с практической точки зрения современные методы обеспечения приватности, применимые к мультимодальным архитектурам. Основное внимание уделяется технологиям дифференциальной приватности и федеративного обучения, их адаптации и композиции для работы со сложными данными. В статье анализируются фундаментальные компромиссы между качеством генерации, вычислительной сложностью и уровнем гарантий конфиденциальности, с которыми сталкивается разработчик на практике. Приводятся примеры существующих программных фреймворков и даются рекомендации по выбору стратегии защиты в зависимости от типа решаемой задачи и характера мультимодальных данных. Дополнительно обсуждаются практические аспекты интеграции приватных механизмов в тренировочные циклы, оценка накопленного бюджета конфиденциальности, а также потенциальные направления развития инструментов для повышения эффективности и надежности AI-систем. Отдельное внимание уделяется вопросам согласования модальностей и оптимизации компромисса между уровнем приватности и качеством генерации. Представленные рекомендации и примеры реализации могут служить руководством для инженеров и исследователей при разработке реальных мультимодальных систем, соответствующих современным требованиям безопасности и этики. Материал статьи ориентирован на исследователей и инженеров в области машинного обучения, занимающихся созданием отвечающих этическим и регуляторным требованиям AI-систем.

The article addresses the pressing issue of developing generative artificial intelligence systems capable of working with heterogeneous data (text, images, audio) without compromising the privacy of the underlying training datasets. The aim of the study is to systematize and present, from a practical perspective, current methods for ensuring privacy applicable to multimodal architectures. Particular attention is paid to differential privacy and federated learning technologies, their adaptation, and their combination for working with complex data. The article analyzes fundamental trade-offs between generation quality, computational complexity, and the level of privacy guarantees faced by developers in practice. Examples of existing software frameworks are provided, along with recommendations for selecting protection strategies depending on the type of task and the nature of the multimodal data. Practical aspects of integrating privacy mechanisms into training cycles, assessing the accumulated privacy budget, and potential directions for developing tools to enhance the efficiency and reliability of AI systems are additionally discussed. Special attention is given to issues of modality alignment and optimizing the trade-off between privacy level and generation quality. The presented recommendations and implementation examples can serve as a guide for engineers and researchers in developing real-world multimodal systems that meet contemporary security and ethical requirements. The material of the article is intended for researchers and engineers in the field of machine learning who are engaged in creating AI systems that comply with ethical and regulatory standards.

генеративные модели мультимодальное машинное обучение конфиденциальность данных дифференциальная приватность (DP) федеративное обучение (FL) компромисс приватность-качество фреймворки машинного обучения устойчивые AI-системы

generative models multimodal machine learning data privacy differential privacy (DP) federated learning (FL) privacy-utility trade-off machine learning frameworks trustworthy AI systems

Исследование выполнено без спонсорской поддержки.

The study was performed without external funding.

References 1

Feretzakis G., Papaspyridis K., Gkoulalas-Divanis A., Verykios V.S. Privacy-Preserving Techniques in Generative AI and Large Language Models: A Narrative Review. Information. 2024;15(11). https://doi.org/10.3390/info15110697

Naseri M., Hayes J., De Cristofaro E. Local and Central Differential Privacy for Robustness and Privacy in Federated Learning. arXiv. URL: https://arxiv.org/abs/2009.03561 [Accessed 25th November 2025].

Sun L., Qian J., Chen X. LDP-FL: Practical Private Aggregation in Federated Learning with Local Differential Privacy. arXiv. URL: https://arxiv.org/abs/2007.15789 [Accessed 25th November 2025].

Rafi T.H., Noor F.A., Hussain T., Chae D.-K. Fairness and Privacy-Preserving in Federated Learning: A Survey. arXiv. URL: https://arxiv.org/abs/2306.08402 [Accessed 25th November 2025].

Zhu L., Chen X. Privacy protection in federated learning: a study on the combined strategy of local and global differential privacy. The Journal of Supercomputing. 2025;81(1). https://doi.org/10.1007/s11227-024-06845-9

Катаев А.В., Власова Ю.М., Гусынин Д.А., Ким В.А. Обзор метрик с целью оценки качества работы генеративных моделей для создания изображений. Инженерный вестник Дона. 2025;(6). URL: http://www.ivdon.ru/ru/magazine/archive/n6y2025/10119

Рабчевский А.Н. Обзор методов и систем генерации синтетических обучающих данных. Прикладная математика и вопросы управления. 2023;(4):6–45.

Xu H., Shrestha Sh., Chen W., Li Zh., Cai Zh. DP-FedLoRA: Privacy-Enhanced Federated Fine-Tuning for On-Device Large Language Models. arXiv. URL: https://arxiv.org/abs/2509.09097 [Accessed 19th December 2025].

Ghalebikesabi S., Berrada L., Gowal S., et al. Differentially Private Diffusion Models Generate Useful Synthetic Images. arXiv. URL: https://arxiv.org/abs/2302.13861 [Accessed 19th December 2025].

McMahan B., Moore E., Ramage D., Hampson S., Agüera-Arcas B. Communication-Efficient Learning of Deep Networks from Decentralized Data. In: Proceedings of the 20th International Conference on Artificial Intelligence and Statistics (AISTATS 2017), 20–22 April 2017, Fort Lauderdale, FL, USA. PMLR; 2017. P. 1273–1282.

The authors declare that there are no conflicts of interest present.