Разработка методов и алгоритмов обучения с подкреплением для управления мультиагентными системами, использующими различные сценарии взаимодействия между агентами

Название НИОКТР	Разработка методов и алгоритмов обучения с подкреплением для управления мультиагентными системами, использующими различные сценарии взаимодействия между агентами
Аннотация	Целью научного исследования является разработка фундаментальных основ и новых алгоритмов машинного обучения (ML), состоящих в разработке алгоритмов обучения с подкреплением (RL) для управления агентами и их группами в составе мультиагентных систем (МС). Основная цель заключается в развитие методов RL, на основе актор-критик архитектур (PPO, SAC), адаптированных для специфики мультиагентных систем с учётом ограничений коммуникации и динамической среды, для обеспечения баланса между безопасным и рискованным поведением агентов при выполнении физических действий (перемещение в различных условиях, воздействие на объекты интереса и пр.) автономно в составе МС в сложных динамически изменяющихся средах. В рамках выполнения работ планируется решение задач: Задача 1. Разработка RL методов для планирования и управления движением агентов в составе мультиагентной системы (МС), учитывая воздействия окружающей среды и различные сценарии взаимодействия агентов. Задача 2. Разработка RL методов и алгоритмов оптимального обмена информацией между агентами в составе МС для принятия групповых решений в условиях слабой или ограниченной связи. Задача 3. Разработка RL методов обеспечения эффективной координации действий агентов в составе МС, включая механизмы распределения задач. Решение задач предполагает разработку RL методов, сочетающих классические и современные подходы, что позволит избавиться от неопределенности знаний о состоянии среды рабочей зоны агентов МС. Методы расчета оптимальных траекторий будут расширены на случай 3D. Будут разработаны: нейросетевые архитектуры, объединяющие механизмы принятия решений и обмена информацией; перераспределения ролей агентов с учетом оценки знания о текущей обстановке или выходе агента из строя; RL подходы для координации взаимодействия агентов МС путем удержания заданной формации на основе визуальной информации о положении агента-лидера.
Доступ к ОКОГУ исполнителя	False
Количество связанных РИД	0
Количество завершенных ИКРБС	0
Сумма бюджета	46556.078
Дата начала	2026-01-01
Дата окончания	2028-12-31
Номер контракта	075-03-2026-212
Дата контракта	2026-01-16
Количество отчетов	3
УДК	004.8
Количество просмотров	1
Руководитель работы	Крамарь Вадим Александрович
Руководитель организации	Евстигнеев Максим Павлович
Исполнитель	ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "СЕВАСТОПОЛЬСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ"
Заказчик	МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральная программа	Отсутствует
Госпрограмма	Фундаментальные и поисковые научные исследования
Основание НИОКТР	Государственное задание
Последний статус	2026-02-02 10:16:23 UTC, 2026-02-02 10:16:23 UTC
ОКПД	Работы оригинальные научных исследований и экспериментальных разработок в области естественных и технических наук, кроме биотехнологии
Отраслевой сегмент	—
Минздрав	—
Межгосударственная целевая программа	—
Ключевые слова	Обучение с подкреплением; Управление группой; Управления агентами; Критерий качества; Мультиагентные системы; Оптимальное управление; Алгоритм машинного обучения
Соисполнители	—
Типы НИОКТР	Фундаментальное исследование
Приоритетные направления	—
Критические технологии	—
Рубрикатор	28.23.02 - Общие проблемы искусственного интеллекта
OECD	—
OESR	Прикладная математика
Приоритеты научно-технического развития	а) переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта;
Регистрационные номера	—