Разработка методов и алгоритмов обучения с подкреплением для управления мультиагентными системами, использующими различные сценарии взаимодействия между агентами
| Название НИОКТР | Разработка методов и алгоритмов обучения с подкреплением для управления мультиагентными системами, использующими различные сценарии взаимодействия между агентами |
|---|---|
| Аннотация | Целью научного исследования является разработка фундаментальных основ и новых алгоритмов машинного обучения (ML), состоящих в разработке алгоритмов обучения с подкреплением (RL) для управления агентами и их группами в составе мультиагентных систем (МС). Основная цель заключается в развитие методов RL, на основе актор-критик архитектур (PPO, SAC), адаптированных для специфики мультиагентных систем с учётом ограничений коммуникации и динамической среды, для обеспечения баланса между безопасным и рискованным поведением агентов при выполнении физических действий (перемещение в различных условиях, воздействие на объекты интереса и пр.) автономно в составе МС в сложных динамически изменяющихся средах. В рамках выполнения работ планируется решение задач: Задача 1. Разработка RL методов для планирования и управления движением агентов в составе мультиагентной системы (МС), учитывая воздействия окружающей среды и различные сценарии взаимодействия агентов. Задача 2. Разработка RL методов и алгоритмов оптимального обмена информацией между агентами в составе МС для принятия групповых решений в условиях слабой или ограниченной связи. Задача 3. Разработка RL методов обеспечения эффективной координации действий агентов в составе МС, включая механизмы распределения задач. Решение задач предполагает разработку RL методов, сочетающих классические и современные подходы, что позволит избавиться от неопределенности знаний о состоянии среды рабочей зоны агентов МС. Методы расчета оптимальных траекторий будут расширены на случай 3D. Будут разработаны: нейросетевые архитектуры, объединяющие механизмы принятия решений и обмена информацией; перераспределения ролей агентов с учетом оценки знания о текущей обстановке или выходе агента из строя; RL подходы для координации взаимодействия агентов МС путем удержания заданной формации на основе визуальной информации о положении агента-лидера. |
| Доступ к ОКОГУ исполнителя | False |
| Количество связанных РИД | 0 |
| Количество завершенных ИКРБС | 0 |
| Сумма бюджета | 46556.078 |
| Дата начала | 2026-01-01 |
| Дата окончания | 2028-12-31 |
| Номер контракта | 075-03-2026-212 |
| Дата контракта | 2026-01-16 |
| Количество отчетов | 3 |
| УДК | 004.8 |
| Количество просмотров | 1 |
| Руководитель работы | Крамарь Вадим Александрович |
| Руководитель организации | Евстигнеев Максим Павлович |
| Исполнитель | ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "СЕВАСТОПОЛЬСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ" |
| Заказчик | МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ |
| Федеральная программа | Отсутствует |
| Госпрограмма | Фундаментальные и поисковые научные исследования |
| Основание НИОКТР | Государственное задание |
| Последний статус | 2026-02-02 10:16:23 UTC, 2026-02-02 10:16:23 UTC |
| ОКПД | Работы оригинальные научных исследований и экспериментальных разработок в области естественных и технических наук, кроме биотехнологии |
| Отраслевой сегмент | — |
| Минздрав | — |
| Межгосударственная целевая программа | — |
| Ключевые слова | Обучение с подкреплением; Управление группой; Управления агентами; Критерий качества; Мультиагентные системы; Оптимальное управление; Алгоритм машинного обучения |
| Соисполнители | — |
| Типы НИОКТР | Фундаментальное исследование |
| Приоритетные направления | — |
| Критические технологии | — |
| Рубрикатор | 28.23.02 - Общие проблемы искусственного интеллекта |
| OECD | — |
| OESR | Прикладная математика |
| Приоритеты научно-технического развития | а) переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта; |
| Регистрационные номера | — |
