Глобальный поиск Единое окно поиска по РИД и запросам

Теоретическая система оптимальной диспетчеризации конечных больших моделей

Название НИОКТР Теоретическая система оптимальной диспетчеризации конечных больших моделей
Аннотация Объем бизнеса инференса больших моделей переживает быстрый рост, сталкиваясь с проблемами достижения максимальной конкурентоспособности по соотношению цена-производительность в отрасли. В реальных сетевых операциях последовательности запросов инференса, организованные в хронологическом порядке, демонстрируют различную длину, динамически изменяющиеся распределения запросов, несбалансированную загрузку горячих/холодных экспертов MoE и различные приоритеты запросов. Эти факторы приводят к тому, что оптимальное решение по развертыванию для систем инференса динамически меняется с течением времени, что затрудняет получение оптимальных результатов посредством ограниченной офлайн-оптимизации. Необходимо исследовать оптимальную теорию комбинаторной оптимизации в реальном времени для планирования инференса большой модели. Это включает динамическое моделирование запросов инференса из прошлых периодов и имитацию мелкозернистого временного планирования на основе теории очередей и параллельных методов комбинаторной оптимизации (включая, но не ограничиваясь: случайное планирование, планирование рулетки, пакетно-непрерывное планирование, планирование конвейера PP, гетерогенное планирование ресурсов)/горячее-холодное экспертное распределение ресурсов/планирование отношения PD и т. д. Цель состоит в том, чтобы обеспечить генерацию оптимального решения на уровне минут, поддерживая 20%-ное улучшение использования ресурсов системы инференса. Высокопроизводительная система инференса, созданная большой моделью Дубао, использует гетерогенное оборудование в сочетании с различными стратегиями оптимизации для четырех вычислительных квадрантов, образованных Prefill/Decode и Attention/FFN. Обеспечивая низкую задержку, он значительно повышает пропускную способность, достигая оптимальных показателей TTFT и TPOT, а также снижая общие затраты.
Доступ к ОКОГУ исполнителя True
Количество связанных РИД 0
Количество завершенных ИКРБС 0
Сумма бюджета 13650.835
Дата начала 2025-09-01
Дата окончания 2026-12-01
Номер контракта ТС20250126011-2025-03
Дата контракта 2025-09-01
Количество отчетов 1
УДК 658.512
Количество просмотров 6
Руководитель работы Богданов Александр Владимирович
Руководитель организации Лебедева Елена Витальевна
Исполнитель ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ"
Заказчик Общество с ограниченной ответственностью "Техкомпания Хуавэй"
Федеральная программа Отсутствует
Госпрограмма
Основание НИОКТР Договор со сторонней организацией
Последний статус 2025-11-27 13:05:08 UTC, 2025-11-27 13:05:08 UTC
ОКПД Услуги консультативные по компьютерному оборудованию
Отраслевой сегмент
Минздрав
Межгосударственная целевая программа
Ключевые слова оптимальная диспетчеризация; диспетчеризация; конечные большие модели
Соисполнители
Типы НИОКТР Разработка новых материалов, научно-методических материалов, продуктов, процессов, программ, устройств, типов, элементов, услуг, систем, методов, методик, рекомендаций, предложений, прогнозов
Приоритетные направления
Критические технологии
Рубрикатор 28.23.33 - Аппаратная реализация интеллектуальных систем; 50.47.29 - Автоматизированные системы управления непрерывными технологическими процессами
OECD
OESR Робототехника и автоматическое управление; Электротехника и электроника; Информатика – архитектура и аппаратное обеспечение
Приоритеты научно-технического развития а) переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта;
Регистрационные номера