Глобальный поиск Единое окно поиска по РИД и запросам

Техническое задание (ТЗ № 8) № ТС20250126011-2025-08 к Проекту Хуавэй по Соглашению о совместной лаборатории № TC20250126011 от 1 апреля 2025 г

Название НИОКТР Техническое задание (ТЗ № 8) № ТС20250126011-2025-08 к Проекту Хуавэй по Соглашению о совместной лаборатории № TC20250126011 от 1 апреля 2025 г
Аннотация Большие модели вступили в эпоху открытого исходного кода, период итерации сократился, и новые модели загружаются одна за другой. В результате эффективность и точность моделирования нагрузки становятся узкими местами. Первоначальный коэффициент эффективности соответствующий модели Roofline неэффективен и неточен. В данном научно-исследовательском проекте высокоточное моделирование вычислительных операторов, операторов коммуникации и совмещенных операторов имеет решающее значение для быстрой адаптации новой модели в Ascend. В настоящее время анализ нагрузки основан на roofline модели соответствующего коэффициента эффективности оператора. Однако нагрузка от программ и приложений искуственного интеллекта быстро меняется, что приводит к быстрому увеличению типов операторов, а вычислительные характеристики, доступ к памяти и коммуникационные характеристики разных операторов сильно различаются. Текущий метод не может полностью описать модель производительности нового оператора. В результате снижается точность моделирования всей сети. Как следствие требуется много времени для профилирования оператора или модели и ручной калибровки коэффициента эффективности. Обобщение калиброванной модели также недостаточно, что приводит к увеличению повторной работы после итерации. Из-за объективного влияния положения конкурентов в экосистеме ИИ новый оператор должен быть предпочтительно адаптирован к Ascend. Как быстро адаптировать новый оператор к Ascend и добиться хорошей производительности, зависит от того, сможет ли новый оператор быстро реагировать на требования рынка. Быстрое моделирование для новых операторов, разработка политик тайлинга и решений по планированию конвейера на уровне моделирования, а также автоматическая оптимизация тайлинга/конвейера. Это значительно снижает потребление рабочей силы на этапе внедрения оператора и поддерживает быструю итеративную оптимизацию производительности оператора. Основные цели: - Приоритет 1 (высокий): Высокоточное моделирование производительности оператора: Точность времени моделирования производительности основных операторов в сценарии основной большой модели должна быть не менее 90% для целевых операторов. Реализация алгоритма оптимизации политики тайлинга оператора, что повышает производительность указанных в приложении операторов на 10% по сравнению с результатами профилировки. - Приоритет 2 (высокий): Улучшить обобщение (по линейным размерам тензора и типу данных (FP32, FP16, BF16, FP8, INT8, INT16)) моделирования операторов. Точность прогнозирования времени выполнения оператора для фиксированного тензора должна достигать 80%. Типы операторов включают в себя CUBE операторы, VECTOR операторы, смешанные операторы и операторы слияния (например, FA). Размеры тензоров и описание целевых операторов (MM, BMM, SwiGLU, GMM, GEMM, FA, QBMM, Dispatch) находится в Приложении 1. Целевое оборудование Ascend 310P, Ascend 910B, David. - Приоритет 3 (высокий): Построить унифицированный инструмент представления моделирования операторов на основе компилятора. Спроектировать промежуточное представление, выполнить иерархическую абстракцию операторов на основе компилятора. Предполагается использовать многоуровневую асбтрацию, где верхний уровень соответствует фреймворку Pytorch и нижний уровень соответствует аппаратным функциям для оборудования разных поколений (Ascend 310P, Ascend 910B, David). Система моделирования и имитации операторов должна быть проста в использовании практична, и может быть встроена в платформу моделирования и имитации обучения Лаборатории Маркова.
Доступ к ОКОГУ исполнителя True
Количество связанных РИД 0
Количество завершенных ИКРБС 0
Сумма бюджета 34944.0
Дата начала 2025-11-26
Дата окончания 2026-11-26
Номер контракта ТС20250126011-2025-08
Дата контракта 2025-11-26
Количество отчетов 1
УДК 001.891.573
Количество просмотров 4
Руководитель работы Богданов Александр Владимирович
Руководитель организации Лебедева Елена Витальевна
Исполнитель ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ"
Заказчик Общество с ограниченной ответственностью "Техкомпания Хуавэй"
Федеральная программа Отсутствует
Госпрограмма
Основание НИОКТР Договор со сторонней организацией
Последний статус 2025-11-27 13:13:03 UTC, 2025-11-27 13:13:03 UTC
ОКПД Нет
Отраслевой сегмент
Минздрав
Межгосударственная целевая программа
Ключевые слова Моделирование производительности операторов; Оптимизация тайлинга; Иерархическая абстракция операторов
Соисполнители
Типы НИОКТР Разработка новых материалов, научно-методических материалов, продуктов, процессов, программ, устройств, типов, элементов, услуг, систем, методов, методик, рекомендаций, предложений, прогнозов
Приоритетные направления
Критические технологии
Рубрикатор 28.17.19 - Математическое моделирование; 27.37.17 - Математическая теория управления. Оптимальное управление; 28.23.37 - Нейронные сети; 27.41.23 - Машинные, графические и другие методы вычислительной математики
OECD
OESR Робототехника и автоматическое управление
Приоритеты научно-технического развития а) переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта;
Регистрационные номера