Глобальный поиск Единое окно поиска по РИД и запросам

Разработка и тестирование прототипа платформы для автоматизированного производства и локализации аудиовизуального контента, фокусирующейся на высококачественной трансформации речевого ряда.

Название НИОКТР Разработка и тестирование прототипа платформы для автоматизированного производства и локализации аудиовизуального контента, фокусирующейся на высококачественной трансформации речевого ряда.
Аннотация Разработка инновационной платформы для автоматизированного производства и локализации аудиовизуального контента, фокусирующейся на высококачественной трансформации речевого ряда speech-to-speech с сохранением эмоциональной окраски и голосовой идентичности оригинальных спикеров. Это позволит значительно снизить стоимость и временные затраты на создание многоязычного контента, а также повысить его аутентичность для глобальной аудитории. Основная научно-техническая проблема, на решение которой направлено выполнение НИОКР: Высокая стоимость и трудоемкость традиционной локализации видеоконтента: 1. Существующие методы дубляжа и озвучивания требуют значительных ресурсов, что сдерживает масштабирование глобального распространения контента. 2. Потеря эмоциональной и голосовой идентичности при кросс-лингвальном переводе: Традиционные подходы не обеспечивают адекватной передачи уникальных характеристик голоса и интонаций спикера, что снижает качество восприятия. 3. Недостаток гибких инструментов для тонкой настройки и контроля синтезированной речи: Отсутствие возможностей оперативного управления параметрами синтеза (тембр, интонации, эмоции) ограничивает творческий потенциал и качество конечного продукта. 4. Сложность автоматизированного управления уникальными голосовыми моделями: Масштабирование производства требует эффективных решений для создания, хранения и применения клонированных голосов. Для достижения данной цели будет решен ряд научно-технических задач: Система распознавания речи и детекция окончания фраз (ASR): В качестве основы планируется использование готовых решений для автоматического распознавания речи (Automatic Speech Recognition, ASR) с высокой точностью распознавания речи на русском, английском и китайском языках. Важно не только распознавать слова, но и улавливать моменты, когда говорящий завершает фразу или делает значимую паузу. Это будет достигнуто путем внедрения алгоритмов анализа речи, что позволит повысить эффективность синхронного перевода, избегая преждевременных прерываний. Система перевода (MT): Планируется использование современных нейросетевых моделей машинного перевода, которые обеспечат высокую точность и скорость перевода между русским, английским и китайским языками. Важным аспектом станет адаптация перевода в реальном времени через создание системы кэширования и предварительной обработки частых фраз для уменьшения задержки при переводе. Система синтеза речи (TTS): Главной инновационной задачей проекта станет создание системы синтеза речи (Textto-Speech, TTS), которая будет отличаться высокой степенью естественности, с выраженной интонацией, темпом и эмоциональной окраской. Планируется применение нейросетевых моделей для достижения плавной и естественной речи. Особое внимание будет уделено точному воспроизведению ударений и интонации в соответствии с лингвистическими особенностями языка. Будет разработан набор параметров, позволяющий менять тембр, интонацию и эмоциональные оттенки голоса, чтобы обеспечить разнообразие синтезированных голосов для различных контекстов. Интеграция готовых компонентов и обеспечение работы в реальном времени: Проект предполагает использование модульной архитектуры, где системы ASR, MT и TTS будут работать в тесной взаимосвязи, обеспечивая высокоскоростную обработку входящих данных. Это обеспечит минимальные задержки при переводе, что критически важно для задач синхронного перевода. Для повышения эффективности синхронного перевода будут реализованы алгоритмы для синхронизации аудиопотоков и минимизации общей задержки перевода, а также механизмы балансировки нагрузки и распределенной обработки для обеспечения высокой производительности системы. Интерфейс для взаимодействия с пользователем: Создание интуитивно понятного интерфейса для настройки и управления процессом перевода. Пользователи смогут выбирать языковые пары для перевода, а также настраивать параметры синтеза речи. Оптимизация разработки: Для снижения затрат и ускорения разработки планируется использование лицензируемых решений от российских компаний в области ASR и машинного перевода. Это позволит сосредоточиться на ключевых задачах проекта, таких как синтез речи, сохраняя при этом высокое качество остальных компонентов системы. Такой системой могут выступить алгоритмы машинного обучения от Яндекс, доступные через API.
Доступ к ОКОГУ исполнителя False
Количество связанных РИД 0
Количество завершенных ИКРБС 0
Сумма бюджета 5000.0
Дата начала 2025-12-03
Дата окончания 2027-02-02
Номер контракта 7ГС1ЦТОРС22/112466
Дата контракта 2025-12-03
Количество отчетов 2
УДК 81"322; 004.934; 004.912
Количество просмотров 3
Руководитель работы Терехов Александр Викторович
Руководитель организации Терехов Александр Викторович
Исполнитель ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "КИНО ИИ"
Заказчик ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ "ФОНД СОДЕЙСТВИЯ РАЗВИТИЮ МАЛЫХ ФОРМ ПРЕДПРИЯТИЙ В НАУЧНО-ТЕХНИЧЕСКОЙ СФЕРЕ"
Федеральная программа Отсутствует
Госпрограмма
Основание НИОКТР Грант
Последний статус 2025-12-18 09:15:01 UTC, 2025-12-18 09:15:01 UTC
ОКПД Услуги по переносу и дублированию первых оригиналов
Отраслевой сегмент
Минздрав
Межгосударственная целевая программа
Ключевые слова нейросеть; эмоции; голос; дубляж
Соисполнители
Типы НИОКТР Опытное производство и испытания
Приоритетные направления
Критические технологии
Рубрикатор 16.31.21 - Автоматическая обработка текста. Автоматический перевод. Автоматическое распознавание речи
OECD
OESR Информатика – архитектура и аппаратное обеспечение
Приоритеты научно-технического развития ж) возможность эффективного ответа российского общества на большие вызовы с учетом возрастающей актуальности синтетических научных дисциплин, созданных на стыке психологии, социологии, политологии, истории и научных исследований, связанных с этическими аспектами научно-технологического развития, изменениями социальных, политических и экономических отношений;
Регистрационные номера