Глобальный поиск Единое окно поиска по РИД и запросам

Разработка и исследование методов улучшения качества речевых аудиосигналов с использованием глубоких нейронных сетей

Название НИОКТР Разработка и исследование методов улучшения качества речевых аудиосигналов с использованием глубоких нейронных сетей
Аннотация Проект направлен на разработку современных алгоритмов обработки речи с использованием глубоких нейронных сетей для повышения качества речевых сигналов в условиях акустических помех. В современном мире устройства, такие как мобильные телефоны, ноутбуки и беспроводные наушники, часто сталкиваются с проблемами качества голосовой связи в шумных средах из-за ограничений аппаратного дизайна, реверберации, эха и эффекта двойного разговора. Традиционные методы подавления шума и пространственной фильтрации часто оказываются зависимыми от уровня фонового шума и конфигурации микрофонов, что снижает их универсальность и эффективность в реальных условиях. Актуальность исследования обусловлена растущей потребностью в надежных методах улучшения качества речи, особенно в сценариях автоматического распознавания речи (ASR) и персональных телефонных звонков. Использование глубоких нейронных сетей позволяет значительно улучшить качество обработки речевых аудиосигналов за счет применения продвинутых алгоритмов шумоподавления, устранения эха и восстановления речи, а также возможности обработки разных искажений, таких как фоновый шум, реверберация, обрезка и потеря пакетов. Научная новизна проекта заключается в исследовании и разработке комплексного подхода к улучшению качества речи, объединяющего различные конфигурации нейронных сетей для устранения множества искажений в аудиосигналах (шум, реверберация, обрезка, артефакты кодека, потеря пакетов и т.д.). В рамках проекта будет проведено исследование существующих решений и разработка новых методов, ориентированных на создание универсального алгоритма для улучшения речевых сигналов. Важной частью исследования станет использование открытых баз данных аудиозаписей для тщательного анализа применимости предложенных методов. Ожидаемые результаты включают разработку универсальной модели на основе глубоких нейронных сетей, которая будет улучшать субъективное восприятие качества речи и предложит потенциальные улучшения для существующих решений с использованием искусственного интеллекта. Реализация проекта внесет значительный вклад в развитие технологий цифровой обработки речевых сигналов и автоматического распознавания речи, обеспечивая более естественное и разборчивое голосовое взаимодействие в сложных акустических условиях, таких как многолюдные помещения, улицы или шумные офисы. Внедрение результатов проекта окажет влияние на улучшение качества голосовых интерфейсов в мобильных устройствах и наушниках, а также в более сложных приложениях.
Доступ к ОКОГУ исполнителя False
Количество связанных РИД 0
Количество завершенных ИКРБС 0
Сумма бюджета 3000.0
Дата начала 2025-09-15
Дата окончания 2027-07-30
Номер контракта 25-71-00093
Дата контракта 2025-09-15
Количество отчетов 2
УДК 004.8.032.26
Количество просмотров 4
Руководитель работы Иванько Денис
Руководитель организации Ронжин Андрей Леонидович
Исполнитель ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ "САНКТ-ПЕТЕРБУРГСКИЙ ФЕДЕРАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ЦЕНТР РОССИЙСКОЙ АКАДЕМИИ НАУК"
Заказчик Российский научный фонд
Федеральная программа Отсутствует
Госпрограмма
Основание НИОКТР Грант
Последний статус 2025-11-17 08:44:14 UTC, 2025-11-17 08:44:14 UTC
ОКПД Услуги, связанные с научными исследованиями и экспериментальными разработками в области компьютерных наук и информационных технологий
Отраслевой сегмент
Минздрав
Межгосударственная целевая программа
Ключевые слова Машинное обучение; Цифровая обработка сигналов; Артефакты кодека; Реверберация; Расширение полосы пропускания; Восстановление речевых сигналов; Фильтрация шума; Глубокие нейронные сети; Улучшение качества речи; Обработка речевых сигналов
Соисполнители
Типы НИОКТР Фундаментальное исследование
Приоритетные направления
Критические технологии
Рубрикатор 28.23.37 - Нейронные сети
OECD
OESR Компьютерные, информационные науки и биоинформатика (разработка аппаратного обеспечения относится к разделу 2.2, социальный аспект относится к разделу 5.8)
Приоритеты научно-технического развития а) переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта;
Регистрационные номера