Глобальный поиск Единое окно поиска по РИД и запросам

Быстрый аппроксимационный поиск ближайших соседей по векторным базам данных (х/д 20790)

Название НИОКТР Быстрый аппроксимационный поиск ближайших соседей по векторным базам данных (х/д 20790)
Аннотация Алгоритмы приближенного поиска ближайших соседей (ANNS) используются для индексации и поиска векторных данных, хранящихся в базе данных GaussDB. В отличие от автономных алгоритмов ANNS, алгоритм ANNS, реализованный как часть RDBMS, не может полностью хранить индекс в RAM, потому что RDBMS может столкнуться с большими параллельными нагрузками, включающими множество различных таблиц и индексов. Кроме того, GaussDB (а также другие RDBMS) считывает данные с диска через свой менеджер буфера порциями небольшого размера (4-16 Кб). Порции такого размера не могут хранить слишком много высокоразмерных векторных данных типа FP32 (порция размером 8 Кб может хранить только 15 векторов FP32 размерностью 128). Это приводит к задаче сжатия векторных данных в индексах ANNS, решение которой позволило бы хранить больше векторов на одной странице индекса и, таким образом, экономить затратные операции обращения к диску. Основные цели проекта: • улучшить качество индекса, чтобы задержка поиска в индексе уменьшилась как минимум на 15% при 100@100=99% recall; • оптимизировать алгоритм сканирования индекса таким образом, чтобы задержка поиска уменьшилась как минимум на 5% при 100@100=99% recall. Научная новизна работы заключается в новых алгоритмах кластерного анализа или новых модификациях таких алгоритмов, используемых при построении индекса RDBMS и позволяющих повысить уровень recall без изменения структуры применяемого индекса, за счет улучшения результата кластеризации. Результаты: Новое программное обеспечение: • реализация (программный код) нового алгоритма индексирования в GaussDB; • исполнимые и воспроизводимые результаты измерений, демонстрирующие, что новый алгоритм фактически ускоряет поиск.
Доступ к ОКОГУ исполнителя False
Количество связанных РИД 0
Количество завершенных ИКРБС 0
Сумма бюджета 11529.965
Дата начала 2024-06-14
Дата окончания 2025-06-14
Номер контракта ТС2024051430
Дата контракта 2024-06-14
Количество отчетов 3
УДК 025.4.03
Количество просмотров 5
Руководитель работы Ступина Алена Александровна
Руководитель организации Румянцев Максим Валерьевич
Исполнитель ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "СИБИРСКИЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ"
Заказчик Общество с ограниченной ответственностью "Техкомпания Хуавэй"
Федеральная программа Отсутствует
Госпрограмма
Основание НИОКТР Договор со сторонней организацией
Последний статус 2025-11-27 19:30:07 UTC, 2025-11-27 19:30:07 UTC
ОКПД Услуги, связанные с научными исследованиями и экспериментальными разработками в области компьютерных наук и информационных технологий
Отраслевой сегмент
Минздрав
Межгосударственная целевая программа
Ключевые слова Приближенный поиск ближайших соседей; Векторные базы данных; Кластерный анализ; IVFFlat
Соисполнители
Типы НИОКТР Разработка новых материалов, научно-методических материалов, продуктов, процессов, программ, устройств, типов, элементов, услуг, систем, методов, методик, рекомендаций, предложений, прогнозов
Приоритетные направления
Критические технологии
Рубрикатор 20.23.19 - Процессы информационного поиска
OECD
OESR Компьютерные, информационные науки и биоинформатика (разработка аппаратного обеспечения относится к разделу 2.2, социальный аспект относится к разделу 5.8)
Приоритеты научно-технического развития а) переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта;
Регистрационные номера