| Название НИОКТР |
Быстрый аппроксимационный поиск ближайших соседей по векторным базам данных (х/д 20790)
|
| Аннотация |
Алгоритмы приближенного поиска ближайших соседей (ANNS) используются для индексации и поиска векторных данных, хранящихся в базе данных GaussDB. В отличие от автономных алгоритмов ANNS, алгоритм ANNS, реализованный как часть RDBMS, не может полностью хранить индекс в RAM, потому что RDBMS может столкнуться с большими параллельными нагрузками, включающими множество различных таблиц и индексов. Кроме того, GaussDB (а также другие RDBMS) считывает данные с диска через свой менеджер буфера порциями небольшого размера (4-16 Кб). Порции такого размера не могут хранить слишком много высокоразмерных векторных данных типа FP32 (порция размером 8 Кб может хранить только 15 векторов FP32 размерностью 128). Это приводит к задаче сжатия векторных данных в индексах ANNS, решение которой позволило бы хранить больше векторов на одной странице индекса и, таким образом, экономить затратные операции обращения к диску.
Основные цели проекта:
• улучшить качество индекса, чтобы задержка поиска в индексе уменьшилась как минимум на 15% при 100@100=99% recall;
• оптимизировать алгоритм сканирования индекса таким образом, чтобы задержка поиска уменьшилась как минимум на 5% при 100@100=99% recall.
Научная новизна работы заключается в новых алгоритмах кластерного анализа или новых модификациях таких алгоритмов, используемых при построении индекса RDBMS и позволяющих повысить уровень recall без изменения структуры применяемого индекса, за счет улучшения результата кластеризации.
Результаты:
Новое программное обеспечение:
• реализация (программный код) нового алгоритма индексирования в GaussDB;
• исполнимые и воспроизводимые результаты измерений, демонстрирующие, что новый алгоритм фактически ускоряет поиск.
|
| Доступ к ОКОГУ исполнителя |
False
|
| Количество связанных РИД |
0
|
| Количество завершенных ИКРБС |
0
|
| Сумма бюджета |
11529.965
|
| Дата начала |
2024-06-14
|
| Дата окончания |
2025-06-14
|
| Номер контракта |
ТС2024051430
|
| Дата контракта |
2024-06-14
|
| Количество отчетов |
3
|
| УДК |
025.4.03
|
| Количество просмотров |
5
|
| Руководитель работы |
Ступина Алена Александровна
|
| Руководитель организации |
Румянцев Максим Валерьевич
|
| Исполнитель |
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "СИБИРСКИЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ"
|
| Заказчик |
Общество с ограниченной ответственностью "Техкомпания Хуавэй"
|
| Федеральная программа |
Отсутствует
|
| Госпрограмма |
—
|
| Основание НИОКТР |
Договор со сторонней организацией
|
| Последний статус |
2025-11-27 19:30:07 UTC, 2025-11-27 19:30:07 UTC
|
| ОКПД |
Услуги, связанные с научными исследованиями и экспериментальными разработками в области компьютерных наук и информационных технологий
|
| Отраслевой сегмент |
—
|
| Минздрав |
—
|
| Межгосударственная целевая программа |
—
|
| Ключевые слова |
Приближенный поиск ближайших соседей; Векторные базы данных; Кластерный анализ; IVFFlat
|
| Соисполнители |
—
|
| Типы НИОКТР |
Разработка новых материалов, научно-методических материалов, продуктов, процессов, программ, устройств, типов, элементов, услуг, систем, методов, методик, рекомендаций, предложений, прогнозов
|
| Приоритетные направления |
—
|
| Критические технологии |
—
|
| Рубрикатор |
20.23.19 - Процессы информационного поиска
|
| OECD |
—
|
| OESR |
Компьютерные, информационные науки и биоинформатика (разработка аппаратного обеспечения относится к разделу 2.2, социальный аспект относится к разделу 5.8)
|
| Приоритеты научно-технического развития |
а) переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта;
|
| Регистрационные номера |
—
|