Разработка прототипа универсальной программной платформы для интеграции многоформатных корпоративных баз знаний с большими языковыми моделями на основе технологий расширенного поиска
| Название НИОКТР | Разработка прототипа универсальной программной платформы для интеграции многоформатных корпоративных баз знаний с большими языковыми моделями на основе технологий расширенного поиска |
|---|---|
| Аннотация | Проект направлен на решение научно-технических проблем интеграции корпоративных баз знаний с большими языковыми моделями: потери контекстных связей при сегментации документов, низкой точности извлечения информации из сложноформатированных документов, недостаточной релевантности при использовании единственного метода ретривала. Разрабатываемая платформа включает модули: интеллектуальной обработки документов форматов PDF, DOCX, HTML, JSON, XML с извлечением текста, таблиц и метаданных; передовой сегментации с технологией Late Chunking для сохранения контекста; трехкомпонентного гибридного поиска (BM25, Dense Vector Search, SPLADE); универсальной интеграции с российскими (YandexGPT, GigaChat, Sber AI) и международными провайдерами больших языковых моделей; GraphRAG для структурированных знаний; многоагентной обработки запросов. |
| Доступ к ОКОГУ исполнителя | False |
| Количество связанных РИД | 0 |
| Количество завершенных ИКРБС | 0 |
| Сумма бюджета | 5000.0 |
| Дата начала | 2025-12-17 |
| Дата окончания | 2027-02-16 |
| Номер контракта | 5482ГС1/112079 |
| Дата контракта | 2025-12-17 |
| Количество отчетов | 2 |
| УДК | 002.6:004.65; 002.6:004.62/.63 |
| Количество просмотров | 5 |
| Руководитель работы | Фархадов Маис Паша оглы |
| Руководитель организации | Павлин Николай Константинович |
| Исполнитель | ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "НЕКСТ ПРОДАКТ ЛАБ" |
| Заказчик | ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ "ФОНД СОДЕЙСТВИЯ РАЗВИТИЮ МАЛЫХ ФОРМ ПРЕДПРИЯТИЙ В НАУЧНО-ТЕХНИЧЕСКОЙ СФЕРЕ" |
| Федеральная программа | Отсутствует |
| Госпрограмма | Научно-технологическое развитие Российской Федерации |
| Основание НИОКТР | Грант |
| Последний статус | 2026-01-12 09:02:20 UTC, 2026-01-17 15:49:46 UTC |
| ОКПД | Работы оригинальные научных исследований и экспериментальных разработок в области естественных и технических наук, кроме биотехнологии |
| Отраслевой сегмент | — |
| Минздрав | — |
| Межгосударственная целевая программа | — |
| Ключевые слова | ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ; RAG; RETRIEVAL AUGMENTED GENERATION; БОЛЬШИЕ ЯЗЫКОВЫЕ МОДЕЛИ; ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА; СЕМАНТИЧЕСКИЙ ПОИСК; ГИБРИДНЫЙ ПОИСК |
| Соисполнители | — |
| Типы НИОКТР | Проектные работы |
| Приоритетные направления | — |
| Критические технологии | — |
| Рубрикатор | 20.23.17 - Информационно-поисковые массивы. Базы данных. Манипулирование данными и файлами |
| OECD | — |
| OESR | Информатика – архитектура и аппаратное обеспечение |
| Приоритеты научно-технического развития | а) переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта; |
| Регистрационные номера | — |
