Разработка локальных нейросетевых архитектур для мультимодального извлечения знаний (OCSR) и семантического анализа химической литературы с использованием больших языковых моделей
| Название НИОКТР | Разработка локальных нейросетевых архитектур для мультимодального извлечения знаний (OCSR) и семантического анализа химической литературы с использованием больших языковых моделей |
|---|---|
| Аннотация | В рамках проекта предполагается создание системы семантической интеграции, реализующей параллельную архитектуру поиска (Dual-Stream Retrieval): Текстово-библиографический поток: Интеллектуальный поиск изданий (книг, статей, диссертаций) по метаданным и полным текстам с учетом морфологии русского языка и химической терминологии. Хемоинформационный поток (OCSR): Автоматическое извлечение и индексация химических сущностей (реакций, структурных формул) из оцифрованных документов (сканов) с использованием методов компьютерного зрения и мультимодальных нейросетей. Результатом станет суверенное локальное решение, позволяющее пользователю находить источники как по смысловому запросу («поиск реакций циклизации с использованием катализаторов на основе палладия»), так и по структурному фрагменту, с возможностью получения верифицированного ответа на естественном языке со ссылкой на первоисточник. |
| Доступ к ОКОГУ исполнителя | False |
| Количество связанных РИД | 0 |
| Количество завершенных ИКРБС | 0 |
| Сумма бюджета | 27996.961 |
| Дата начала | 2025-10-01 |
| Дата окончания | 2027-12-31 |
| Номер контракта | 075-03-2025-139/4 |
| Дата контракта | 2025-12-24 |
| Количество отчетов | 3 |
| УДК | 54:51-7 54:007 |
| Количество просмотров | 27 |
| Руководитель работы | Трофимов Иван Леонидович |
| Руководитель организации | Комарова Татьяна Николаевна |
| Исполнитель | ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ ФЕДЕРАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ЦЕНТР "ИРКУТСКИЙ ИНСТИТУТ ХИМИИ ИМ. А.Е. ФАВОРСКОГО СИБИРСКОГО ОТДЕЛЕНИЯ РОССИЙСКОЙ АКАДЕМИИ НАУК" |
| Заказчик | МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ |
| Федеральная программа | Отсутствует |
| Госпрограмма | Фундаментальные и поисковые научные исследования |
| Основание НИОКТР | Государственное задание |
| Последний статус | 2025-12-25 06:14:48 UTC, 2025-12-25 06:14:48 UTC |
| ОКПД | Нет |
| Отраслевой сегмент | — |
| Минздрав | — |
| Межгосударственная целевая программа | — |
| Ключевые слова | искусственный интеллект; нейронные сети; компьютерное зрение; химия; распознавание формул; семантический поиск; интеграция данных; RAG-архитектура; анализ химических структур; научная литература |
| Соисполнители | — |
| Типы НИОКТР | Фундаментальное исследование |
| Приоритетные направления | — |
| Критические технологии | — |
| Рубрикатор | 28.23.15 - Распознавание образов. Обработка изображений; 28.23.25 - Модели и системы обучения; 28.23.39 - Интеллектуальные базы знаний; 31.01.29 - Информационная деятельность; 31.01.77 - Математические и кибернетические методы |
| OECD | — |
| OESR | Органическая химия |
| Приоритеты научно-технического развития | а) переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта; |
| Регистрационные номера | ikrbs: {'card_list': [{'id': 'PXI7TJN3X3D66I8RJ7JQ4V20'}, {'id': 'T5FZAOP9YL4AAAB66OXKA8YI'}]} |
