Глобальный поиск Единое окно поиска по РИД и запросам

Повышение эффективности технологического процесса обработки научно-технической литературы с использованием перспективных информационных технологий

Название НИОКТР Повышение эффективности технологического процесса обработки научно-технической литературы с использованием перспективных информационных технологий
Аннотация Стратегией научно-технологического развития Российской Федерации (Указ Президента Российской Федерации от 28 февраля 2024 г. № 145 п. 29 п.п. в) предусмотрено обеспечение доступа исследователей и исследовательских коллективов к национальным и международным информационным ресурсам, результатам научных исследований, научной инфраструктуре, к технологическим разработкам на всей территории страны. Согласно п. 29 (п.п. ж) создание инфраструктуры и условий, отвечающих современным принципам организации научной, научно-технической и инновационной деятельности обеспечивается в т.ч. путём интеграции технологий искусственного интеллекта и активного использования их возможностей для повышения качества и эффективности научных исследований и разработок, в т.ч. посредством создания методологии обмена научными данными и информацией, развития отечественных сервисов, предназначенных для сбора, хранения и обработки таких данных. Достижение поставленных Указом Президента РФ целей невозможно без Государственной системы научно-технической информации (ГСНТИ), основная задача которой заключается в обеспечении достоверной и актуальной научно-технической информацией научно-исследовательских, конструкторских и промышленно-технологических организаций, поддержке научных исследований и технологического прогресса. Ключевым звеном ГСНТИ является ВИНИТИ РАН – крупнейший научно-информационный центр России по проблемам точных, естественных и технических наук. ВИНИТИ РАН выполняет содержательную обработку более 500 тыс. документов в год силами порядка 400 специалистов в различных областях знания, формирующих Федеральную базу данных отечественных и зарубежных публикаций по естественным, точным и техническим наукам (БД ВИНИТИ). Целью данной работы является повышение эффективности технологического процесса сбора и аналитико-синтетической переработки информации при формировании БД ВИНИТИ РАН. В настоящее время основным инструментом ИИ для автоматической обработки текстовой информации становятся нейросетевые языковые модели. Как показывает практика использования, они могут генерировать наряду с высококачественной информацией также элементы недостоверной информации. Напротив, методы компьютерной лингвистики, в основе которых лежат современные лингвистические модели смысловой структуры текстов, машинные словарные ресурсы, тезаурусы и онтологии, созданные на огромных корпусах политематических текстов, почти лишены этого недостатка. Они могут допускать неточности, но галлюцинации им не свойственны. Качество работы методов компьютерной лингвистики зависит от полноты и качества машинных словарей и грамматических таблиц, создание и актуализация которых в различных областях науки и техники является трудоёмкой задачей и требует значительной вовлечённости людей (экспертов). Успешность обучения языковых моделей зависит главным образом от объёма и качества размеченных наборов данных, для создания которых могут использоваться существующие массивы научных публикаций БД ВИНИТИ, оснащённые классификационными индексами, ключевыми словами и аннотациями. Создание гибридных методов на основе совместного использования нейросетевых моделей и компьютерной лингвистики позволит повысить достоверность результатов автоматических операций аналитико-синтетической обработки НТИ при сравнительно небольших объёмах используемых машинных декларативных средств. Новизна предложенных методов обосновывается разработкой гибридных методов компьютерной лингвистики и машинного обучения, а также языковых моделей и средств автоматизации, обеспечивающих быструю, малозатратную адаптацию к новым предметным областям с применением решений на основе статистического анализа понятийно-терминологического состава и семантико-синтаксических структур научно-технических текстов по широкому спектру предметных областей, принципа лингвистической аналогии, адаптивных центроидно-контекстных моделей, обобщенных грамматических синтагм, машинной грамматики на основе системы флективных классов русского языка и методов точного и вероятностного концептуального анализа текстов для выявления информационных объектов и установления смысловых связей между ними.
Доступ к ОКОГУ исполнителя False
Количество связанных РИД 0
Количество завершенных ИКРБС 0
Сумма бюджета 107792.494
Дата начала 2025-01-01
Дата окончания 2027-12-31
Номер контракта 075-03-025-040/2
Дата контракта 2025-09-02
Количество отчетов 3
УДК 002.6:004.65; 002.6:004.62/.63
Количество просмотров 9
Руководитель работы Хорошилов Александр Алексеевич
Руководитель организации Гарбук Сергей Владимирович
Исполнитель ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ ВСЕРОССИЙСКИЙ ИНСТИТУТ НАУЧНОЙ И ТЕХНИЧЕСКОЙ ИНФОРМАЦИИ РОССИЙСКОЙ АКАДЕМИИ НАУК
Заказчик МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральная программа Отсутствует
Госпрограмма Фундаментальные и поисковые научные исследования
Основание НИОКТР Государственное задание
Последний статус 2025-12-10 11:53:50 UTC, 2025-12-10 11:53:50 UTC
ОКПД Услуги информационные автоматизированные компьютерные прочие, не включенные в другие группировки
Отраслевой сегмент
Минздрав
Межгосударственная целевая программа
Ключевые слова автоматизация технологических процессов; аналитико-синтетическая переработка информации; база данных ВИНИТИ РАН; проблемно-ориентированные базы данных; документальные источники информации; эффективность технологических процессов
Соисполнители
Типы НИОКТР Фундаментальное исследование
Приоритетные направления
Критические технологии
Рубрикатор 28.23.37 - Нейронные сети; 28.23.29 - Программная реализация интеллектуальных систем; 20.23.17 - Информационно-поисковые массивы. Базы данных. Манипулирование данными и файлами; 20.19.19 - Аннотирование и реферирование; 20.19.17 - Предметизация и индексирование
OECD
OESR Компьютерные, информационные науки и биоинформатика (разработка аппаратного обеспечения относится к разделу 2.2, социальный аспект относится к разделу 5.8)
Приоритеты научно-технического развития а) переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта;
Регистрационные номера ikrbs: {'card_list': [{'id': 'NQTTOTI0TB2S79P33MHQYL4E'}]}