| Название НИОКТР |
Повышение эффективности технологического процесса обработки научно-технической литературы с использованием перспективных информационных технологий
|
| Аннотация |
Стратегией научно-технологического развития Российской Федерации (Указ Президента Российской Федерации от 28 февраля 2024 г. № 145 п. 29 п.п. в) предусмотрено обеспечение доступа исследователей и исследовательских коллективов к национальным и международным информационным ресурсам, результатам научных исследований, научной инфраструктуре, к технологическим разработкам на всей территории страны. Согласно п. 29 (п.п. ж) создание инфраструктуры и условий, отвечающих современным принципам организации научной, научно-технической и инновационной деятельности обеспечивается в т.ч. путём интеграции технологий искусственного интеллекта и активного использования их возможностей для повышения качества и эффективности научных исследований и разработок, в т.ч. посредством создания методологии обмена научными данными и информацией, развития отечественных сервисов, предназначенных для сбора, хранения и обработки таких данных. Достижение поставленных Указом Президента РФ целей невозможно без Государственной системы научно-технической информации (ГСНТИ), основная задача которой заключается в обеспечении достоверной и актуальной научно-технической информацией научно-исследовательских, конструкторских и промышленно-технологических организаций, поддержке научных исследований и технологического прогресса. Ключевым звеном ГСНТИ является ВИНИТИ РАН – крупнейший научно-информационный центр России по проблемам точных, естественных и технических наук.
ВИНИТИ РАН выполняет содержательную обработку более 500 тыс. документов в год силами порядка 400 специалистов в различных областях знания, формирующих Федеральную базу данных отечественных и зарубежных публикаций по естественным, точным и техническим наукам (БД ВИНИТИ). Целью данной работы является повышение эффективности технологического процесса сбора и аналитико-синтетической переработки информации при формировании БД ВИНИТИ РАН.
В настоящее время основным инструментом ИИ для автоматической обработки текстовой информации становятся нейросетевые языковые модели. Как показывает практика использования, они могут генерировать наряду с высококачественной информацией также элементы недостоверной информации. Напротив, методы компьютерной лингвистики, в основе которых лежат современные лингвистические модели смысловой структуры текстов, машинные словарные ресурсы, тезаурусы и онтологии, созданные на огромных корпусах политематических текстов, почти лишены этого недостатка. Они могут допускать неточности, но галлюцинации им не свойственны. Качество работы методов компьютерной лингвистики зависит от полноты и качества машинных словарей и грамматических таблиц, создание и актуализация которых в различных областях науки и техники является трудоёмкой задачей и требует значительной вовлечённости людей (экспертов). Успешность обучения языковых моделей зависит главным образом от объёма и качества размеченных наборов данных, для создания которых могут использоваться существующие массивы научных публикаций БД ВИНИТИ, оснащённые классификационными индексами, ключевыми словами и аннотациями. Создание гибридных методов на основе совместного использования нейросетевых моделей и компьютерной лингвистики позволит повысить достоверность результатов автоматических операций аналитико-синтетической обработки НТИ при сравнительно небольших объёмах используемых машинных декларативных средств.
Новизна предложенных методов обосновывается разработкой гибридных методов компьютерной лингвистики и машинного обучения, а также языковых моделей и средств автоматизации, обеспечивающих быструю, малозатратную адаптацию к новым предметным областям с применением решений на основе статистического анализа понятийно-терминологического состава и семантико-синтаксических структур научно-технических текстов по широкому спектру предметных областей, принципа лингвистической аналогии, адаптивных центроидно-контекстных моделей, обобщенных грамматических синтагм, машинной грамматики на основе системы флективных классов русского языка и методов точного и вероятностного концептуального анализа текстов для выявления информационных объектов и установления смысловых связей между ними.
|
| Доступ к ОКОГУ исполнителя |
False
|
| Количество связанных РИД |
0
|
| Количество завершенных ИКРБС |
0
|
| Сумма бюджета |
107792.494
|
| Дата начала |
2025-01-01
|
| Дата окончания |
2027-12-31
|
| Номер контракта |
075-03-025-040/2
|
| Дата контракта |
2025-09-02
|
| Количество отчетов |
3
|
| УДК |
002.6:004.65; 002.6:004.62/.63
|
| Количество просмотров |
9
|
| Руководитель работы |
Хорошилов Александр Алексеевич
|
| Руководитель организации |
Гарбук Сергей Владимирович
|
| Исполнитель |
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ ВСЕРОССИЙСКИЙ ИНСТИТУТ НАУЧНОЙ И ТЕХНИЧЕСКОЙ ИНФОРМАЦИИ РОССИЙСКОЙ АКАДЕМИИ НАУК
|
| Заказчик |
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
|
| Федеральная программа |
Отсутствует
|
| Госпрограмма |
Фундаментальные и поисковые научные исследования
|
| Основание НИОКТР |
Государственное задание
|
| Последний статус |
2025-12-10 11:53:50 UTC, 2025-12-10 11:53:50 UTC
|
| ОКПД |
Услуги информационные автоматизированные компьютерные прочие, не включенные в другие группировки
|
| Отраслевой сегмент |
—
|
| Минздрав |
—
|
| Межгосударственная целевая программа |
—
|
| Ключевые слова |
автоматизация технологических процессов; аналитико-синтетическая переработка информации; база данных ВИНИТИ РАН; проблемно-ориентированные базы данных; документальные источники информации; эффективность технологических процессов
|
| Соисполнители |
—
|
| Типы НИОКТР |
Фундаментальное исследование
|
| Приоритетные направления |
—
|
| Критические технологии |
—
|
| Рубрикатор |
28.23.37 - Нейронные сети; 28.23.29 - Программная реализация интеллектуальных систем; 20.23.17 - Информационно-поисковые массивы. Базы данных. Манипулирование данными и файлами; 20.19.19 - Аннотирование и реферирование; 20.19.17 - Предметизация и индексирование
|
| OECD |
—
|
| OESR |
Компьютерные, информационные науки и биоинформатика (разработка аппаратного обеспечения относится к разделу 2.2, социальный аспект относится к разделу 5.8)
|
| Приоритеты научно-технического развития |
а) переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта;
|
| Регистрационные номера |
ikrbs: {'card_list': [{'id': 'NQTTOTI0TB2S79P33MHQYL4E'}]}
|