| Наименование РИД |
Алгоритмы для автоматического распознавания документов с использованием методов машинного обучения
|
| Реферат |
Актуальность связана с необходимостью автоматизации процессов обработки сканов и изображений документов.
Объект исследования – процесс распознавания юридически значимых документов.
Предмет исследования – методы и средства распознавания юридически значимых документов.
Методы исследования в основном относятся к области искусственного интеллекта и технологий программирования, а также включают общенаучные методы исследования (такие, как анализ и синтез).
Цель работы – повышение эффективности и производительности анализа электронных документов за счет автоматизации обработки с помощью машинного обучения.
Получены следующие результаты:
- Исследованы процессы обработки документов методами машинного и глубокого обучения;
- Подготовлены данные для обучения моделей машинного обучения;
- Разработаны эффективные процедуры распознавания текстовых и табличных вставок на изображениях на базе методов компьютерного зрения.
Практическая значимость заключается в возможности применения разработанного решения для юридически значимых документов и их обработки.
Научная новизна заключается в подготовке собственного датасета, обучении различных моделей, настройке параметров и разработке пайплайна с применением LLM.
|
| Возможные направления использования |
Программа может быть использована для распознавания информации со сканов счетов-фактуры и товарных накладных.
|
| Количество опытных образцов |
0
|
| Количество просмотров |
1
|
| Наличие дополнительных файлов |
True
|
| Использование РИД правообладателем |
False
|
| Внешнее использование РИД |
False
|
| НИОКТР (JSON) |
{}
|
| ИКСИ (JSON) |
[]
|
| ИКСПО (JSON) |
[]
|
| ОЭСР (JSON) |
[]
|
| Дата первого статуса |
2026-01-21T14:02:58.463684+00:00
|
| Предполагаемый тип результата |
Программа для ЭВМ
|
| Ожидаемая роль |
Исполнитель
|
| Заказчик |
УПРАВЛЕНИЕ ДЕЛАМИ ПРЕЗИДЕНТА РОССИЙСКОЙ ФЕДЕРАЦИИ
|
| Руководитель работы |
Андриянов Никита Андреевич
|
| Руководитель организации |
Плотников Игорь Геннадьевич
|
| Регистрационный номер НИОКТР |
125031103471-4
|
| Последний статус |
Подтверждена, 626020400159-9, 2026-02-04 13:43:22 UTC
|
| ОКПД |
Услуги, связанные с научными исследованиями и экспериментальными разработками в области компьютерных наук и информационных технологий
|
| Ключевые слова |
компьютерное зрение; большие языковые модели; распознавание символов; интеллектуальная обработка документов
|
| Исполнители |
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "ФИНАНСОВЫЙ УНИВЕРСИТЕТ ПРИ ПРАВИТЕЛЬСТВЕ РОССИЙСКОЙ ФЕДЕРАЦИИ"
|
| Авторы |
Андриянов Никита Андреевич; Догадина Елена Петровна; Корчагин Сергей Алексеевич; Сердечный Денис Владимирович
|
| Коды тематических рубрик |
28.23.15 - Распознавание образов. Обработка изображений
|
| OESR |
Компьютерные, информационные науки и биоинформатика (разработка аппаратного обеспечения относится к разделу 2.2, социальный аспект относится к разделу 5.8)
|
| Приоритеты научно-технического развития |
а) переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта;
|