| Наименование РИД |
CoLeM
|
| Реферат |
CoLeM – программный инструментарий для построения устойчивых векторных представлений столбцов русскоязычных таблиц, который включает адаптацию алгоритма контрастного обучения для табличных данных с использованием аугментаций, а также дистиллированной мультиязычной модели DistilBERT для эффективного обучения на неразмеченных данных корпуса Russian Web Tables (RWT), содержащего 7,4 млн. столбцов. Обученные табличные представления интегрируются в конвейер аннотирования столбцов таблиц. Инструментарий также содержит готовый набор программ для обучения модели CoLeM на любых табличных данных, удовлетворяющих шаблону записи набора данных RWT–RuTaBERT, который был использован для обучения исходной модели. Результатом работы модели CoLeM являются устойчивые векторные представления русскоязычных таблиц, которые могут быть использованы в наборе задач, связанных с пониманием табличных данных.
|
| Возможные направления использования |
Подготовка табличных данных для глубокой машинной обработки; возможность семантического поиска по табличным данным (например, поиска таблиц в Интернет по их содержанию); создание графов знаний для интеллектуальных информационно-аналитических систем.
|
| Количество опытных образцов |
1
|
| Количество просмотров |
2
|
| Наличие дополнительных файлов |
True
|
| Использование РИД правообладателем |
False
|
| Внешнее использование РИД |
False
|
| НИОКТР (JSON) |
{}
|
| ИКСИ (JSON) |
[]
|
| ИКСПО (JSON) |
[{"last_status": {"created_date": "2026-01-30T10:43:18.663817+00:00", "registration_number": "826013000113-5", "status": {"name": "Подтверждена"}}, "copyright_protections": [{"protection_way": {"name": "Осуществлена государственная регистрация"}}]}]
|
| ОЭСР (JSON) |
[]
|
| Дата первого статуса |
2025-12-24T07:01:58.857479+00:00
|
| Предполагаемый тип результата |
Программа для ЭВМ
|
| Ожидаемая роль |
Исполнитель
|
| Заказчик |
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
|
| Руководитель работы |
Михайлов Андрей Анатольевич
|
| Руководитель организации |
Бычков Игорь Вячеславович
|
| Регистрационный номер НИОКТР |
124051500067-7
|
| Последний статус |
Подтверждена, 626011201032-4, 2026-01-12 14:35:34 UTC
|
| ОКПД |
Услуги по проектированию и разработке информационных технологий для прикладных задач и тестированию программного обеспечения
|
| Ключевые слова |
табличные данные; самообучение; контрастное обучение; семантическая интерпретация таблиц; обработка таблиц
|
| Исполнители |
Федеральное государственное бюджетное учреждение науки Институт динамики систем и теории управления имени В.М. Матросова Сибирского отделения Российской академии наук)
|
| Авторы |
Тобола Кирилл Владимирович
|
| Коды тематических рубрик |
20.53.19 - Средства обработки и поиска информации; 28.23.25 - Модели и системы обучения; 28.23.13 - Инженерия знаний.; 20.19.19 - Аннотирование и реферирование
|
| OESR |
Компьютерные, информационные науки и биоинформатика (разработка аппаратного обеспечения относится к разделу 2.2, социальный аспект относится к разделу 5.8)
|
| Приоритеты научно-технического развития |
а) переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта;
|