| Наименование РИД |
Парсер для веб-страниц российских компаний с возможностью настройки по типам документов и тематическим областям
|
| Реферат |
Программа предназначена для автоматизированного сбора, фильтрации и структурирования текстовой информации с веб-сайтов российских компаний на основе заданных ключевых слов.
Функциональные возможности программы:
• Поиск и парсинг релевантных веб-страниц, начиная с главной страницы компании, с возможностью углубленного обхода структуры сайта;
• Сохранение результатов в формате CSV;
• Выделение и скачивание PDF-документов (отчетов, презентаций и др.), соответствующих заданным ключевым словам;
• Сбор и анализ новостного контента с сайтов компаний с последующим сохранением в отдельный файл.
Язык программирования: Python 3.13
Особенности типа реализующей ЭВМ:
MacBook Pro на базе процессора Apple M4, ОЗУ 16 Гб, встроенная графическая подсистема Apple GPU.
Тип и версия операционной системы: не ниже Windows XP и выше.
Объем программы для ЭВМ: 17 кб.
|
| Возможные направления использования |
Программа может использоваться при проведении контент-анализа корпоративных сайтов, мониторинге публичной отчетности, а также при сборе и анализе новостных материалов, относящихся к деятельности компаний
|
| Количество опытных образцов |
0
|
| Количество просмотров |
6
|
| Наличие дополнительных файлов |
False
|
| Использование РИД правообладателем |
False
|
| Внешнее использование РИД |
False
|
| НИОКТР (JSON) |
{}
|
| ИКСИ (JSON) |
[]
|
| ИКСПО (JSON) |
[{"last_status": {"created_date": "2025-11-28T20:45:45.518374+00:00", "registration_number": "825112800175-6", "status": {"name": "Подтверждена"}}, "copyright_protections": [{"protection_way": {"name": "Осуществлена государственная регистрация"}}]}]
|
| ОЭСР (JSON) |
[]
|
| Дата первого статуса |
2025-10-28T10:26:57.895997+00:00
|
| Предполагаемый тип результата |
Программа для ЭВМ
|
| Ожидаемая роль |
Исполнитель
|
| Заказчик |
Правительство Российской Федерации
|
| Руководитель работы |
Нестеров Александр Сергеевич
|
| Руководитель организации |
Соколов Игорь Владимирович
|
| Регистрационный номер НИОКТР |
125022803063-2
|
| Последний статус |
Подтверждена, 625111100320-2, 2025-11-11 14:42:09 UTC
|
| ОКПД |
Услуги по исследованию конъюнктуры рынка, кроме опросов
|
| Ключевые слова |
парсинг; автоматизированный сбор данных; контентный анализ; веб-сайт; корпоративные сайты
|
| Исполнители |
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ "ВЫСШАЯ ШКОЛА ЭКОНОМИКИ"
|
| Авторы |
Сторчевой Максим Анатольевич; Тарасов Егор Александрович
|
| Коды тематических рубрик |
02.51.25 - Этика общественных институтов и отдельных областей жизни и деятельности
|
| OESR |
Этика (за исключением этики, связанной с конкретными подпунктами)
|
| Приоритеты научно-технического развития |
а) переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта;
|