Глобальный поиск Единое окно поиска по РИД и запросам

Парсер для веб-страниц российских компаний с возможностью настройки по типам документов и тематическим областям

Наименование РИД Парсер для веб-страниц российских компаний с возможностью настройки по типам документов и тематическим областям
Реферат Программа предназначена для автоматизированного сбора, фильтрации и структурирования текстовой информации с веб-сайтов российских компаний на основе заданных ключевых слов. Функциональные возможности программы: • Поиск и парсинг релевантных веб-страниц, начиная с главной страницы компании, с возможностью углубленного обхода структуры сайта; • Сохранение результатов в формате CSV; • Выделение и скачивание PDF-документов (отчетов, презентаций и др.), соответствующих заданным ключевым словам; • Сбор и анализ новостного контента с сайтов компаний с последующим сохранением в отдельный файл. Язык программирования: Python 3.13 Особенности типа реализующей ЭВМ: MacBook Pro на базе процессора Apple M4, ОЗУ 16 Гб, встроенная графическая подсистема Apple GPU. Тип и версия операционной системы: не ниже Windows XP и выше. Объем программы для ЭВМ: 17 кб.
Возможные направления использования Программа может использоваться при проведении контент-анализа корпоративных сайтов, мониторинге публичной отчетности, а также при сборе и анализе новостных материалов, относящихся к деятельности компаний
Количество опытных образцов 0
Количество просмотров 6
Наличие дополнительных файлов False
Использование РИД правообладателем False
Внешнее использование РИД False
НИОКТР (JSON) {}
ИКСИ (JSON) []
ИКСПО (JSON) [{"last_status": {"created_date": "2025-11-28T20:45:45.518374+00:00", "registration_number": "825112800175-6", "status": {"name": "Подтверждена"}}, "copyright_protections": [{"protection_way": {"name": "Осуществлена государственная регистрация"}}]}]
ОЭСР (JSON) []
Дата первого статуса 2025-10-28T10:26:57.895997+00:00
Предполагаемый тип результата Программа для ЭВМ
Ожидаемая роль Исполнитель
Заказчик Правительство Российской Федерации
Руководитель работы Нестеров Александр Сергеевич
Руководитель организации Соколов Игорь Владимирович
Регистрационный номер НИОКТР 125022803063-2
Последний статус Подтверждена, 625111100320-2, 2025-11-11 14:42:09 UTC
ОКПД Услуги по исследованию конъюнктуры рынка, кроме опросов
Ключевые слова парсинг; автоматизированный сбор данных; контентный анализ; веб-сайт; корпоративные сайты
Исполнители ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ "ВЫСШАЯ ШКОЛА ЭКОНОМИКИ"
Авторы Сторчевой Максим Анатольевич; Тарасов Егор Александрович
Коды тематических рубрик 02.51.25 - Этика общественных институтов и отдельных областей жизни и деятельности
OESR Этика (за исключением этики, связанной с конкретными подпунктами)
Приоритеты научно-технического развития а) переход к передовым технологиям проектирования и создания высокотехнологичной продукции, основанным на применении интеллектуальных производственных решений, роботизированных и высокопроизводительных вычислительных систем, новых материалов и химических соединений, результатов обработки больших объемов данных, технологий машинного обучения и искусственного интеллекта;