На данный момент система, построенная на Python с применением FastAPI POST запрос и nodriver libratry , выполняет парсинг HTML-страниц, используя форматы данных, такие как json-ld, opengraph, rdfa и microformat и указаные селекторы.
Необходимо разработать схожую функциональность (получение данныех используя форматы json-ld, opengraph, rdfa и microformat, получение данных с указанных селекторов) на базе NestJS или ExpressJS, применяя Puppeteer для получения данныех в headless mode для анализа HTML-страниц. В новом решении требуется внедрить обработку исключений, добавить систему логирования для фиксации событий и завернуть приложение в Docker-образ.
Дополнительные детали можно обсудить в личных сообщениях.
Разделы:
Заказ
Опубликован:
12.12.2024 | 14:32 [поднят: 12.12.2024 | 14:32] [последние изменения: 12.12.2024 | 14:28]
Заказ находится в архиве