Заказ закрыт
Написать парсер или доработать представленный по ссылке в описании

Откликнуться
r
Заказчик
Отзывы фрилансеров: + 26 - 0
Зарегистрирован на сайте 4 года и 1 месяц
Бюджет: 2 500 руб
31.10 $ — 26.55 €
Необходим многопоточный или асинхронный парсер на Python (php обсуждается отдельно), который собирает ссылки на страницы с информацией о доставке Интернет-магазинов, например, для ДНС это www.dns-shop.ru/delivery/ (достаточен скрипт по поиску слова "Доставка" в заголовках ссылок). Список ссылок на интернет магазины (входной файл) тут: cloud.mail.ru/public/5sLP...

Далее нужно проверить есть ли доставка определенной транспортной компанией на этой странице (срипт поиска по слову можно взять этот: cloud.mail.ru/public/tNwF... входной cloud.mail.ru/public/c9TJ... ). Транспортные компании перечислены в заголовках столбцов файла cloud.mail.ru/public/5sLP... . Если упоминание компании есть на странице , то в ячейке напротив адреса сайта ставится 1, иначе 0. Для примера заполнены строки 2 и 34 файла cloud.mail.ru/public/5sLP... . Необходимо учитывать синонимы транспортных компаний: для СДЭК это cdek, для ДПД это DPD, для Boxberry – Боксберри, Почты России – Почта России, 5Post – 5 Пост и Пятерочка. 

Парсер должен сохранять результат в Excel или CSV (json обсуждается отдельно). На вопросы отвечу в личных сообщениях.
Разделы:
Опубликован:
18.10.2022 | 15:08 [поднят: 18.10.2022 | 15:08] [последние изменения: 18.10.2022 | 21:33]
Заказ находится в архиве
Откликнуться

Выберите способ верификации:

Обновите страницу после прохождения верификации.

Посмотреть другие заказы

Теги: Специалисты по парсингу, недорого, FL.ru

Наши партнеры
Сведения об ООО «Ваан» внесены в реестр аккредитованных организаций, осуществляющих деятельность в области информационных технологий. ООО «Ваан» осуществляет деятельность, связанную с использованием информационных технологий, по разработке компьютерного программного обеспечения, предоставлению доступа к программе для ЭВМ и является правообладателем программы для ЭВМ «Платформа FL.ru (версия 2.0)».