Парсер-грабер досок Avito, irr, dmir, cian по услугам и недвижимости
www.avito.ru realty.dmir.ru/
www.cian.ru/ irr.ru/
Требования:
Данные должны парситься в excel
Возможность задания временного интервала для парсинга
Возможность запуска скрипта вручную и по крону.
Возможность парсинга через прокси
Распознавание телефонов с картинок (автоматически, если не получается то возможно при помощи антигейта)
Возможность скачивания фоток к объявлению
Возможность задания ключевых слов по которым должны парситься доски
Возможность замены шаблонов при смене шаблонов страниц выдачи у досок
Перед тем как попасть в итоговый файл, объявление нужно проверять на дубликат по всем уже сграбленным объявлениям из этого источника, то есть, если url объявления другой, но все поля совпадают, это объявления нужно пропустить.
Есть то, что надо парсить.
Необходимо иметь опыт выполнения подобных работ.
Рассматриваю только конкретные предложения
СБР только