Написать парсер сайта
www.kant.ru 1) Парсер проходит последовательно по дереву товаров,
сверху вниз.
2) Парсер заходит рекурсивно в каждую подкатегорию и заходит в каждый товар каждой категории.
3) Парсер определяет нужно ли записывать товар в результаты или нет.
Если у товара напротив поля "Москва. Нагорная" стоит "есть",
либо указаны размеры, то эту запись добавлять в список.
4) Если запись не нужно добавлять в список, идем к следующему товару.
5) ЕСЛИ запись нужно добавляется в список, то парсер записывает данные по товару в csv-файл.
Товары бывают двух типов:
1) Без размеров, пример: навигатор
www.kant.ru/show_good1.ph... в поле "Москва.Нагорная": "есть"
2) С размерами/цветами, пример туристические ботинки
www.kant.ru/show_good1.ph... в поле "Москва.Нагорная" указаны размеры: "4, 4,5, 5, 5,5, 6, 6,5, 8,5"
Состав csv файла:
путь;название товара;код товара;модель;размеры через / если второй тип;цена;старая цена если есть;
для первого примера должна появиться такая запись:
Главная / Приборы / Garmin /;Туристические Colorado 300;457450;;;19000;24235;
для второго должна появиться запись:
Главная / Обувь для города / Salewa / 2012;63116 WS MTN TRAINER MID GTX 7281 Светло-коричневыйГолубой;693206;unisex;4/4,5/5/5,5/6/6,5/8,5;7790 ;;
товар, который не должен появится:
www.kant.ru/show_good1.ph... 6) Результат должен быть оформлен в виде php-скрипта с кнопкой [ЗАКАЧАТЬ С КАНТА ПРАЙС]
По нажатию кнопки запускается парсер, который
1) парсит сайт (см 1 -5 пункты)
2) записывает данные в файл в том же месте что и Php-скрипт
3) выдает ссылку на скачивание этого файла: скачать результаты <а ..>здесь</a>
Парсер несложный. Реально написать за выходные неспешно.
Жду предложений по цене.