Подключите нашего Telegram-бота для уведомлений о новых проектах

Парсер картинок со старой версии сайта

g
Заказчик
Отзывы фрилансеров: + 4 - 0
Зарегистрирован на сайте 14 лет и 10 месяцев
Бюджет: 1000 руб
9.83 $ — 9.42 €
Исполнитель определен: Михаил Новиков  
Пункт 4. и подпункты 0) в заданиях выполнять не обязательно, но кто сможет, то доплатим.

Мы доделываем новую версию сайта www.windclub.ru/ и нам нужно отпарсить картинки, которые используются в описании позиций каталога (мест катания)
1.Собираем Урлы.
Заходим на страницу www.windclub.ru/index.php... – главная страница каталога и собираем урлы всех мест (алачати, Дача детский серф лагерь
и т.д.)
www.windclub.ru/index.php...
и т.д.
В итоге, Скриптом или в ручуню собрать список урлов мест – всего их 117 вроде бы получается....

2. Скрипт заходит в каждоый урл и находит картинки. В описании мест могут использоваться изображения 2 типов
0) src="/index.php?id=18&usepages=1&placesmallpict=7" – это основное изображение места (изображение хранится в БД!!!, понятно что это тупо, но старая версия была сделана в 2003 году)
1) src="/images/dahab/DSCF0454.gif" – файл лежит в папке images/dahab/
пример страницы, www.windclub.ru/index.php...

ВНИМАНИЕ.... В описнаии мест встречаются Картинки с внешних сайтов, которые парсить не нужно. пример пути картинки
remote.bronni.ru/Handlers...

 
3. Цель: сохранить картинки
Для
0) сохранить в папке place/. Имя картинки принимает значение placesmallpict (в данном примере placesmallpict =7). расширение файла .jpg или .gif – не имеет значение, главное это имя
1) сохранить картинку в images/dahab/. Имя оставить то же. Аналогично для других картинок, например, tour/alacati/23.jpg

4. Аналогично  типу 0 отпарсить картинки для отелей и серфцентров
Каждое место может содержать (или не содержать) список отелей и СЦ.
floomby.ru/content/bPHip3... – скрин
Собрать список всех отелей и СЦ. и также отпарсить основные изображения отелей, СЦ
Для отелей
0) сохранить в папке hotels/. Имя картинки принимает значение hotelpict (в данном примере hotelpict=17), расширение .jpg или .gif, не знаю какое там у картинки, главное это имя
Для СЦ
0)- я не увидел нигде картинок, но если кто найдет, то аналогично отелям и сохранять в папке surfcentres/


РЕЗУЛЬТАТ:
Для меня нужно иметь каталог картинок, разбитых по папкам
Разделы:
Опубликован:
16.05.2011 | 19:08

Теги: нужен программист, резюме программиста, требуется программист, резюме веб программиста

Наши партнеры
Сведения об ООО «Ваан» внесены в реестр аккредитованных организаций, осуществляющих деятельность в области информационных технологий. ООО «Ваан» осуществляет деятельность, связанную с использованием информационных технологий, по разработке компьютерного программного обеспечения, предоставлению доступа к программе для ЭВМ и является правообладателем программы для ЭВМ «Платформа FL.ru (версия 2.0)».