Бюджет:
7000 руб
Нужен парсер форума на движке VBulletin(примеры сайтов дам исполнителю)
На входе ссылка(или ссылки) на раздел с темами
Парсер собирает заданное количество тем(если ни чего не задано, то собирает все темы)
После сбора тем переходит к сбору топиков этих тем(учесть что в теме может быть одна страница, а может несколько)
Из темы нужны:
Путь темы: Категория-> Подкатегория(и т.д.)
Заголовок топика, если есть
Текст топика
Если в топике есть ответ на предыдущий топик(в теге- ОТВЕТ), то его тоже добавляем.
Если в топике есть картинка, то должна остаться ссылка на картинку.
Вложения из топиков не нужны.
Ссылки из топиков оставить
В процессе работы отработанные ссылки на разделы и темы удаляются. Чтоб в случае остановки(или не предвиденной остановки) начать работу с места остановки.
Требования к написанию:
Документированный код (комментирование этапов работы в коде)
Разделение этапов работы по файлам- интерфейс отдельно, парсинг разделов в один файл, парсинг тем во второй файл и т.д.
Требований к интерфейсу как таковых нет- окно ввода ссылок на разделы и кнопка "Собрать ссылки на темы", окно с ссылками на темы и кнопка "Парсить топики".