Бюджет:
40 000 руб
- каждый день парсинг сайта и выгрузка данных в папку;
- данные на сайте обновляются нерегулярно, потому программе нужно каждый день проверять наличие обновления;
- предусмотреть приостановку и продолжение работы с того же места в случае обрыва связи;
- если последняя выгрузка была, например, за 2024-07-01 2024-07-10, то результат сохраняем в файл соответствующего периода 2024-07-01.xlsx, 2024-07-02.xlsx и т д. Следующее обновление сохраняем в следующий файл, например, 2024-07-11.xlsx, 2024-07-12.xlsx и т д.
- в конце месяца все файлы нужно объединить в один. Но что бы сохранились и эти куски по дням и один большой файл за месяц.
Цель: получить максимально полную базу данных сайта-источника. На данный момент это данные за 9 лет: с 2015-01-01 по 2024-07-10
- нужна шкала процесса, то бы видеть в реальном времени, что программа работает, что конкретно она делает, какой процент от задачи выполнен и процент от всего задания готово.
Более подробное ТЗ и доп. материалы во вложении