Подключите нашего Telegram-бота для уведомлений о новых проектах
Создание бота для парсинга сайта
Разместить заказ

s
Заказчик
Отзывы фрилансеров:
+ 0
- 0
Зарегистрирован на сайте 1 месяц
Бюджет:
100 000 руб
1238.24 $ — 1067.56 €
Данные о тендерах обновляются ежедневно.
Каждый тендер содержит:
Название тендера.
Сумму тендера.
Документ (PDF или другой формат), в котором указаны названия компаний-участников и их баллы.
Требования к обработке данных:
Программа должна автоматически собирать данные из 20 областей.
Для каждого тендера:
Извлечь название тендера и сумму.
Скачать документ и извлечь из него названия компаний-участников и их баллы.
Заполнить данные в Google Таблицу:
Каждая область должна иметь отдельный лист.
Столбцы: Название тендера, Сумма, Название компании, Баллы.
Фильтрация дубликатов:
Программа должна проверять, была ли компания уже добавлена в таблицу для конкретного тендера.
Если компания уже есть в таблице, её не нужно добавлять повторно.
Обновление данных:
Процесс должен запускаться ежедневно в автоматическом режиме.
Новые данные должны добавляться в таблицу без удаления старых записей.
Технические требования:
Интеграция с Google Таблицами (Google Sheets API).
Возможность работы с PDF-документами (использование библиотек для парсинга PDF, например, PyPDF2, pdfplumber).
Язык программирования: Python (предпочтительно) или другой, по согласованию.
Логирование процесса для отслеживания ошибок.
Дополнительно:
Возможность настройки областей и источников данных через конфигурационный файл.
Уведомления об ошибках (например, через email или Telegram).
Сайт тоже скину по почте
Каждый тендер содержит:
Название тендера.
Сумму тендера.
Документ (PDF или другой формат), в котором указаны названия компаний-участников и их баллы.
Требования к обработке данных:
Программа должна автоматически собирать данные из 20 областей.
Для каждого тендера:
Извлечь название тендера и сумму.
Скачать документ и извлечь из него названия компаний-участников и их баллы.
Заполнить данные в Google Таблицу:
Каждая область должна иметь отдельный лист.
Столбцы: Название тендера, Сумма, Название компании, Баллы.
Фильтрация дубликатов:
Программа должна проверять, была ли компания уже добавлена в таблицу для конкретного тендера.
Если компания уже есть в таблице, её не нужно добавлять повторно.
Обновление данных:
Процесс должен запускаться ежедневно в автоматическом режиме.
Новые данные должны добавляться в таблицу без удаления старых записей.
Технические требования:
Интеграция с Google Таблицами (Google Sheets API).
Возможность работы с PDF-документами (использование библиотек для парсинга PDF, например, PyPDF2, pdfplumber).
Язык программирования: Python (предпочтительно) или другой, по согласованию.
Логирование процесса для отслеживания ошибок.
Дополнительно:
Возможность настройки областей и источников данных через конфигурационный файл.
Уведомления об ошибках (например, через email или Telegram).
Сайт тоже скину по почте
Разделы:
Опубликован:
26.02.2025 | 11:51 [поднят: 26.02.2025 | 11:51] [последние изменения: 26.02.2025 | 11:51]