Подключите нашего Telegram-бота для уведомлений о новых проектах

Парсер сайта (html таблицы) на PHP или Python

w
Заказчик
Отзывы фрилансеров: + 188 - 2
Зарегистрирован на сайте 18 лет и 5 месяцев
Бюджет: 1500 ₽/час
Срок: До недели
Бюджет и сроки обсуждаемые
Нужно сделать скрипт который через curl парсит данные с одного сайта. собирает их в базу и выводит. 

Макет  для интерфейса вывода – какой-нибудь отсюда (не принципиально)
bootstraptema.ru/stuff/te...
Важный момент данные должны быть под паролем (htpasswd пойдет, но лучше все же в базе хранить или в конфиге)

Еще важно чтобы в таблице можно было сортировать и фильтровать по всем данным + по датам/месяцам, а также в конце таблицы должны быть суммы

И так.
Загружать данные будем раз в месяц, в настройках мы должны ввести ссылку, логин и пароль для авторизации и нажать "спарсить данные".
Контент по ссылке будет выглядеть так:
disk.yandex.ru/i/IzoS20nU...
Слева – номер заказа, он кликабельный.

Нужно через curl зайти по этой ссылке, зайти по каждой ссылке в таблице
Внутри нам нужны эти данные (см скрин), их добавляем в таблицу (помимо самого номера заказа, в примере это 1469979) и выводим в таблице
disk.yandex.ru/i/AL95O2pR...

Далее данные нужно брать уже из "общей таблицы".
Обязательно берем дату, кладем ее к нам в таблицу
Сумму. По одному заказу может быть несколько сумм, подробнее о вариантах будет в "описании операции" и "тип операции" ниже.

У одного заказа может быть три суммы в минус, и несколько – в плюс: списание за товар (все можно посмотреть в типе операции),  списание (описание операции будет "Упаковка в коробку"
Списание за отгрузку (нужно смотреть какого числа была это операция и делить ее между всеми заказами в этот день)
В плюс – начисление за возврат. Т.е. вы водим эти 4 суммы (или не все, если не все есть), а также считаем сумму сколько получилось по каждому заказу.
Дополнительно могут быть списания за возврат – их просто выводим отдельной строкой без заказа
Если тип операции "Поступление на рассчетный счет" – его игнорируем

Помимо этого могут быть такие варианты типов операции
disk.yandex.ru/i/xtjFUM2G...
disk.yandex.ru/i/WDGHVYew...
Их можно идентифицировать по скобкам после номера заказа, заходить в них не надо, просто нужно сложить все минусы и прибыль (это новый столбец) и вывести. Вместо второго столбца (начинающуюся на двойку из страницы заказа) нужно писать то, что в скобках

В дальнейшем из экселя появятся еще два значения – прибыль (она уже описана в прошлом абзаце), и несколько комиссий маркетлпейса, пока точно не можем сказать сколько)

В конце таблицы должна быть сумма по всем доходам/расходам, а в каждой строке должна быть сумма расходов, сумма доходов и сумма этих двух значений
Разделы:
Опубликован:
06.05.2024 | 09:36 [поднят: 06.05.2024 | 09:36]

Теги: Специалисты по парсингу, недорого, FL.ru

Наши партнеры
Сведения об ООО «Ваан» внесены в реестр аккредитованных организаций, осуществляющих деятельность в области информационных технологий. ООО «Ваан» осуществляет деятельность, связанную с использованием информационных технологий, по разработке компьютерного программного обеспечения, предоставлению доступа к программе для ЭВМ и является правообладателем программы для ЭВМ «Платформа FL.ru (версия 2.0)».