Разработка парсера аптеки: Портфолио фрилансера Softorium Pro 12.12.2023, работа №1 - FL.RU
-->-->
Softorium Pro
Фрилансер готов решать задачи повышенной сложности и работать с крупными проектами.
Инструменты и навыки
docker python selenium
К списку работ
Softorium Pro
Softorium Pro

Разработка парсера аптеки

image
https://softorium.pro/post/Razrabotka_parsera_apteki Нередко к нам об­ра­ща­ют­ся за раз­ра­бот­кой парсеров. Что такое парсер Парсер — это прог­рамма, которая собирает с сайтов ин­форма­цию по заданным па­рамет­рам. Это могут быть название и сто­имость товара или контакты от­ветс­твен­ных лиц. С помощью парсера собирают контент для своего ресурса, например аг­ре­гато­ра новостей, или ин­форма­цию о товарах с сайта пос­тавщи­ка. Сам по себе сбор ин­форма­ции с сайтов не является тех­ни­чес­ки сложной задачей или уголовно на­казу­емым — ин­форма­ция, раз­ме­щен­ная в пуб­личном доступе, обычно не ох­ра­ня­ет­ся, кроме от­дель­ных случаев, ре­гули­ру­емых ав­тор­ским правом. Но, если вла­дель­цы сайта-донора не хотят делиться кон­тентом с кон­ку­рен­та­ми, они при­лага­ют серь­ез­ные усилия для защиты своей ин­форма­ции. И тогда задача создания парсера мно­гок­ратно ус­ложня­ет­ся. Наш заказчик — владелец онлайн-аптеки — хотел получить ин­форма­цию о ценах сайта-кон­ку­рен­та. Парсер должен был иметь сле­ду­ющие функции: • воз­можность запуска по рас­пи­санию; • защиту от од­новре­мен­но­го запуска нес­коль­ких про­цес­сов парсинга; • обход защиты донора; • воз­можность ис­поль­зо­вать прокси для обхода бло­киров­ки IP-адреса, с которого от­прав­ля­ют­ся запросы; • сбор ин­форма­ции по ка­тего­ри­ям товаров с воз­можностью из­ме­нения списка ка­тего­рий; • сох­ра­нение ре­зуль­та­та работы парсера в txt-файл. С уважением, Евгений Телеграмм @john081076