Подключите нашего Telegram-бота для уведомлений о новых проектах
Парсер твиттер аккаунтов
Разместить заказ

a
Заказчик
Отзывы фрилансеров:
+ 3
- 0
Зарегистрирован на сайте 1 год и 11 месяцев
Бюджет:
по договоренности
Необходимо разработать многопоточный парсер, способный 24 на 7 по ключевым словам находить аккаунты в поиске, в комментариях, среди подписок и подписчиков у найденных пользователей. Парсер должен быть зацикленный, тобишь работать без остановки и производить свою работу по принципу волны. К примеру : Парсер нашел 1000 пользователей по заданным критериям, у этих 1000 пользователей , у каждого есть подписчики, комментарии, подписки.. Софт смотрит их, и у следующих смотрит также, зацикливая этот процесс совершая его до бесконечности. Таким образом, парсер должен быть способен парсить миллионы пользователей. Софт должен быть сделан в веб версии.
Функции:
1 Сканирование – сканирование должно осуществляться по вышеописанному сценарию. 1.1) Задать кол-во потоков – внедрить функцию выбора кол-ва потоков ддя сканирования 1.2) импорт прокси http/socks5
2. Фильтры. Добавить функцию установки фильтров на отбор аккаунтов. Фильтры : 1) год регистрации аккаунта 2) кол-во подписчиков 3) общий охват со всех постов за последние 30 дней 4) общее кол-во лайков за последние 30 дней 5) Соответствие по ключевым словам на аккаунте: В программу задаются слова, по которым будет происходить выборка: Допустим были указаны : nft, web3, dex, airdrop, значит, что все аккаунты имеющие такие слова на аккаунте подходят и будут занесены в базу. 6) Наличие определенного аккаунта в подписках, допустим если есть определенный аккаунт, допустим твиттер бинанса, то значит аккаунт подходит, и аккаунты, на которых нет этой подписки, не проходят по фильтру.
3. Функция блеклист. Аккаунты что были найдены по фильтрам, должны быть занесены в блеклист дабы не дублировать их повторно
4. Создать удобную датабазу с поиском и возможностью открыть найденное в браузере
Функции:
1 Сканирование – сканирование должно осуществляться по вышеописанному сценарию. 1.1) Задать кол-во потоков – внедрить функцию выбора кол-ва потоков ддя сканирования 1.2) импорт прокси http/socks5
2. Фильтры. Добавить функцию установки фильтров на отбор аккаунтов. Фильтры : 1) год регистрации аккаунта 2) кол-во подписчиков 3) общий охват со всех постов за последние 30 дней 4) общее кол-во лайков за последние 30 дней 5) Соответствие по ключевым словам на аккаунте: В программу задаются слова, по которым будет происходить выборка: Допустим были указаны : nft, web3, dex, airdrop, значит, что все аккаунты имеющие такие слова на аккаунте подходят и будут занесены в базу. 6) Наличие определенного аккаунта в подписках, допустим если есть определенный аккаунт, допустим твиттер бинанса, то значит аккаунт подходит, и аккаунты, на которых нет этой подписки, не проходят по фильтру.
3. Функция блеклист. Аккаунты что были найдены по фильтрам, должны быть занесены в блеклист дабы не дублировать их повторно
4. Создать удобную датабазу с поиском и возможностью открыть найденное в браузере
Разделы:
Опубликован:
14.02.2025 | 16:23 [поднят: 14.02.2025 | 16:23]