Подключите нашего Telegram-бота для уведомлений о новых проектах

Программа-парсер телеграма

S
Заказчик
Отзывы фрилансеров: + 39 - 0
Зарегистрирован на сайте 11 лет и 8 месяцев
Бюджет: 30 000 руб
293.13 $ — 281.57 €
Дедлайн: 11.03.2022
Написать программу, работающую в телеграмме и осуществляющую парсинг сообщений от пользователей в чатах (до 100 чатов, может больше). Программа должна уметь "читать" сообщения, обращая внимание на ключевые слова, и автоматически составлять и записывать данные в Google таблицы, разобрав каждое сообщение на: 
1.Город;
2.Модель;
3.Цена;
4.Состояние (новый, б/у);

При этом в одном сообщении может быть несколько разных товаров (1-50∞).
В какой момент программа будет понимать что она распознала все модели? (как будете решать этот вопрос)
Наши варианты: 
Найдены все пары ключевых слов (связка: модель+цена), т.е. если цена найдена, а модель не найдена, то Прога выводит сообщение админу;
Распознавание X% текста
Например, если распознано 70%, то считать сообщение обработанным, иначе нет.
Для корректной работы этого варианта необходимо игнорирование "специальных" символов: эмодзи и т.д. (подается с помощью таблицы или блокнота не принципиально "Слова-эмодзи"). 

На вход программы подаются ссылки на Google таблицы со списками:
Стоп-слова;
Слова-замена;
Слова-покупка;
Слова-эмодзи;
Ключевые слова – Модели.

На выходе должно быть 2 таблицы: таблица OUT-Продажа и таблица OUT-Покупка.
К таблице OUT-Продажа относится следующее:
Если программа увидела стоп-слово, она должна проигнорировать всё сообщение (например, слово "ремонт").
Если нет, программа прогоняет сообщение по ключевым словам (обращая внимание на пробелы, отступы и т.д.) и заносит распознанные модели в таблицу OUT.
Например, появляется сообщение: "Iphone 13 Pro Max 512GB. Цена: 110т.р. Новосибирск.". Программа должна определить, что:
1. "Новосибирск" – это город.
2. "Pro Max 512" – это модель; 
3. "110т.р." – это цена, равная 110000;
Программа должна занести полученные слова в таблицу OUT-Продажа в строго отведенные для них столбцы (модель в столбец c моделями, цена в столбец с ценами и т.д.);
Помимо того, что программа должна уметь находить и определять слова, она должна записывать в таблицы, в каком чате было написано сообщение, дату публикации и город (если он написан в самом сообщении). Если город не указан, то устанавливается стандартный город чата, который указывается пользователем.

К таблице OUT-Покупка относится следующее:
В эту таблицу данные записываются в том случае, если в сообщении были обнаружены Слова-покупка.
Например, "КУПЛЮ Iphone 13 Pro Max 512GB". В данном случае, Слово-покупка – слово "КУПЛЮ". Следовательно, сообщение уходит в таблицу OUT-Покупка;
Как и в таблице OUT-Покупка, в данной таблице должны иметься данные: название чата, город (если не указан в сообщении, то устанавливается стандартный город чата), дата сообщения.

Должен производиться анализ таблицы OUT:
Очистка неактуальных и устаревших записей;
Формирование ТОПа по цене с дальнейшим вымещением товаров с самой высокой ценой.

У программы должно быть 3 режима работы:
Режим полного обучения (ЕСЛИ ЭТО ВОЗМОЖНО СДЕЛАТЬ, если нет, то упростим до обычного уведомления с подсветкой цветов)
Появляется окно пользователя, где выводится сообщение из чата. Ключевые слова должны помечаться цветами (фон текста). Например, зеленый цвет для модели, красный – для цены, серый – для города, желтый – для состояния, синий – для наличия(полутона). Тем самым программа спрашивает, правильно ли она определила ключевые слова. Если да, пользователь разрешает внести запись в таблицу. Если нет, пользователь вручную делает правильную расстановку ключевых слов. При этом программа должна "учиться", то есть автоматически вписывать в таблицу замен те изменения, которые внес пользователь в ходе проверки. Также, в данном режиме отключается функция стоп-слов, связанная с игнорированием сообщения;

Режим частичного обучения
То же, что и режим полного обучения, но окно с сообщениями появляется только в том случае, когда возникают "критические" ситуации: не найдена пара ключевых слов (связка: модель+цена), т.е. если цена найдена, а модель не найдена, то Прога выводит сообщение админу;
Режим анализа
В этом режиме программа просто заносит записи в таблицу так, как она "прочитала" ключевые слова, не обращая внимания на ошибки и не распознавания.

! ! ВНИМАНИЕ ! ! !
Друзья, для экономии нашего с вами времени указывайте сразу:
1. Стоимость за реализацию задачи?
2. как долго будете делать ?
3. был ли подобный опыт ?
! ! ! ВНИМАНИЕ !
Разделы:
Опубликован:
06.03.2022 | 16:20 [поднят: 06.03.2022 | 16:20] [последние изменения: 06.03.2022 | 16:19]

Теги: написать программу, создать программу, разработать программу, разработчики программ, прикладной программист

Наши партнеры
Сведения об ООО «Ваан» внесены в реестр аккредитованных организаций, осуществляющих деятельность в области информационных технологий. ООО «Ваан» осуществляет деятельность, связанную с использованием информационных технологий, по разработке компьютерного программного обеспечения, предоставлению доступа к программе для ЭВМ и является правообладателем программы для ЭВМ «Платформа FL.ru (версия 2.0)».