Бюджет:
30 000 руб
Написать программу, работающую в телеграмме и осуществляющую парсинг сообщений от пользователей в чатах (до 100 чатов, может больше). Программа должна уметь "читать" сообщения, обращая внимание на ключевые слова, и автоматически составлять и записывать данные в Google таблицы, разобрав каждое сообщение на:
1.Город;
2.Модель;
3.Цена;
4.Состояние (новый, б/у);
При этом в одном сообщении может быть несколько разных товаров (1-50∞).
В какой момент программа будет понимать что она распознала все модели? (как будете решать этот вопрос)
Наши варианты:
Найдены все пары ключевых слов (связка: модель+цена), т.е. если цена найдена, а модель не найдена, то Прога выводит сообщение админу;
Распознавание X% текста
Например, если распознано 70%, то считать сообщение обработанным, иначе нет.
Для корректной работы этого варианта необходимо игнорирование "специальных" символов: эмодзи и т.д. (подается с помощью таблицы или блокнота не принципиально "Слова-эмодзи").
На вход программы подаются ссылки на Google таблицы со списками:
Стоп-слова;
Слова-замена;
Слова-покупка;
Слова-эмодзи;
Ключевые слова Модели.
На выходе должно быть 2 таблицы: таблица OUT-Продажа и таблица OUT-Покупка.
К таблице OUT-Продажа относится следующее:
Если программа увидела стоп-слово, она должна проигнорировать всё сообщение (например, слово "ремонт").
Если нет, программа прогоняет сообщение по ключевым словам (обращая внимание на пробелы, отступы и т.д.) и заносит распознанные модели в таблицу OUT.
Например, появляется сообщение: "Iphone 13 Pro Max 512GB. Цена: 110т.р. Новосибирск.". Программа должна определить, что:
1. "Новосибирск" это город.
2. "Pro Max 512" это модель;
3. "110т.р." это цена, равная 110000;
Программа должна занести полученные слова в таблицу OUT-Продажа в строго отведенные для них столбцы (модель в столбец c моделями, цена в столбец с ценами и т.д.);
Помимо того, что программа должна уметь находить и определять слова, она должна записывать в таблицы, в каком чате было написано сообщение, дату публикации и город (если он написан в самом сообщении). Если город не указан, то устанавливается стандартный город чата, который указывается пользователем.
К таблице OUT-Покупка относится следующее:
В эту таблицу данные записываются в том случае, если в сообщении были обнаружены Слова-покупка.
Например, "КУПЛЮ Iphone 13 Pro Max 512GB". В данном случае, Слово-покупка слово "КУПЛЮ". Следовательно, сообщение уходит в таблицу OUT-Покупка;
Как и в таблице OUT-Покупка, в данной таблице должны иметься данные: название чата, город (если не указан в сообщении, то устанавливается стандартный город чата), дата сообщения.
Должен производиться анализ таблицы OUT:
Очистка неактуальных и устаревших записей;
Формирование ТОПа по цене с дальнейшим вымещением товаров с самой высокой ценой.
У программы должно быть 3 режима работы:
Режим полного обучения (ЕСЛИ ЭТО ВОЗМОЖНО СДЕЛАТЬ, если нет, то упростим до обычного уведомления с подсветкой цветов)
Появляется окно пользователя, где выводится сообщение из чата. Ключевые слова должны помечаться цветами (фон текста). Например, зеленый цвет для модели, красный для цены, серый для города, желтый для состояния, синий для наличия(полутона). Тем самым программа спрашивает, правильно ли она определила ключевые слова. Если да, пользователь разрешает внести запись в таблицу. Если нет, пользователь вручную делает правильную расстановку ключевых слов. При этом программа должна "учиться", то есть автоматически вписывать в таблицу замен те изменения, которые внес пользователь в ходе проверки. Также, в данном режиме отключается функция стоп-слов, связанная с игнорированием сообщения;
Режим частичного обучения
То же, что и режим полного обучения, но окно с сообщениями появляется только в том случае, когда возникают "критические" ситуации: не найдена пара ключевых слов (связка: модель+цена), т.е. если цена найдена, а модель не найдена, то Прога выводит сообщение админу;
Режим анализа
В этом режиме программа просто заносит записи в таблицу так, как она "прочитала" ключевые слова, не обращая внимания на ошибки и не распознавания.
! ! ВНИМАНИЕ ! ! !
Друзья, для экономии нашего с вами времени указывайте сразу:
1. Стоимость за реализацию задачи?
2. как долго будете делать ?
3. был ли подобный опыт ?
! ! ! ВНИМАНИЕ !