Есть сайт
ticketeria.es/ это агрегатор различных эвентов.
События приходят от поставщиков, иногда с тегами, то есть категориями, иногда без тегов. Принципиально у любого события должен быть главный тег и не обязательные дополнительные теги. Например Главный Музыка, а дополнительный Рок.
Задача сделать нейронку, либо две, которые будут определять главный и дополнительные теги.
Сейчас есть проект в Гугл Колаборатории, в нём определяется с точностью около 70% только один тег. Сделано было для теста. На большой выборке колаборатория падает, это одна из задач.
Конкретно что нужно сделать:
1. Нужно дописать блок, для ручной проверки уже обученной сети, например взять кусок текста, вставить и что бы сеть классифицировала.
2. Точность распознавания тестовой выборки взята средняя, а нужно показать точность распознавания каждого отдельного тега.
3. После предыдущего пункта решить то ли архитектуру сети крутить и её параметры, то ли выборку, так как нужна точность не менее 85%.
4. Нейронка классифицирует только на один тег, но у нас события могут быть с разными тегами, поэтому надо присваивает главный и остальные.
5. Из обученной сети нужно сделать микросервис, что бы использовать её в бою.