Он получается текст по API, озвучивает его через выбранную голосовую модель и отправляет обратно файлик в формате .oog с озвучкой этого текста.
ЗАДАЧИ:
1) Первая и самая важная: В данный момент, сервис работает только с моделями формата .pt, модели формат .pth никак не воспринимаются. Нужно либо научить его работать с форматом .pth либо как-то форматировать модели в .pt 2) Сейчас сервис поддерживает только одного пользователя, нужно сделать возможность заводить api ключи для разных людей, которые смогли бы отправлять запросы.
далее будут другие задачи, рода личного кабинета, но нужно решить вопрос с первыми двумя.