Есть большая библиотека таких видео и фото материалов. У неё также есть API.
Нужно автоматизировать процесс создания таких роликов по одинаковому сценарию и монтажу, который будет повторяться. Условно – это чередование фотографий и видео роликов.
По факту нужно генерировать текст ролика, обращаться можно к ChatGPT по API. Далее текст озвучивать по API Elevenlabs или Hailuo. Ставить фоновую музыку как в референсе. Дальше объединить фото, видео, озвучку, музыку – это уже второй вопрос, как это шаблонизировать чтобы выглядело приятно и легко можно было вставлять из ролика в ролик одинаковый алгоритм монтажа.