Нужна база всех песен с сайта
azlyrics.com/ CSV файл со следующими полями:
название песни
название исполнителя
текст песни
название альбома
год альбома
название категории
оригинальная ссылка
Все эти данные можно взять со страницы песни, сам парсер не будет сложным.
Проблемы:
- сайт часто банит
- очень много данных, по примерным подсчетам около 500 000