Есть файлы, содержащие html код следующего вида:
drive.google.com/open?id=... Нужно преобразовать html таблицы в формат синтаксиса MarkDown, применив некоторые изменения к количеству элементов (к примеру, есть такой сервис для конвертации:
markdowntables.mrvautin.c... Интересы моих друзей 10 интересов и по 10 друзей в каждом (сейчас могут быть сотни интересов и сотни друзей в каждом, но нам это не нужно, следовательно сократить).
Похожи на меня 10 похожих людей и по 10 пересекающихся слов (сейчас указаны все пересекающиеся слова, а нам это не нужно)
- Лучшие друзья не более 20 человек
Последователи не более 20 человек.
Авторитеты не более 20 человек.
Мои слова за периоды не более 10 слов за период (все периоды).
Мои излюбленные слова не более 20 слов.
Мои публикации одобряемые и комментируемые НЕ выводить.
Заголовки таблиц должен браться из исходного файла, потому как он может быть на разных языках, соответственно и в результате тоже надо получить все на разных языках.
Каждый username преобразовать к виду @username (добавить собаку спереди).
Результирующий файл не должен содержать html синтаксиса, только markdown.
Вторым сделаем авто-получение данных по API в том же формате. API надо передать никнейм, по которому за 10-40 минут сформируется отчет, который надо приходить и проверять, сформирован ли. Если сформирован делать все что описано и предоставлять файл в синтаксисе маркдаун.