Парсинг статичного html (статьи с комментариями) в базу modX Evolution
Дано - статичный сайт на html, статейные страницы с комментариями. Требуется перенести на modX Evolution с сохранением адресации (страниц, картинок и т.п., порядка 300 страниц). Задача осложнялась тем, что верстка каркаса и стилистика оформления страниц не везде была одинаковой.
Был написан парсер контента - выделение из него статьи, комментариев, очистка html кода (приведение к нормальному виду), формирование sql запроса на добавление спарсенных данных в базу modX Evolution.
Для поддержки схемы адресов url и папок хранения изображений были внесены соответствующие хаки в движок modx evo и файл-браузер.
https://www.fl.ru/users/korobkovandrey/viewproj.php?prjid=3662341