Бюджет:
1000 руб
Написать функцию очищения HTML текста на PHP
У меня задача, скачивать много сайтов, и сохранять их в хранилище. Чтобы данные занимали меньше места, нужно оптимизировать полученных HTML. Для этого нужно:
- Заменить множество пробелов и табов на один
- Заменить множество переносов строк на один
Изменения в дереве. Изменения не производить внутри блока JS скриптов, тоесть вообще не трогать текст внутри
<script type="text/javascript">, <script> ...
- Удалить стили объявленные между <style></style>
- удалить атрибуты style height width alt title border у всех элементов
- удалить src у всех <img>
- удалить все тэги
, <hr> (c учетом всех типов написания <br/>
<br > ...)