Необходимо написать автоматический парсер сбора информации с сайта
www.zakupki.gov.ru/.
Парсер должен:
- собрать всю информацию имеющуюся на сайте по закупкам и организациям.
- автоматически пробегаться по новым закупкам и организациям сохраняя их со всеми вложенными файлами
- сохранять всю информацию в базу mysql, весь текст из doc/pdf файла помещать в базу, чтобы по ним мог вестись полнотекстовый поиск (если есть вариант как вести полнотектовый поиск по файлам не загружая их в базу, он рассматривается).
- быть документирован
- автоматически выполнять сбор новых данных
Можем предоставить сервер для тестирования сбора данных.