По договоренности
Требуется написание парсера с многостраничного pdf файла в структурированный массив данных в xml
Желательно на php или любой другой с открытым кодом и документированием.
Можно использовать бесплатный pdf экстрактор или прочие доступные средства, главное,чтобы результат парсинга можно было структурировать.
На входе четыре разных по структуре pdf отчета на выходе четыре разных по структуре xml