Есть задача написать скрипт на python, который поможет создать базу данных из книги по математике (нераспозанная графика в pdf)
drive.google.com/file/d/1... Нужно:
1. отделить полезный текст условий и решений и полезную графику
2. распознать текст и проверить его
3. структурировать и сопоставить данные (номер главы/номер задачи/условия задачи/ картинки условия/ решение задачи / картинки решения)
4. записать их в БД (примерные модели данных прикладываю)
Известно, что:
1. ответы начинаются с 385 страницы
2. номера страниц подписаны внизу
3. номера и названия задач в первой половине книги (страницы 1-384) выделены болдом и выровнены посредине
4. соотвествующие номер ответов выделены болдом начиная с 385 страницы
5. задачи и ответы сопоставляются по двух числам: номер главы + номер задачи
На выходе хочу видеть исходник скрипта / папку с картинками / готовый дамп обработанной базы
========================================
Задача только для фрилансера, посредники и студии не пишите!
От вас:
- подтверждение вашей экспертизы
- краткое описание предлагаемого подхода, библиотек
оценка времени и денег
Оплата через СБР или по факту.
Цена указана примерная, пишите свои варианты.