Подключите нашего Telegram-бота для уведомлений о новых проектах

Заказ закрыт
Сделать скрипт и наполнить БД информацией из нераспознанного PDF книги с задачами по математике

t
Заказчик
Отзывы фрилансеров: + 4 - 0
Зарегистрирован на сайте 12 лет и 2 месяца
Бюджет: 8000 руб/заказ
78.17 $ — 75.09 €
Дедлайн: 04.10.2024
Есть задача написать скрипт на python, который поможет создать базу данных из  книги по математике (нераспозанная графика в pdf) drive.google.com/file/d/1... 

Нужно:

1. отделить полезный текст условий и решений и полезную графику

2. распознать текст и проверить его

3. структурировать и сопоставить данные (номер главы/номер задачи/условия задачи/ картинки условия/  решение задачи / картинки решения)

4. записать их в БД (примерные модели данных прикладываю)

Известно, что:

1. ответы начинаются с 385 страницы

2. номера страниц подписаны внизу

3. номера и названия задач в первой половине книги (страницы 1-384) выделены болдом и выровнены посредине

4. соотвествующие номер ответов выделены болдом начиная с 385 страницы

5. задачи и ответы сопоставляются по двух числам: номер главы + номер задачи

На выходе хочу видеть исходник скрипта / папку с картинками / готовый дамп обработанной базы

========================================

Задача только для фрилансера, посредники и студии не пишите!

От вас: 
- подтверждение вашей экспертизы
- краткое описание предлагаемого подхода, библиотек
– оценка времени и денег

Оплата через СБР или по факту. 
Цена указана примерная, пишите свои варианты.
Разделы:
Опубликован:
01.10.2024 | 11:06 [поднят: 01.10.2024 | 11:06] [последние изменения: 30.09.2024 | 13:16]
Заказ находится в архиве

Теги:

Наши партнеры
Сведения об ООО «Ваан» внесены в реестр аккредитованных организаций, осуществляющих деятельность в области информационных технологий. ООО «Ваан» осуществляет деятельность, связанную с использованием информационных технологий, по разработке компьютерного программного обеспечения, предоставлению доступа к программе для ЭВМ и является правообладателем программы для ЭВМ «Платформа FL.ru (версия 2.0)».