Бюджет:
25 000 руб
1. Создать систему для извлечения статей и их библиографических ссылок из различных источников (Selenium).
2. Разработка алгоритма для проверки соответствия статей. Проверить, упоминается ли данная статья в списке библиографических ссылок других статей.
Методы:
Разработка алгоритма поиска: Создание алгоритма, который может искать "неточные" соответствия, учитывая возможные вариации в названиях статей или авторах.
Интеграция с базой данных: Сопоставление данных из различных источников для проверки соответствий.
Алгоритмы сравнения строк: Использование алгоритмов, таких как Levenshtein distance, для обнаружения неточных совпадений в названиях.
3. Разработка графического интерфейса пользователя
Цель: Упростить процесс поиска статей и вывода результатов для пользователя.
Функции:
Пользовательский интерфейс: Создание простого и интуитивно понятного интерфейса с возможностью ввода названий статей.
Запуск поиска: Интеграция с разработанным алгоритмом для выполнения поиска по запросу пользователя.
Вывод результатов: Представление результатов в удобной для пользователя форме, например, список статей с указанием, где именно упоминается исходная статья.
Начата работа с селениумом. Но не выполнена до конца. Необходимо, чтобы программа могла работать как elibrary так и с гугл солар. Можно как с нуля, можем скинуть наш исходный код.