Разработка умного поиска с учетом морфологии в BigData решениях
Полное описание: https://softorium.pro/post/Razrabotka_umnogo_poiska_s_uchetom_morfologii_v_BigData_resheniiakh
Заказчик - поставщик и арендодатель оборудования для аттракционов. Перед нами была поставлена задача разработки умного поиска по сайту https://www.art-active.ru/. Также требовалось разработать парсинг с сайта по его фиду - потоку контента, который автоматически подгружается блоками на веб-странице или в приложении.
Фид представляет из себя XML-файл, содержащий всю информацию, о товарах, отображающуюся на сайте: наименование, цена, категория и прочее. Эти данные определяют объекты, хранимые в базе данных.
Был реализован поиск с учетом морфологии, добавлена необходимая приоритетность поиска, скорректировано разбиение фразы на токены, переработан поиск по ключевым словам. Токены представляют из себя массив слов из которых состоит запрос. Например, токенизатор пробелов, который используется по стандарту, разделит текст на токены, когда увидит пробел. Текст «Быстрая коричневая лиса!» Преобразуется в [«Быстро», «коричневая», «лиса!»].
Заказчику были предоставлены консультации по тонкостям работы и настройке поиска.
С уважением, Евгений Сомов.
Телеграмм @john081076
Тел. +7-904-966-73-75
https://www.art-active.ru/
Другие работы фрилансера
Фрилансер готов решать задачи повышенной сложности и работать с крупными проектами.