Для OpenSearch необходимо помочь в решении задачи хранения/выборки текстовых файлов.
Индексируем файлы с:
2. Text здесь храним текст (по нему ищем как полнотекстово так и используя REGEX выражения по "вкусу" пользователя)
3. Tags.{TagID} вот тут интереснее: в отдельной базе добавляются/обновляются REGEX правила по полю Text (3 массива правил: 1 "если хоть одно True то проставляем Tag", 2 "если хоть одно True то не проставляет Tag", 3 "Tag проставляется ТОЛЬКО когда все правила выполнены"). Каждой записи проставляются теги согласно этих правил и при обновлении правил должны обновляться теги.
{
"include" : ["TestREGEX"],
"exclude" : ["Wrong text"],
"important": ["MustBe", "AlsoMustBe"]}
Что надо сделать (Python предпочтительно, Go, Node.JS):
- функция обновления/добавления тегов для уже существующего индекса (я так понимаю что можно сделать без переиндексации/пересоздания индекса)
- функция удаления тегов
насколько я понимаю это можно сделать используя Update by Query:
opensearch.org/docs/lates... воткнув внутрь скрипт:
www.elastic.co/guide/en/e...