Существует такая библиотека LIBSVM (
www.csie.ntu.edu.tw/~cjli..., среди прочего она позволяет делать классификацию объектов методом опорных векторов, но к этому моя задача не имеет никакого отношения.
Суть в том, что библиотека написана на С, имеет открытые коды и есть кое-что, что мне не подходит, и нужно переписать. Это проверка точности классификации. На данный момент программа использует метрику:
Accuracy = ((r kr) + kw)/n
kw количество документов, которые классификатор неправильно отметил как не относящиеся к искомой категории.
kr количество документов, которые классификаторов правильно отметил как относящиеся к искомой категории.
r общее количество документов, относящихся к искомой категории по мнению классификатора.
n общее количество документов, относящихся к искомой категории.
А мне надо, чтобы было Accuracy = kr/r
Т.е. фактически поменять одну строчку кода, проблема только, что я не знаю Си поэтому и прошу о помощи.
Вторая задача не сильно сложнее и требует знаний Python, которых у меня тоже нет.
В этом пакете есть скрипт grid.by который просто запускает алгоритм (об изменениях в котором говорилось выше) много раз с разными параметрами и считывает метрику точности (которую выше мне нужно было заменить). Соответственно потом выбирает лучший вариант и предлагает эти параметры. Проблема в том, что он подбирает параметры А и Б (условно), а мне нужно менять параметр С (только один).
Задача сводится к тому, чтобы:
1. Разобраться с библиотекой (могу и сам объяснить) и немного сутью вопроса в общих терминах, так как глубоких изменений не надо. Документация вся есть и довольно подробная.
2. Прочитать код и внести изменения.