По договоренности
Нужно сделать скрипт (прогу) для автоочистки текстов от знаков кириллицы.
У меня имеются тексты механического перевода с русского языка на иные языки.
В этих "переводах" много мусора куски русских слов или текста попадаются...
Необходим скрипт по очистке исходного текста (.txt, utf-8) от кириллических символов и знаков.
Данную работу я делаю сам Майкрософт Вордом, но это долго, хотелось бы автоматизировать, убыстрить :)
1. шаг один меняем кириллицу на пустые значения
2. шаг два удаляем оставшийся после чистки мусор. типа двойные/тройные пробелы, ", ..."
максимально возможный вариант мусора какой появляется предоставлю, чтобы его вписать в программулину.
* сделать вторую опцию чистка от eng (английских символов)
т.е. две кнопки чистим файл от кириллических символов либо латинских.
* * сделать так чтобы файл со списком автозамен (шаг 2) я мог править
*** возможность загрузки много файлов, названия файлов сохраняем, помещая в другую папку (чтобы не перепутать)