2015 Oct 12; 10:20 AM; Oakville, ON, Canada.
— После оптического распознавания получается текст вида (фрагмент имеющий отношение к знаку вопроса „?“ :
Word word … word ?
Word word … word ?.
Word word … qword?.
— Некачественный получается текст, очень плохой исходный материал. Потому я всячески пытаюсь его почистить.
— Сначала удаляю пустые строки, потом много пробелов заменяю на один пробел, удаляю непечатные символы и так далее, для этого я „смастерил
“ скрипт. А в конце уже пытаюсь „шлифовать такие мелочи“ как пробел перед знаком вопроса.
— Естественно вот так всё работает после того как Вы указали:
mif@mif-Inspiron-530s:~$ echo Word ?. | sed 's/ ?\./?/'
Word?
mif@mif-Inspiron-530s:~$
— А я почему-то решил, что „?“ как специальный символ нужно экранировать и упорно сочинял комбинации с „\?“ …
— И вроде же читал документацию, но видимо недостаточно…
Спасибо,
Azure, выйду на пенсию и сразу возьмусь за программирование!