Есть docx2txt, но с ней никак не удается мне вытащить имя файла, в котором находится текст, на стандартный вывод, приходится выполнять конвертирование в txt, и уже после этого вытаскивать имена файлов; как победить - пока не понял. По odt пользую odt2txt, по pdf, соответственно, pdftotext.
Уважаемый zg_nico, две первые программы я поставил, опробовал. docx2txt у меня вообще не пашет с командой find . -name "*.docx" | while read i; do docx2txt "$i" | grep -H --label="$i" -n "mydomain"; done
ну да это полбеды, не очень и нужно.
А pdftotext поставить не могу:
$ sudo apt install pdftotext
Чтение списков пакетов… Готово
Построение дерева зависимостей
Чтение информации о состоянии… Готово
E: Невозможно найти пакет pdftotext
Плиз, подскажите, как-то можно решить проблему?