Подскажите есть ли программы, которые позволяют выполнять рекурсивный поиск текста внутри doc, rtf, html, pdf-документов. Совсем хорошо, если такая программа будет уметь строить индекс для обеспечения высокой скорости поиска. Под Windows есть программа Архивариус 3000 (ниже привожу ее краткое описание). Есть под Linux что-то подобное? В данный момент рассматриваю вариант с запуском Archivarius 3000 под Wine, если не найду альтернативы. Варианты с find и grep пожалуйста не предлагать... :-)
Краткое описание Archivarius 3000.
Archivarius 3000 – это программа для поиска документов и почтовых сообщений в компьютере, локальной сети и съёмных дисках (CD, DVD и др.). Поиск производится по содержимому документов, используя язык запросов, аналогично тому, как это делается в поисковых системах Интернета.
Архивариус 3000 понимает запросы на естественном языке (например на русском, английском). Документы могут быть найдены по ключевым словам или с использованием языка запросов, также как в обычных поисковых системах Интернета. Во время поиска программа автоматически использует все грамматические формы слова и обеспечивает смысловой поиск на 18 языках.
В процессе индексирования документов и почтовых сообщений Архивариус 3000 извлекает и сохраняет полную информацию. Во время поиска, даже если документ физически недоступен, программа найдёт его по содержимому и определит на каком диске находится разыскиваемый файл. Возможность хранения текстов можно отключить.
С помощью программы Архивариус 3000 вы сможете ежедневно индексировать тысячи документов и работать с ними без потери скорости.