Форум русскоязычного сообщества Ubuntu


Автор Тема: Поиск текста внутри doc, rtf, html, pdf и т.п.  (Прочитано 4318 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Виктор Дубосарский

  • Автор темы
  • Новичок
  • *
  • Сообщений: 22
    • Просмотр профиля
Подскажите есть ли программы, которые позволяют выполнять рекурсивный поиск текста внутри doc, rtf, html, pdf-документов. Совсем хорошо, если такая программа будет уметь строить индекс для обеспечения высокой скорости поиска. Под Windows есть программа Архивариус 3000 (ниже привожу ее краткое описание). Есть под Linux что-то подобное? В данный момент рассматриваю вариант с запуском Archivarius 3000 под Wine, если не найду альтернативы. Варианты с find и grep пожалуйста не предлагать... :-)

Краткое описание Archivarius 3000.
Archivarius 3000 – это программа для поиска документов и почтовых сообщений в компьютере, локальной сети и съёмных дисках (CD, DVD и др.). Поиск производится по содержимому документов, используя язык запросов, аналогично тому, как это делается в поисковых системах Интернета.
Архивариус 3000 понимает запросы на естественном языке (например на русском, английском). Документы могут быть найдены по ключевым словам или с использованием языка запросов, также как в обычных поисковых системах Интернета. Во время поиска программа автоматически использует все грамматические формы слова и обеспечивает смысловой поиск на 18 языках.
В процессе индексирования документов и почтовых сообщений Архивариус 3000 извлекает и сохраняет полную информацию. Во время поиска, даже если документ физически недоступен, программа найдёт его по содержимому и определит на каком диске находится разыскиваемый файл. Возможность хранения текстов можно отключить.
С помощью программы Архивариус 3000 вы сможете ежедневно индексировать тысячи документов и работать с ними без потери скорости.

adawdp

  • Гость
Re: Поиск текста внутри doc, rtf, html, pdf и т.п.
« Ответ #1 : 28 Октября 2015, 18:35:09 »
2015 Oct 28; 11:35 AM; Oakville, ON, Canada.

— Все начинают пробовать с этой программы… Вот статья на русском языке…

http://www.kv.by/content/320192-indeksatsiya-i-poisk-v-ubuntu-posredstvom-recoll

— Пробуйте, если не понравится ищите ещё, по-моему имеются и другие программы подобного назначения…

Оффлайн Виктор Дубосарский

  • Автор темы
  • Новичок
  • *
  • Сообщений: 22
    • Просмотр профиля
Re: Поиск текста внутри doc, rtf, html, pdf и т.п.
« Ответ #2 : 29 Октября 2015, 14:53:44 »
2015 Oct 28; 11:35 AM; Oakville, ON, Canada.

— Все начинают пробовать с этой программы… Вот статья на русском языке…

http://www.kv.by/content/320192-indeksatsiya-i-poisk-v-ubuntu-posredstvom-recoll

— Пробуйте, если не понравится ищите ещё, по-моему имеются и другие программы подобного назначения…

Спасибо, Recoll отличная программа! Проиндексировал диск с документами в 2ТБ за пару часов. Поиск выполняется практически мгновенно.

Punko

  • Гость
Re: Поиск текста внутри doc, rtf, html, pdf и т.п.
« Ответ #3 : 15 Марта 2016, 00:48:14 »
Закрыто с меткой "Решено".

 

Страница сгенерирована за 0.047 секунд. Запросов: 25.