Форум русскоязычного сообщества Ubuntu


Хотите сделать посильный вклад в развитие Ubuntu и русскоязычного сообщества?
Помогите нам с документацией!

Автор Тема: Поиск в русских RTF файлах  (Прочитано 1982 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Mi-RRR

  • Автор темы
  • Новичок
  • *
  • Сообщений: 4
    • Просмотр профиля
Поиск в русских RTF файлах
« : 04 Октября 2010, 14:33:25 »
Бьюсь над этим уже год. Пользую две программы - Docfetcher и Recoll
Разработчик Docfetcher в начале года пообещал подумать над решением этой проблемы и с марта не обновлял дистрибутив.
Разработчик Recoll написал скрипт для unrtf на основе кодировки SHIFT_JIS-2004. Но в моей системе по команде iconv -l эта кодировка отсутствует. Другие кодировки, которые разработчик Recoll предложил подставить в скрипт, не работают.

Так вот вопросы:
Можно ли добавить в ubuntu lucid кодировку SHIFT_JIS-2004?
Может быть кто-нибудь знает другое решение этой проблемы?

Русский RTF прикладываю. Проблема не с одним этим файлом, а с тысячами ему подобных) ) )

Оффлайн alecsartania

  • Старожил
  • *
  • Сообщений: 1565
  • УМка.
    • Просмотр профиля
Re: Поиск в русских RTF файлах
« Ответ #1 : 04 Октября 2010, 15:00:28 »
в Beagle rtf точно упоминается
http://rus-linux.net/lib.php?name=MyLDP/comfort/desktop_search.html
Дома Linux Mint 21.1 / 22.00

Оффлайн Mi-RRR

  • Автор темы
  • Новичок
  • *
  • Сообщений: 4
    • Просмотр профиля
Re: Поиск в русских RTF файлах
« Ответ #2 : 04 Октября 2010, 15:16:07 »
Прежде чем зайти на форум, я опробовал все linux поисковики. И Beagle и Tracker и Strigi. В них во всех упоминается. И с английскими RTF файлами они работают. Но с русскими у всех у них большая проблема.

Оффлайн dimas000

  • Старожил
  • *
  • Сообщений: 1437
  • Ubuntu 9.10 @ 2.6.34
    • Просмотр профиля
Re: Поиск в русских RTF файлах
« Ответ #3 : 04 Октября 2010, 18:36:25 »
навскидку с помощью аптитуды нашел unrtf, можно еще чего поискать. суть в том, чтобы сваять простенький скрипт, который будет всякую rtf-ку конвертить в читаемый формат, а потом уже grep'ом или чем еще искать.
лучше на "ты"

Оффлайн Mi-RRR

  • Автор темы
  • Новичок
  • *
  • Сообщений: 4
    • Просмотр профиля
Re: Поиск в русских RTF файлах
« Ответ #4 : 04 Октября 2010, 19:02:15 »
Господа, пожалуйста, прежде чем отвечать, изучите тему. Не надо навскидку набирать запос в яндексе или искать пакеты, в названии или описании которых есть rtf, в репозитории. Все запросы уже давным давно набраны и ответы изучены. А также были перетряхнуты как родные так и сторонние репозитории.
Программа Recoll использует unrtf. По моей просьбе разработчик даже поправил поисковый скрипт. Но не помогло. Сейчас он общается на эту тему с разработчиками unrtf. Я, кажется, задавал два конкретных вопроса. Давайте искать ответы на них.

По Docfetcher тоже предупреждаю ответы. Если взять варианты сохранений файлов в Abiword, он предлагает два формата RTF - старый и новый. Новый программой Docfetcher читается. А старый, который до сих пор используют большинство текстовых процессоров, не читается. Разработчик Docfetcher обещал изучить эту проблему, но как я уже сказал выше, с марта не обновляет дистрибутив.
« Последнее редактирование: 04 Октября 2010, 19:07:39 от Mi-RRR »

Оффлайн dimas000

  • Старожил
  • *
  • Сообщений: 1437
  • Ubuntu 9.10 @ 2.6.34
    • Просмотр профиля
Re: Поиск в русских RTF файлах
« Ответ #5 : 04 Октября 2010, 20:33:55 »
вуаля, у меня получилось! как со сделанной кем-то в винде rtf-кой, так и с файлом из первого поста.
unrtf действительно выдает вопросики. зато проканало
abiword --to=txt path/filename.rtfна предмет полного соответствия не сверял специально, а так вроде все нормально. возмонжо, у опеноффиса тоже есть что-нибудь такое (во всяком случае, какие-то вещи он умеет делать в безголовом режиме) - за неименеием сабжа сказать не могу
лучше на "ты"

Оффлайн Mi-RRR

  • Автор темы
  • Новичок
  • *
  • Сообщений: 4
    • Просмотр профиля
Re: Поиск в русских RTF файлах
« Ответ #6 : 05 Октября 2010, 01:13:32 »
Извини, друг, мне все лучше объяснять на пальцах. Не мог бы ты пояснить, что именно у тебя получилось? Что значит эта команда и как это поможет настроить поиск по русским rtf?

Пользователь решил продолжить мысль 06 Октября 2010, 17:16:12:
Сам спросил, сам отвечаю. В общем, проблема решилась. Разработчик Recoll связался с разработчиками Unrtf, скинул мне последнюю beta версию Unrtf, я ее скомпилировал, установил, прописал в настройках Recoll, чтобы индексировалось с помощью этой версии, и все заработало. Программа читает и ищет в русских RTF, как старого типа, так и нового!!! Если есть вопросы, обращайтесь.
« Последнее редактирование: 06 Октября 2010, 17:16:12 от Mi-RRR »

 

Страница сгенерирована за 0.016 секунд. Запросов: 20.