Форум русскоязычного сообщества Ubuntu


Увидели сообщение с непонятной ссылкой, спам, непристойность или оскорбление?
Воспользуйтесь ссылкой «Сообщить модератору» рядом с сообщением!

Автор Тема: Что сегодня лучше использовать в качестве OCR и читалок ?  (Прочитано 984 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн AlekseyUbuntu

  • Автор темы
  • Активист
  • *
  • Сообщений: 407
    • Просмотр профиля
Kubuntu 18.04

В инете (и на нашем форуме) только инфа от 2014 года. Думаю за это время многое поменялось. Может кто- то  поделиться текущим состоянием дел в области OCR, чтобы не перелопачивать:
1) движки, занимаясь сравнением качества распознования
2) GUI- обертки, чтобы понять кто сделал удобнее

Сейчас мне надо распознавать только английский, но информация по русскому тоже интереса.

Я OCR использую в связке с автоматическими читалками (чтобы глазки не уставали), поэтому также интересно что сегодня по- православному использовать в этом направлении.

Заранее спасибо, за подсказки!

Оффлайн Sirrke

  • Участник
  • *
  • Сообщений: 111
  • Arch Linux
    • Просмотр профиля
Да все, в общем-то, тоже самое... GImageReader + Tesseract. Работает нормально.

Оффлайн AlekseyUbuntu

  • Автор темы
  • Активист
  • *
  • Сообщений: 407
    • Просмотр профиля
Да все, в общем-то, тоже самое... GImageReader + Tesseract. Работает нормально.

Спасибо за направление!

А для "text to speech" что сегодня актуально?

Оффлайн andytux

  • Заслуженный пользователь
  • Старожил
  • *
  • Сообщений: 7973
    • Просмотр профиля
Цитировать
автоматическими читалками (чтобы глазки не уставали)...
Самописная "бубнилка". Голосовой движок - RHVoice.

Оффлайн AlekseyUbuntu

  • Автор темы
  • Активист
  • *
  • Сообщений: 407
    • Просмотр профиля
Да все, в общем-то, тоже самое... GImageReader + Tesseract. Работает нормально.

Не понял как пользоваться GImageReader:
1. Распознал как Plain Text- получил неотформатированную кашу без картинок.
2. Распознал hOCR, pdf- получил иерархию областей, со своими параметрами. Цельные страницы я не вижу.

Попробовал сохранить в текстовый формат (чтобы потом читать распознанный документ с помощью LibreOffice Writer) - нет такой функции. Если я должен copy- paste использовать для создания odt- документа, то во втором случае цельного документа просто нет.

Ничего не понял.

Пользователь добавил сообщение 31 Июля 2018, 11:41:47:
Заметил, что Okular предлагает экспорт в текст и для моего документа делает его мгновенно. Значит у моего документа есть слой распознанного текста. Но блин, он экспортирует как текст, а хочется создать нормальный odt- документ для просмотра с помощью LibreOffice Writer (аналог Word), чтобы было удобно читать.

Какой инструмент мне поможет сделать удобную для чтения книжку?
« Последнее редактирование: 31 Июля 2018, 11:41:47 от AlekseyUbuntu »

Оффлайн Sirrke

  • Участник
  • *
  • Сообщений: 111
  • Arch Linux
    • Просмотр профиля
Ноут с линуксом сейчас в ремонте, а так, на память объяснить, как там все работает сложно:) Уж извините. Я обычно выделяю область, которую надо распознать, потом обрабатываю распознанное во встроенном редакторе и копипастом отправляю в блог. Было дело, обрабатывал и большие файлы, но за давностью лет не помню, как делал. Так же вы можете обработать готовый текст в либре офисе, райтер способен читать текстовые файлы, потом можно сохранить файл в одт.

Оффлайн AlekseyUbuntu

  • Автор темы
  • Активист
  • *
  • Сообщений: 407
    • Просмотр профиля
Так же вы можете обработать готовый текст в либре офисе, райтер способен читать текстовые файлы, потом можно сохранить файл в одт.

В текстовом файле уже нет картинок + отсутствует структура файла,  поэтому если его "засосать" в офисный документ, то качество полученного документа будет ужасным.

ТС, как видно по состоянию на 12/02/2020 потерял интерес к созданной им теме (пометка Решено в теме отсутствует, тема оставлена не закрытой, сообщений в теме давно не было). Тема стародавняя (последнее сообщение в топике: 01/08/2018; последнее сообщение от ТС в топике: 01/08/2018). Модератором раздела принято решение закрыть тему.
--zg_nico
« Последнее редактирование: 12 Февраля 2020, 23:07:27 от zg_nico »

Оффлайн jurganov

  • Старожил
  • *
  • Сообщений: 1916
    • Просмотр профиля
расстрою...
Все эти тессеракты и прочие распозновалки - чушь собачья.
Да и на винде только одна нормальная программа. FineReader
которая распознает с разных языков, не блоками по 5 слов, а большими книгами, с сохранением форматирования.
увы, она и сохраняет в ворд...

поставить это чудо техники на линуксе можно через вайн. старые убогие версии. Но и они распознают В РАЗЫ лучше чем тессеракты

Axa-Ru

  • Гость
увы, она и сохраняет в ворд...
Нет. Последняя версия умеет во все.  ;D ;D

В свое время тоже искал открытую, но нет. Купил FR stadard.
« Последнее редактирование: 01 Августа 2018, 22:07:20 от Axa-Ru »

Оффлайн jurganov

  • Старожил
  • *
  • Сообщений: 1916
    • Просмотр профиля
Нет. Последняя версия умеет во все.  ;D ;D
В свое время тоже искал открытую, но нет. [/url].
7 косарей для себя - дорого!!
На работе имеется в редакции, туда хожу. Но там только ворд, видать староватая версия уже
А становтится через вайн?
« Последнее редактирование: 02 Августа 2018, 09:16:02 от jurganov »

 

Страница сгенерирована за 0.029 секунд. Запросов: 24.