Форум русскоязычного сообщества Ubuntu


Автор Тема: Возможна ли полнофункциональная замена ABBYY Screenshot Reader?  (Прочитано 6609 раз)

0 Пользователей и 1 Гость просматривают эту тему.

adawdp

  • Автор темы
  • Гость
— В программе ABBYY FineReader 10  существует такая дополнительная функция как ABBYY Screenshot Reader

т.е имеется возможность быстро распознать текст с картинки, иногда это бывает нужно, вручную переписывать долго…
— Из всех предлагаемых в Ubuntu программ по OCR ни одна по-моему такой функции не имеет  :(. Я вроде смотрел внимательно…
— Если кому-то вдруг приходилось сталкиваться с необходимостью распознавания текста с экрана или картинок или некопируемого текста с сайтов, поделитесь наработками.
— Я вот только через VirtualBox решил проблему, а хотелось бы напрямую…

adawdp

  • Автор темы
  • Гость
— Полагаю раз отсутствует ответ то или нет похожего инструмента для быстрого распознавания текстов на снимках экрана, либо это нужно очень узкому кругу лиц. ;D
— Короче, заинтересованности никто не проявил. :-\
— Будем считать что невозможна в Linux полнофункциональная замена  ABBYY Screenshot Reader!

Оффлайн oermolaev

  • Старожил
  • *
  • Сообщений: 1477
    • Просмотр профиля
Вы про это:

?
т.е.это *.pdf


Нет, я не так понял задачу.
« Последнее редактирование: 05 Июня 2013, 20:51:19 от oermolaev »

adawdp

  • Автор темы
  • Гость
— На всякий случай ещё раз возобновляю тему.
— Есть всё же реальная альтернатива FineREader для Linux и Ubuntu в частности?
— И не только по узкой проблеме распознавания текста с экранных изображений.
— Например всё что я пробовал не выше уровнем чем OCRFeeder…
— Вот сейчас читаю про Tesseract OCR, кто пробовал это рабочая штука или очередной конструктор для взрослых?

Оффлайн oermolaev

  • Старожил
  • *
  • Сообщений: 1477
    • Просмотр профиля
Сканера нет, попробовал со скриншотом, вот что получается:

Язык распознавания пришлось менять вручную.
PS: Кстати, результаты работы Cuneiform для этого текста оказались такими же  :o
« Последнее редактирование: 10 Июля 2013, 12:04:29 от oermolaev »

adawdp

  • Автор темы
  • Гость
— Да вот ещё родственные темы:
https://forum.ubuntu.ru/index.php?topic=216282.msg1743417#msg1743417
https://forum.ubuntu.ru/index.php?topic=204101.0
Оermolaev, а это Вы какую программу применяли для распознавания Tesseract OCR? Я о том, что изображено на картинке…

Оффлайн oermolaev

  • Старожил
  • *
  • Сообщений: 1477
    • Просмотр профиля
YAGF - Графическая оболочка для программ распознавания текста cuneiform и tesseract
Плюс: tesseract-ocr-rus, cuneiform
Плюс: aspell-ru для проверки орфографии и правки
И cuneiform получается интереснее за счёт возможности смешанного распознавания "русский-английский"
« Последнее редактирование: 10 Июля 2013, 14:12:02 от oermolaev »

adawdp

  • Автор темы
  • Гость
— Что не нашёл как просто поставить YAGF :(
https://forum.ubuntu.ru/index.php?topic=180017.msg1743623#msg1743623
— Не находится пакет… откуда вообще нужно ставить?

Оффлайн Пользователь

  • Модератор форума
  • Старожил
  • *
  • Сообщений: 2701
  • Runtu XFCE 18.04 (64-bit)
    • Просмотр профиля
Попробуй запустить ABBYY FineReader через Wine.

Для сканирования и линуксвые программы подойдут, а вот с вытаскиванием текста из изображений лучше справляется FineReader.

В домашних условиях, если редко нужно распознавать текст, то лучше через FineReader online.

adawdp

  • Автор темы
  • Гость
— Да есть у меня лицензионная FineReader 7 работает через Wine :), есть также лицензионная FR-10 через Wine не поставилась, работает в VirtualBox c XP…
— Нормально работают для небольших задач онлайн вервисы
http://www.newocr.com/
http://finereader.abbyyonline.com/ru/Account/Welcome
— Вопрос принципа, хочу знать в каком состоянии находится  OCR в Linux, а также знать какого уровня задачи можно решать родными средствами Ubuntu в частности…

Оффлайн oermolaev

  • Старожил
  • *
  • Сообщений: 1477
    • Просмотр профиля
— Что не нашёл как просто поставить YAGF :(
я ставил из Центра приложений

adawdp

  • Автор темы
  • Гость
— Не знаю, что-то у себя в Центре я не нашёл YAGF…
— Но установил вот так:
https://forum.ubuntu.ru/index.php?topic=180017.msg1743623#msg1743623
— Запустилась, работает, буду исследовать в динамике :)!

— Да, у Вас я смотрю русская локализация а у меня английская, мне то всё равно, может у Вас не 12,04?
« Последнее редактирование: 10 Июля 2013, 23:14:28 от adawdp »

Оффлайн oermolaev

  • Старожил
  • *
  • Сообщений: 1477
    • Просмотр профиля
ну да, 13.04  :)

Оффлайн coden

  • Участник
  • *
  • Сообщений: 133
  • Ubuntu 13.04 x64
    • Просмотр профиля
нажать Alt+F2, выполнить
gnome-screenshot --area --file=/tmp/image.png

cuneiform 1.1.0
нужна предварительная обработка изображения. без неё cuneiform делает более 15 ошибок
convert /tmp/image.png -resize 200% -filter Point -median 3x3 -threshold 50% /tmp/processed_image.png
cuneiform -l eng -o /tmp/text.txt /tmp/processed_image.png

(Нажмите, чтобы показать/скрыть)

tesseract 3.02.02
нужна опция -psm 6. без неё tesseract делает 4 ошибки.
tesseract /tmp/image.png /tmp/text -l eng -psm 6
(Нажмите, чтобы показать/скрыть)

Free Online OCR
(Нажмите, чтобы показать/скрыть)

выводы
cuneiform - нужна предварительная обработка изображения
tesseract - хорошо настраивается
Free Online OCR - хороший результат, нужен интернет
« Последнее редактирование: 11 Июля 2013, 11:53:06 от coden »

Оффлайн oermolaev

  • Старожил
  • *
  • Сообщений: 1477
    • Просмотр профиля
coden,
не понял что Вы хотели показать спойлерами.
Вот мои тесты:


 

Страница сгенерирована за 0.036 секунд. Запросов: 24.