Форум русскоязычного сообщества Ubuntu


Считаете, что Ubuntu недостаточно дружелюбна к новичкам?
Помогите создать новое Руководство для новичков!

Автор Тема: Возможна ли полнофункциональная замена ABBYY Screenshot Reader?  (Прочитано 7857 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн coden

  • Участник
  • *
  • Сообщений: 133
  • Ubuntu 13.04 x64
    • Просмотр профиля
coden,
не понял что Вы хотели показать спойлерами.
Вот мои тесты:


какую графическую оболочку для CuneiForm и Tesseract использовал?
как обрабатывал изображение перед распознованием?
« Последнее редактирование: 11 Июля 2013, 13:33:36 от coden »

Оффлайн oermolaev

  • Старожил
  • *
  • Сообщений: 1479
    • Просмотр профиля
coden,
специально не стал никак обрабатывать, программа всё та же YAGF, в ней и выбирал способ распознавания

Оффлайн coden

  • Участник
  • *
  • Сообщений: 133
  • Ubuntu 13.04 x64
    • Просмотр профиля
coden,
специально не стал никак обрабатывать, программа всё та же YAGF, в ней и выбирал способ распознавания
Попробовал у себя на твоем образце, результаты другие.
В дополнительных настройках YAGF 0.9.2 снял галочку обрезать изображение при загрузке.

через YAGF 0.9.2, cuneiform 1.1.0 - 3 ошибки
с кандально
смогутпоймать
Ио
(Нажмите, чтобы показать/скрыть)

через YAGF 0.9.2, tesseract 3.02.02 - 7 ошибок
кандально
деясурили
Шереметъево
ЭКСТРЗДИРОБЗТЬ На
ОСТЗТЬСЯ НСИЗВЕСТНЫМ
российсъсих
орга- нон
(Нажмите, чтобы показать/скрыть)

через OCRFeeder 0.7.11, cuneiform 1.1.0 - 6 ошибок
с кандально
Эдварл
аэроцорту
экстрадировать
радину
бьио
(Нажмите, чтобы показать/скрыть)

через OCRFeeder 0.7.11, tesseract 3.02.02 - 6 ошибок
кандально
деясурили н
Шереметъево
И ЭКСТРЗДИРОВВТЬ
ОСТЗТЬСЯ НСИЗВ ЕСТНЫМ
бьшо
(Нажмите, чтобы показать/скрыть)

Free Online OCR
ошибок нет!
(Нажмите, чтобы показать/скрыть)

ABBY FineReader Online
ошибок нет!
(Нажмите, чтобы показать/скрыть)

Google Docs - 1 ошибка
кандально
(Нажмите, чтобы показать/скрыть)

вывод
чтобы получить минимум ошибок у cuneiform и tesseract, изображение нужно предварительно подготовить.
« Последнее редактирование: 11 Июля 2013, 15:18:36 от coden »

Оффлайн oermolaev

  • Старожил
  • *
  • Сообщений: 1479
    • Просмотр профиля
Мои условия:
Xubuntu 13.04 и
YAGF - Графическая оболочка для программ распознавания текста cuneiform и tesseract
Плюс: tesseract-ocr-rus, cuneiform
Плюс: aspell-ru для проверки орфографии и правки
что имеется ввиду под "подготовить"?

Оффлайн coden

  • Участник
  • *
  • Сообщений: 133
  • Ubuntu 13.04 x64
    • Просмотр профиля
что имеется ввиду под "подготовить"?
убрать фон и выделить буквы как можно четче

adawdp

  • Автор темы
  • Гость
— FineREader-10…
(Нажмите, чтобы показать/скрыть)
— При этом я распознавал не картинку, а её изображение на экране. Я вообще ставил вопрос уже, Screenshot Reader в FR-10 работает так: выделяешь любую область экрана и распознаёшь то что попало в выделение, вот в чём удобство.
— Естественно есть и классическое распознавание после сканирования или добавления изображений. Я же здесь акцентировал внимание именно на быстрое распознавание текста с экрана путём выделения соответствующей области.
— Происходят следующие действия. Запуск Screenshot Reader FR-10, быстрая настройка, язык распознавание и способ сохранения; далее выделение области экрана, нажатие соответствующей кнопки в окне Screenshot Reader после получение результата или буфер или файл.
http://www.youtube.com/watch?v=E6WSDq_p53Y
— Я так понимаю, что ничего подобного в Linux нет, а то , что распознавание программой FineReader проще и надёжней, пока :), ну так это уже многократно говорилось…
Сoden, спасибо за конссольные команды!

Оффлайн saint-denis

  • Активист
  • *
  • Сообщений: 305
    • Просмотр профиля
Какие-то дураки в интернетах обзоры пишут, сравнивают что-то. Дураки, точно! Нечем заняться им.
http://habrahabr.ru/post/153617/

 

Страница сгенерирована за 0.284 секунд. Запросов: 26.