Форум русскоязычного сообщества Ubuntu


Автор Тема: Решение для распознавания текста  (Прочитано 1656 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн lb_b

  • Автор темы
  • Новичок
  • *
  • Сообщений: 44
    • Просмотр профиля
Форумчане! Встал вопрос распознавания печатного текста. Язык английский. Интересуюсь, как разумнее все поставить на поток?

1. Искать опенсорс-решения
2. Использовать Finereader для LInux в триал-версии
3. Поставить Finereader под Wine

Буду признателен вам за советы. Спасибо!

Оффлайн MA3X

  • Активист
  • *
  • Сообщений: 649
    • Просмотр профиля
Re: Решение для распознавания текста
« Ответ #1 : 11 Май 2008, 12:20:23 »
На диске от какого-нить сканера найти файнридер-спринт (бесплатный) - и воткнуть его под wine

Microsoft isn't the answer.
Microsoft is the question, and the answer is NO.

Оффлайн lb_b

  • Автор темы
  • Новичок
  • *
  • Сообщений: 44
    • Просмотр профиля
Re: Решение для распознавания текста
« Ответ #2 : 11 Май 2008, 15:44:31 »
а скачать его нельзя что ли? просто странно... и есть ли под него скрипт для POL?

Оффлайн Yuri77

  • Активист
  • *
  • Сообщений: 271
    • Просмотр профиля
Re: Решение для распознавания текста
« Ответ #3 : 11 Май 2008, 15:46:26 »
Пробовал консольный tesseract - работает.

Оффлайн lb_b

  • Автор темы
  • Новичок
  • *
  • Сообщений: 44
    • Просмотр профиля
Re: Решение для распознавания текста
« Ответ #4 : 11 Май 2008, 15:56:25 »
что-то в репозиториях нету tesseract (подключены все)...

Оффлайн Yuri77

  • Активист
  • *
  • Сообщений: 271
    • Просмотр профиля
Re: Решение для распознавания текста
« Ответ #5 : 11 Май 2008, 16:31:10 »
Должен быть, пакет называется tesseract-ocr (universe).
Вот: http://packages.ubuntu.com/hardy/tesseract-ocr
На всякий случай - сайт проекта:
http://sourceforge.net/projects/tesseract-ocr

Оффлайн chain

  • Старожил
  • *
  • Сообщений: 1263
    • Просмотр профиля
Re: Решение для распознавания текста
« Ответ #6 : 11 Май 2008, 17:13:01 »
есть еще cuneiform нормально работает с кучей языков, пока только под wine
в PlayOnLinux есть готовый скрипт для установки
да, исходники там открытые
« Последнее редактирование: 11 Май 2008, 18:25:10 от chain »
-вечный чайник-

Оффлайн Yuri77

  • Активист
  • *
  • Сообщений: 271
    • Просмотр профиля
Re: Решение для распознавания текста
« Ответ #7 : 11 Май 2008, 17:29:13 »
Вот ещё инструкция по работе с tesseract:
http://howtoforge.com/ocr_with_tesseract_on_ubuntu704

Оффлайн lb_b

  • Автор темы
  • Новичок
  • *
  • Сообщений: 44
    • Просмотр профиля
Re: Решение для распознавания текста
« Ответ #8 : 12 Май 2008, 07:51:35 »
блин, сделал по хауту, генерит 3 файла, но все пустые и подозрительно быстро :(, ошибок не выдает

tesseract out.tiff out
Tesseract Open Source OCR Engine

Оффлайн Yuri77

  • Активист
  • *
  • Сообщений: 271
    • Просмотр профиля
Re: Решение для распознавания текста
« Ответ #9 : 12 Май 2008, 11:09:39 »
У меня так было, когда сканировал с недостаточной резолюцией. В howto рекомендуют минимум 200 dpi.

 

Страница сгенерирована за 0.07 секунд. Запросов: 22.