Форум русскоязычного сообщества Ubuntu


Увидели сообщение с непонятной ссылкой, спам, непристойность или оскорбление?
Воспользуйтесь ссылкой «Сообщить модератору» рядом с сообщением!

Автор Тема: Распознавание в linux (gImageReader)  (Прочитано 11595 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн omni64

  • Автор темы
  • Активист
  • *
  • Сообщений: 695
    • Просмотр профиля
Распознавание в linux (gImageReader)
« : 29 Мая 2014, 17:49:07 »
Поделюсь своим опытом распознавания текста в Linux
Всем известны YAGF и CuneiForm, но я с ними не очень подружился  :)
И после поисков выбрал для себя программу gImageReader (доступная версия 2.9.3) + Tesseract

Вот тут вы можете выбрать ppa для своей версии Ubuntu (12.04, 13.10, 14.04) (готовых deb пакетов нет)
https://launchpad.net/~sandromani/+archive/gimagereader

Устанавливаем gImageReader
sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt-get update
sudo apt-get install gImageReader

Устанавливаем Tesseract
sudo apt-get install tesseract-ocr
sudo apt-get install tesseract-ocr-rus (для установки русского языка)
sudo apt-get install tesseract-ocr-ukr (для установки украинского языка).

Программа gImageReader увы имеет только английский интерфейс, но зато распознавание гораздо лучше чем в YAGF + CuneiForm (это мое субъективное мнение)

Может есть другие программы?

alang

  • Гость
Re: Распознавание в linux (gImageReader)
« Ответ #1 : 29 Мая 2014, 17:55:39 »
YAGF с Тессерактом тоже работает. И - да, по моему субъективному мнению у Тессеракта распознавание лучше.

Оффлайн omni64

  • Автор темы
  • Активист
  • *
  • Сообщений: 695
    • Просмотр профиля
Re: Распознавание в linux (gImageReader)
« Ответ #2 : 11 Декабря 2014, 12:35:24 »
Обнаружил на github инструкцию от автора gImageReader по переводу интерфейса программы:
https://github.com/manisandro/gImageReader
Translations:
 - To update the existing translations, just run updateTranslations.sh
 - To create translations, follow the following steps:
   1. Run updateTranslations.sh
   2. Rename the generated po/gimagereader.pot file to po/<language>.po (i.e. po/de.po)
   3. Add the language to po/LINGUAS
   4. Translate the strings in po/<language>.po

но при запуске updateTranslations.sh получаю ошибку
Syntax error: newline unexpected

Как перевести выполнить скрип и перевести программу на русский язык?

Оффлайн saint-denis

  • Активист
  • *
  • Сообщений: 305
    • Просмотр профиля
Re: Распознавание в linux (gImageReader)
« Ответ #3 : 13 Декабря 2014, 16:49:59 »
Поделюсь своим опытом распознавания текста в Linux
Всем известны YAGF и CuneiForm, но я с ними не очень подружился  :)
И после поисков выбрал для себя программу gImageReader (доступная версия 2.9.3) + Tesseract

Вот тут вы можете выбрать ppa для своей версии Ubuntu (12.04, 13.10, 14.04) (готовых deb пакетов нет)
https://launchpad.net/~sandromani/+archive/gimagereader

Устанавливаем gImageReader
sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt-get update
sudo apt-get install gImageReader

Устанавливаем Tesseract
sudo apt-get install tesseract-ocr
sudo apt-get install tesseract-ocr-rus (для установки русского языка)
sudo apt-get install tesseract-ocr-ukr (для установки украинского языка).

Программа gImageReader увы имеет только английский интерфейс, но зато распознавание гораздо лучше чем в YAGF + CuneiForm (это мое субъективное мнение)

Может есть другие программы?

http://habrahabr.ru/post/153617/

Оффлайн omni64

  • Автор темы
  • Активист
  • *
  • Сообщений: 695
    • Просмотр профиля
Re: Распознавание в linux (gImageReader)
« Ответ #4 : 15 Декабря 2014, 09:05:59 »
gImageReader обновился до версии 3.0 и теперь все на русском языке.

 

Страница сгенерирована за 0.059 секунд. Запросов: 25.