Автор Тема: Распознавание в linux (gImageReader) (Прочитано 11595 раз)

omni64 · « : 29 Мая 2014, 17:49:07 »

Поделюсь своим опытом распознавания текста в Linux
Всем известны YAGF и CuneiForm, но я с ними не очень подружился

И после поисков выбрал для себя программу gImageReader (доступная версия 2.9.3) + Tesseract

Вот тут вы можете выбрать ppa для своей версии Ubuntu (12.04, 13.10, 14.04) (готовых deb пакетов нет)
https://launchpad.net/~sandromani/+archive/gimagereader

Устанавливаем gImageReader
sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt-get update
sudo apt-get install gImageReader

Устанавливаем Tesseract
sudo apt-get install tesseract-ocr
sudo apt-get install tesseract-ocr-rus (для установки русского языка)
sudo apt-get install tesseract-ocr-ukr (для установки украинского языка).

Программа gImageReader увы имеет только английский интерфейс, но зато распознавание гораздо лучше чем в YAGF + CuneiForm (это мое субъективное мнение)

Может есть другие программы?

alang · « **Ответ #1 :** 29 Мая 2014, 17:55:39 »

YAGF с Тессерактом тоже работает. И - да, по моему субъективному мнению у Тессеракта распознавание лучше.

omni64 · « **Ответ #2 :** 11 Декабря 2014, 12:35:24 »

Обнаружил на github инструкцию от автора gImageReader по переводу интерфейса программы:
https://github.com/manisandro/gImageReader
Translations:
- To update the existing translations, just run updateTranslations.sh
- To create translations, follow the following steps:
1. Run updateTranslations.sh
2. Rename the generated po/gimagereader.pot file to po/<language>.po (i.e. po/de.po)
3. Add the language to po/LINGUAS
4. Translate the strings in po/<language>.po

но при запуске updateTranslations.sh получаю ошибку
Syntax error: newline unexpected

Как перевести выполнить скрип и перевести программу на русский язык?

saint-denis · « **Ответ #3 :** 13 Декабря 2014, 16:49:59 »

Цитата: omni64 от 29 Мая 2014, 17:49:07

Поделюсь своим опытом распознавания текста в Linux
Всем известны YAGF и CuneiForm, но я с ними не очень подружился
И после поисков выбрал для себя программу gImageReader (доступная версия 2.9.3) + Tesseract

Вот тут вы можете выбрать ppa для своей версии Ubuntu (12.04, 13.10, 14.04) (готовых deb пакетов нет)
https://launchpad.net/~sandromani/+archive/gimagereader

Устанавливаем gImageReader
sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt-get update
sudo apt-get install gImageReader

Устанавливаем Tesseract
sudo apt-get install tesseract-ocr
sudo apt-get install tesseract-ocr-rus (для установки русского языка)
sudo apt-get install tesseract-ocr-ukr (для установки украинского языка).

Программа gImageReader увы имеет только английский интерфейс, но зато распознавание гораздо лучше чем в YAGF + CuneiForm (это мое субъективное мнение)

Может есть другие программы?

http://habrahabr.ru/post/153617/

omni64 · « **Ответ #4 :** 15 Декабря 2014, 09:05:59 »

gImageReader обновился до версии 3.0 и теперь все на русском языке.

Форум русскоязычного сообщества Ubuntu

Автор Тема: Распознавание в linux (gImageReader) (Прочитано 11595 раз)

omni64

Распознавание в linux (gImageReader)

alang

Re: Распознавание в linux (gImageReader)

omni64

Re: Распознавание в linux (gImageReader)

saint-denis

Re: Распознавание в linux (gImageReader)

omni64

Re: Распознавание в linux (gImageReader)