Поделюсь своим опытом распознавания текста в Linux
Всем известны YAGF и CuneiForm, но я с ними не очень подружился
И после поисков выбрал для себя программу gImageReader (доступная версия 2.9.3) + Tesseract
Вот тут вы можете выбрать ppa для своей версии Ubuntu (12.04, 13.10, 14.04) (готовых deb пакетов нет)
https://launchpad.net/~sandromani/+archive/gimagereader Устанавливаем gImageReader
sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt-get update
sudo apt-get install gImageReader
Устанавливаем Tesseract
sudo apt-get install tesseract-ocr
sudo apt-get install tesseract-ocr-rus (для установки русского языка)
sudo apt-get install tesseract-ocr-ukr (для установки украинского языка).
Программа gImageReader увы имеет только английский интерфейс, но зато распознавание гораздо лучше чем в YAGF + CuneiForm (это мое субъективное мнение)
Может есть другие программы?