С YAGF/Tesseract я тебя сразу разочарую. Я пытался им пользоваться, когда мне это понадобилось. Вообщем текст он распознает, если ничего в процессе не отвалится, но только текст. Плоский текст. Без форматирования. Да и качество распознавания оставляет желать лучшего (может его обучать надо, но я не заморачивался сильно, может для пдф он просто выдернет текст из файла). Результат в любом случае будет не лучше, а скорее даже хуже, чем с тем онлайн конвертером -- тот хотябы немного форматирование сохранил. Хотя мне кажется, что использовать OCR для того, чтобы текст из пдфа достать -- костыльное немного решение. Единственное, что я смогу тебе посоветовать -- посмотри в сторону Scribus, хотя это редактор, в нём наврядли будет возможность сохранить в odt, но в вики пишут, что можно как-то экспортировать в svg, правда пользы с этого для тебя не очень много.