— Я думаю, что pdf файл будет представлять из себя тоже что и представленное изображение т.е. картинку некого опросного листа с отметками в квадратиках. Отметки рукописные и произвольные фактически. Хотя коллега
SergeyIT, безусловно прав в своём предложении предоставить несекретный фрагмент оригинального файла.
— Программы распознавания субтитров работают используя шаблоны буков…
— Попробую почитать про возможности FineReader, может как-то можно заставить программу понимать пустой квадратик как положим „0“ а полный как „1“
— Мне стало интересно, я много занимался оптическим распознаванием на работе
RescueOMR буду пробовать это по теме. — Коллега,
mimitron, ну Вы всё же подкиньте пару-тройку одиозных страничек этих опросов только чтобы мы не догадались кого и о чём спрашивают😇 ! Если это первоначально были файлы сканов .jpg добавьте ещё пару картинок и не нужно загружать .pdf если эти .pdf делались из сканов .jpg. Т.е. лучше иметь первоисточник. 2018 Nov 19; 03:55 PM
Пользователь добавил сообщение 20 Ноября 2018, 05:31:05:
— У нас на форуму мы за это ещё предметно не брались. Это тема:
What is OMR (Optical Mark Recognition)
— Иными словами распознавание меток с отсканированных бумажных докуменитов.Вот этих вот самых „птичек😈“ и „крестиков😈“ в „квадратиках😈“ после всяких там выборов или опросов.
— Очень много публикаций на французском, английском, но вот здесь „
всё украдено до вас😇“ на русском языке
https://softwarerecs.stackovernet.com/ru/q/3778 …
— Коллеги рекомендуют ознакомиться с
ЭТИМ и предлагают
ЭТО …
— Надо пробовать , потому что
ABBYY FlexiCapture 9.0 Release 4 к примеру это более 3-х гигибайт и явно не очень простая в освоении, не понравилась мне в общем… Ну и вообще у нас же всё же Linux
… 2018 Nov 19; 09:31 PM