Форум русскоязычного сообщества Ubuntu


Считаете, что Ubuntu недостаточно дружелюбна к новичкам?
Помогите создать новое Руководство для новичков!

Автор Тема: Очень ищу программу -- распознавание сканированных анкет  (Прочитано 3246 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн mimitron

  • Автор темы
  • Активист
  • *
  • Сообщений: 253
  • использую xUbuntu 18.04 LTS и доволен
    • Просмотр профиля
Очень ищу программу - парсер pdf. Вкраце - есть анкеты с галочками, надо бы как-то преобразовать это в единички/нули. У ABBYY есть такая программа, Flexi Capture, но она стоит овер 100 k. Подскажите решение пожалуйта, встречал ли кто-то аналоги? Очень, очень нужно!

« Последнее редактирование: 07 Декабря 2018, 17:03:38 от DoctorRover »

Оффлайн SergeyIT

  • Заслуженный пользователь
  • Старожил
  • *
  • Сообщений: 5583
  • Все по палатам!
    • Просмотр профиля
Re: Очень ищу программу
« Ответ #1 : 17 Ноября 2018, 01:19:10 »
Так может самому прогу написать - вроде несложная задача
Извините, я все еще учусь

Оффлайн mimitron

  • Автор темы
  • Активист
  • *
  • Сообщений: 253
  • использую xUbuntu 18.04 LTS и доволен
    • Просмотр профиля
Re: Очень ищу программу
« Ответ #2 : 17 Ноября 2018, 12:21:58 »
Так может самому прогу написать - вроде несложная задача
я не программист (

Оффлайн Peter_I

  • Старожил
  • *
  • Сообщений: 3026
    • Просмотр профиля
Re: Очень ищу программу
« Ответ #3 : 17 Ноября 2018, 12:31:20 »
SergeyIT, м.б. и несложная, если знать устройство pdf, я вот не знаю.
Пётр.

Оффлайн archuser

  • Активист
  • *
  • Сообщений: 695
    • Просмотр профиля
Re: Очень ищу программу
« Ответ #4 : 17 Ноября 2018, 12:38:33 »
mimitron, тогда бы уж потрудились выложить образец обрабатываемого pdf файла. Также непонятен формат результата обработанных данных.

zse

  • Гость
Re: Очень ищу программу
« Ответ #5 : 17 Ноября 2018, 15:23:28 »
     — Тут вопрос в том, что „птичка“ это картинка, а её нужно заменить на текстовой символ „1“ как я понимаю, а пустое место в квадратике на текстовой символ „0“.
     — Да, ABBYY FlexiLayout™ по описанию такое должна делать, за что понятное дело и денег хотят😕.
     — Один документик старой версией наполовину бесплатной  master-pdf-editor конечно сделать можно… Но если документов очень много это нужно просить у начальства денег на покупку FlexiLayout😕 предварительно изучив есть ли возможность вообще решить задачу…
https://www.abbyy.com/en-ca/data-capture-sdk/data-capture-stages/document-analysis/
    — Вот пишут про trial, может как-то попробовать можно…

Оффлайн archuser

  • Активист
  • *
  • Сообщений: 695
    • Просмотр профиля
Re: Очень ищу программу
« Ответ #6 : 17 Ноября 2018, 15:45:24 »
— Тут вопрос в том, что „птичка“ это картинка, а её нужно заменить на текстовой символ „1“ как я понимаю, а пустое место в квадратике на текстовой символ „0“.
Не факт, что „птичка“ представляет собой картинку. Скорее всего - это чекбокс формы и в этом случае решение задачи представляется пустяковым делом. Поэтому я и попросил ТС предоставить шаблон pdf документа, чтобы понять, с чем мы имеем дело - с картинкой или с элементами формы.

Оффлайн mimitron

  • Автор темы
  • Активист
  • *
  • Сообщений: 253
  • использую xUbuntu 18.04 LTS и доволен
    • Просмотр профиля
Re: Очень ищу программу
« Ответ #7 : 19 Ноября 2018, 21:00:39 »
Вот с таким вот приходится работать вручную:

да - это условный 1 0 в экселевской такбличке, нет - это 0 1, а ? - это 0 0


Пользователь добавил сообщение 19 Ноября 2018, 22:19:38:
пока из чего-то более менее реального нашел только эту программу https://www.thregr.org/~wavexx/software/RescueOMR/tutorial.html

только вот как ее адаптировать к тому что нужно мне пока не представляю... :-\
« Последнее редактирование: 19 Ноября 2018, 22:21:52 от mimitron »

Оффлайн SergeyIT

  • Заслуженный пользователь
  • Старожил
  • *
  • Сообщений: 5583
  • Все по палатам!
    • Просмотр профиля
Re: Очень ищу программу
« Ответ #8 : 19 Ноября 2018, 22:48:19 »
archuser, может просьбу выполните, а то и говорить то не о чем
 
mimitron, тогда бы уж потрудились выложить образец обрабатываемого pdf файла.
Извините, я все еще учусь

zse

  • Гость
Re: Очень ищу программу
« Ответ #9 : 19 Ноября 2018, 23:55:59 »
    — Я думаю, что pdf файл будет представлять из себя тоже что и представленное изображение т.е. картинку некого опросного листа с отметками в квадратиках. Отметки рукописные и произвольные фактически. Хотя коллега SergeyIT, безусловно прав в своём предложении предоставить несекретный фрагмент оригинального файла.
    — Программы распознавания субтитров работают используя шаблоны буков…
    — Попробую почитать про возможности FineReader, может как-то можно заставить программу понимать пустой квадратик как положим „0“ а полный как „1“
    — Мне стало интересно, я много занимался оптическим распознаванием на работе RescueOMR буду пробовать это по теме.
    — Коллега, mimitron, ну Вы всё же подкиньте пару-тройку одиозных страничек этих опросов только чтобы мы не догадались кого и о чём спрашивают😇 ! Если это первоначально были файлы сканов .jpg добавьте ещё пару картинок и не нужно загружать .pdf если эти .pdf делались из сканов .jpg. Т.е. лучше иметь первоисточник. 2018 Nov 19; 03:55 PM

Пользователь добавил сообщение 20 Ноября 2018, 05:31:05:
     — У нас на форуму мы за это ещё предметно не брались. Это тема:
Цитировать
What is OMR (Optical Mark Recognition)
     — Иными словами распознавание меток с отсканированных бумажных докуменитов.Вот этих вот самых „птичек😈“ и „крестиков😈“ в „квадратиках😈“ после всяких там выборов или опросов.
     — Очень много публикаций на французском, английском, но вот здесь „всё украдено до вас😇“ на русском языке https://softwarerecs.stackovernet.com/ru/q/3778
     — Коллеги рекомендуют ознакомиться с ЭТИМ и предлагают ЭТО
     — Надо пробовать , потому что ABBYY FlexiCapture 9.0 Release 4 к примеру это более 3-х гигибайт и явно не очень простая в освоении, не понравилась мне в общем… Ну и вообще у нас же всё же Linux :) … 2018 Nov 19; 09:31 PM
« Последнее редактирование: 20 Ноября 2018, 05:31:05 от zse »

Оффлайн бамбук

  • Активист
  • *
  • Сообщений: 541
  • Kubuntu 20.04 LTS x86_64
    • Просмотр профиля
Re: Очень ищу программу
« Ответ #10 : 20 Ноября 2018, 11:42:42 »
там все очень просто в ручную :
- накладывается сверху картоночка (шаблон) с прорезями и  сразу видим результат
- выигрыш по времени можно получить только в том случае если за нас эти анкетки кто то оцифровал
в противном случае задолбаешся сканировать
Chuwi LapBook 14.1   ревизия ноутбука-3.0

Оффлайн archuser

  • Активист
  • *
  • Сообщений: 695
    • Просмотр профиля
Re: Очень ищу программу
« Ответ #11 : 20 Ноября 2018, 12:49:52 »
— Коллеги рекомендуют ознакомиться с ЭТИМ и предлагают ЭТО
Даже добавить нечего. Хорошую работу проделали. Плюсик Вам в карму.

Оффлайн mimitron

  • Автор темы
  • Активист
  • *
  • Сообщений: 253
  • использую xUbuntu 18.04 LTS и доволен
    • Просмотр профиля
Re: Очень ищу программу
« Ответ #12 : 21 Ноября 2018, 22:34:27 »
mimitron, тогда бы уж потрудились выложить образец обрабатываемого pdf файла.
Действительно, название сформулировал не совсем корректно. Pdf тут не причем, суть - в распознавании cканированных анкет (они могут быть как в pdf, так и jpg).
Образцы прилагаю: http://rgho.st/8lkGYWLl5
Они обезличены, в верней части - фамилии оцениваемых людей, которые меняются (их может быть как две, так и 12).
В итоге, как я уже писал, каждому ответу присваивается определенное значение: для да - 1 0, нет - 0 1, а ? - 0 0 (оценка по анкете идет вертикально, сверху вниз, а запись - горизонтально, получается, что одна строка - один лист. Пример итоговой таблицы в xls - http://rgho.st/6f4smq6Vm)


     — Коллеги рекомендуют ознакомиться с ЭТИМ и предлагают ЭТО …
Действительно, очень интересные ссылки! Но честно скажу, sdaps не осилил - у меня он просто не завелся.   

Оффлайн SergeyIT

  • Заслуженный пользователь
  • Старожил
  • *
  • Сообщений: 5583
  • Все по палатам!
    • Просмотр профиля
Re: Очень ищу программу
« Ответ #13 : 21 Ноября 2018, 23:39:12 »
у меня он просто не завелся
Это вам лучше нанять кого-то для выполнения данной работы... если сами не справляетесь.
Там сканированные записи слегка неровные по строке и столбцу - это учитывать надо...
Извините, я все еще учусь

zse

  • Гость
Re: Очень ищу программу
« Ответ #14 : 22 Ноября 2018, 04:46:23 »
Это вам лучше нанять кого-то для выполнения данной работы... если сами не справляетесь.
     — А ещё, mimitron, можно поискать другую работу с большим заработком, меньшим рабочим днём и где не возникают такие каверзные задачи :)!
     — Блестящий совет, SergeyIT, я переписал и положил под стекло, я теперь если что только так и буду делать 😇😈 !
(Нажмите, чтобы показать/скрыть)
     — Так что коллега mimitron даже на начальную команду не реагирует? Там так просто он не „заведётся“, нужно читать и шаг за шагом двигаться по предложенной инструкции, на русском не нашёл ничего 😞… Но там английский „человеческий“ без выкрутасов… Я до конца попробую, потом попытаюсь Вам шпаргалку примитивную написать.2018 Nov 21; 08:46 PM

 

Страница сгенерирована за 0.066 секунд. Запросов: 24.