Форум русскоязычного сообщества Ubuntu


Автор Тема: Сжать PDF как шакала !  (Прочитано 3032 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн !!!!!!!!!!!!kg-600

  • Автор темы
  • Новичок
  • *
  • Сообщений: 25
  • не трать время на доказательства того что я глупый
    • Просмотр профиля
Сжать PDF как шакала !
« : 14 Октября 2015, 01:53:07 »
Привет всем! Задача пред моими очами такая: есть флешка на которой 348979837498573498753894 фоток со страницами книги. Впрос как сделать из них сделать PDF/DJVU-книгу, при этом обрезав с каждой страницы столы, руки, ноги и прочую ерунду попавшую в кадр, перевернуть и поправить страницы... и желательно как можно быстрее, ибо объёмы немалые ?
« Последнее редактирование: 14 Октября 2015, 01:57:34 от !!!!!!!!!!!!kg-600 »

adawdp

  • Гость
Re: Сжать PDF как шакала !
« Ответ #1 : 14 Октября 2015, 03:44:01 »
2015 Oct 13; 08:43 PM; Oakville, ON, Canada.

— Ваша задача состоит из нескольких и не на все пункты вашей задачи есть готовые рецепты в Linux…

— Если речь идёт также о том, что необходим текстовой слой, то не обойтись без OCR (Optical Character Recognition), а делает всё что Вам необходимо в комплексе к сожалению только программа под Windows FineReader  :(

— Покупайте, ставьте в виртуальную машину и делайте книгу… Это самый простой вариант, я это делаю еженедельно…

— Конечно я использую и средства Linux различные консольные программы для работы с изображениями и PDF файлами, не буду перечислять, на форуме масса тем, как обрезать, как конвертировать массу картинок в PDF файл, и так далее.

— Иными словами задача классическая, начинайте, а когда не будет получаться пишите что именно не получается, а так подсказать Вам довольно сложно.

Оффлайн alsoijw

  • Старожил
  • *
  • Сообщений: 4062
  • Fedora 25 GNOME 3 amd64
    • Просмотр профиля
Re: Сжать PDF как шакала !
« Ответ #2 : 14 Октября 2015, 11:00:31 »
!!!!!!!!!!!!kg-600, количество фоторафий подозрительно велико. Что значит
обрезав с каждой страницы столы, руки, ноги и прочую ерунду попавшую в кадр, перевернуть и поправить страницы...
Это получается что снимки сделаны по разному? Только вручную.
Мало видеть нам начало - надо видеть и конец. Если видишь ты создание - значит где-то есть ТВОРЕЦ
Многие жалуются: геометрия в жизни не пригодилась. Ямб от хорея им приходится отличать ежедневно?

Оффлайн peregrine

  • FSM
  • СуперМодератор
  • Старожил
  • *
  • Сообщений: 7203
  • Gentoo x64 Ubuntu 16.04.1 x64
    • Просмотр профиля
Re: Сжать PDF как шакала !
« Ответ #3 : 14 Октября 2015, 12:27:31 »
!!!!!!!!!!!!kg-600, imagemagick-ом сначала подготовить страницы (в теории можно и автообрезку сделать, хотя сложновато, особенно для новичка, и готового я не встречал). А вообще после того, как файлы обработаны (обрезаны, повёрнуты и одного размера) что-то типа такого:
#!/bin/sh
for i in *.jpg; do convert $i ${i%jpg}pnm; done
for i in *.pnm; do convert -contrast -gamma 1.9 -normalize $i ${i%.pnm}_.pnm; done
for i in *_.pnm; do convert $i ${i%_.pnm}.pbm; done
for i in *.pbm; do cjb2 -dpi 300 -clean $i ${i%pbm}djvu; done
djvm -c book.djvu *.djvu
Затем, при желании через распознавалку пропустить. Если качество хорошее и текст без таблиц, формул и прочего, то и YAGF может хватить. Иначе только с FineReader-ом в винде. Опции -contrast -gamma 1.9 -normalize можно подкрутить по ситуации, иногда надо что-то ещё на этом этапе поправить.

Оффлайн gamayun

  • Активист
  • *
  • Сообщений: 823
  • Кто ищет, тот найдёт, может быть...
    • Просмотр профиля
Re: Сжать PDF как шакала !
« Ответ #4 : 14 Октября 2015, 13:29:28 »
Создать то pdf из картинок просто convert *.jpg out.pdf
А вот готовить их лучше вручную.Вы бы доверили роботу себя оперировать?
Не бери в голову

adawdp

  • Гость
Re: Сжать PDF как шакала !
« Ответ #5 : 14 Октября 2015, 14:16:02 »
2015 Oct 14; 07:15 AM; Oakville, ON, Canada.

— Весьма образное, конечно, gamayun, сравнение ! :) Но чем вручную обрабатывать большое количество страниц может проще купить эту книжку, дешевле будет?

— А вообще мне нравится как мы тут сами с собой разговариваем, а может попросим автора темы прислать свои исходные фото да всем миром навалимся да сделаем книгу :), заодно и почитаем…

— Да сожмём этот проклятый PDF  „как шакала“ … Вот про „шакала“ хотелось бы поподробней :) !

http://s.arboreus.com/2010/01/3-ways-to-crop-pdf-margins.html
« Последнее редактирование: 14 Октября 2015, 14:25:18 от adawdp »

Оффлайн RUstorm

  • Активист
  • *
  • Сообщений: 701
    • Просмотр профиля
Re: Сжать PDF как шакала !
« Ответ #6 : 14 Октября 2015, 14:16:28 »
Сжать изображение и создать pdf - не проблема, что бы перевернуть все изображения тоже можно но нужна ручная сортировка,а вот чтобы обрезать столы и руки и прочее что попало - только вручную.
Если нужен именно текст то все же лучше воспользоваться finereader

Оффлайн gamayun

  • Активист
  • *
  • Сообщений: 823
  • Кто ищет, тот найдёт, может быть...
    • Просмотр профиля
Re: Сжать PDF как шакала !
« Ответ #7 : 14 Октября 2015, 14:35:46 »
2015 Oct 14; 07:15 AM; Oakville, ON, Canada.

— Весьма образное, конечно, gamayun, сравнение ! :) Но чем вручную обрабатывать большое количество страниц может проще купить эту книжку, дешевле будет?

— А вообще мне нравится как мы тут сами с собой разговариваем, а может попросим автора темы прислать свои исходные фото да всем миром навалимся да сделаем книгу :), заодно и почитаем…

— Да сожмём этот проклятый PDF  „как шакала“ … Вот про „шакала“ хотелось бы поподробней :) !

http://s.arboreus.com/2010/01/3-ways-to-crop-pdf-margins.html
master-pdf-editor - хорошая вещь,бесплатная,но руки и столы по моему ни какая прога на автомате не вырежет.И даже платная под винду.
« Последнее редактирование: 20 Июня 2019, 07:42:18 от zg_nico »
Не бери в голову

 

Страница сгенерирована за 0.029 секунд. Запросов: 23.