Автор Тема: Автоматическая конвертация html2pdf (Прочитано 1089 раз)

arka1m · « : 16 Мая 2011, 22:21:49 »

Добрый день.
Есть ли способ конвертировать html2pdf, если имеем "имя-файлы.html" и рядом с ним папку "имя-файла_files", причем html-файлов много и все они лежат в разных папках.
То есть можно ли скормить какой-нибудь каталог конвертеру, и он рядом с каждым html-файлом положит его pdf-копию, не нарушая порядка папок?
Достаточно сумбурно написал, но смысл, надеюсь понятен.

andrey_p · « **Ответ #1 :** 17 Мая 2011, 09:08:20 »

Все зависит от того, в каком виде сохраненные файлы. Если необработанные страницы с каких-нибудь блогов - жуть. Основная проблема в исходных файлах. Если они просто сохранялись с сайтов, то в папке имя_файла_files может быть еще куча хтмл-файлов, которых конвертировать не надо, поэтому командой - find -name '*.html' нужные файлы не найдешь. Нужно скрипт писать.

Кроме того, если конвертировать (допустим, с помощью python-pisa), то если они сохранены с таблицами, стилями, скриптами и прочей лабудой, то результат, скорее всего будет отвратителен.

Вообще, на будущее - собирать коллекцию информации просто сохраняя страницы и раскидывая их по папкам - пустая трата времени. Для серьезной работы - используй плагин Scrapbook для Firefox.

ЗЫ Основная мысль - можно, и, может быть, даже не очень сложно, но все зависит от того, в каком виде файлы - кодировка, пробелы в именах файлов, стили. В простейшем случае все могло бы быть так:

Код: [Выделить]

% ls -R | grep 'html$' | while read f; do
xhtml2pdf "$f" "${f%html}pdf"
done

Форум русскоязычного сообщества Ubuntu

Автор Тема: Автоматическая конвертация html2pdf (Прочитано 1089 раз)

arka1m

Автоматическая конвертация html2pdf

andrey_p

Re: Автоматическая конвертация html2pdf