Форум русскоязычного сообщества Ubuntu


Увидели сообщение с непонятной ссылкой, спам, непристойность или оскорбление?
Воспользуйтесь ссылкой «Сообщить модератору» рядом с сообщением!

Автор Тема: Автоматическая конвертация html2pdf  (Прочитано 1081 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн arka1m

  • Автор темы
  • Новичок
  • *
  • Сообщений: 6
    • Просмотр профиля
Добрый день.
Есть ли способ конвертировать html2pdf, если имеем "имя-файлы.html" и рядом с ним папку "имя-файла_files", причем html-файлов много и все они лежат в разных папках.
То есть можно ли скормить какой-нибудь каталог конвертеру, и он рядом с каждым html-файлом положит его pdf-копию, не нарушая порядка папок?
Достаточно сумбурно написал, но смысл, надеюсь понятен.

andrey_p

  • Гость
Re: Автоматическая конвертация html2pdf
« Ответ #1 : 17 Мая 2011, 09:08:20 »
Все зависит от того, в каком виде сохраненные файлы. Если необработанные страницы с каких-нибудь блогов - жуть. Основная проблема в исходных файлах. Если они просто сохранялись с сайтов, то в папке имя_файла_files может быть еще куча хтмл-файлов, которых конвертировать не надо, поэтому командой - find -name '*.html' нужные файлы не найдешь. Нужно скрипт писать.

Кроме того, если конвертировать (допустим, с помощью python-pisa), то если они сохранены с таблицами, стилями, скриптами и прочей лабудой, то результат, скорее всего будет отвратителен.

Вообще, на будущее - собирать коллекцию информации просто сохраняя страницы и раскидывая их по папкам - пустая трата времени. Для серьезной работы - используй плагин Scrapbook для Firefox.

ЗЫ Основная мысль - можно, и, может быть, даже не очень сложно, но все зависит от того, в каком виде файлы - кодировка, пробелы в именах файлов, стили. В простейшем случае все могло бы быть так:

% ls -R | grep 'html$' | while read f; do
xhtml2pdf "$f" "${f%html}pdf"
done
« Последнее редактирование: 17 Мая 2011, 09:23:05 от andrey_p »

 

Страница сгенерирована за 0.014 секунд. Запросов: 20.