Форум русскоязычного сообщества Ubuntu


Хотите сделать посильный вклад в развитие Ubuntu и русскоязычного сообщества?
Помогите нам с документацией!

Автор Тема: помощь с сайтом (wget)  (Прочитано 507 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн DimmKo

  • Автор темы
  • Активист
  • *
  • Сообщений: 260
    • Просмотр профиля
    • Image Hosting
помощь с сайтом (wget)
« : 02 Ноября 2015, 11:35:20 »
Товарищи, добрый день.
Поставили задачу: есть сайт (там Drupal). Там статьи с картинками и видюшками.
Необходимо делать реплику сайта, но что бы на выходе были Html-страницы. Соответственно, должен быть переход между ними, картинки и видюшечки что бы показывали.
Мне на ум пришло только использовать wget
т.е. запускаю
wget -r -k -p -N -K --html-extension http://my_site
-N указывает что ненадо качать файлы если существуют уже такие.
Но почему-то очень медленно процесс идет. Время занимает несколько часов. Возможно как-то использовать его в несколько потоков?
Или может кто знает какие аналоги?
Спасибо.

Пользователь решил продолжить мысль [time]03 Ноябрь 2015, 09:39:46[/time]:
Выкачал сайт без выкачивания файлов.
Как теперь нужно как-то внутри html удалить часть ссылки:
http://mysite.ru/sites/default/files --> удалить http://mysites.ru В итоге должно остаться /sites/default/files
может кто знает?
« Последнее редактирование: 03 Ноября 2015, 09:09:27 от DimmKo »
Ubuntu Server 24.04.1 LTS | x86_64

 

Страница сгенерирована за 0.02 секунд. Запросов: 19.