Форум русскоязычного сообщества Ubuntu


Следите за новостями русскоязычного сообщества Ubuntu в Twitter-ленте @ubuntu_ru_loco

Автор Тема: [Wiki] Руководство по работе с wget.  (Прочитано 78210 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Vlasssov

  • Гость
Re: Руководство по работе с wget.
« Ответ #45 : 26 Сентября 2009, 00:42:18 »
Почитал описание wget, и что-то не нашел там опции скачивания файлов с фильтром по имени файла. То есть чтобы было можно задать:
Скачивать ТОЛЬКО те файлы, в адресе которых будет слово ***

Есть там такая опция?

Оффлайн Polkan

  • Участник
  • *
  • Сообщений: 124
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #46 : 28 Сентября 2009, 16:29:57 »
Почитал описание wget, и что-то не нашел там опции скачивания файлов с фильтром по имени файла. То есть чтобы было можно задать:
Скачивать ТОЛЬКО те файлы, в адресе которых будет слово ***

Есть там такая опция?

http://www.opennet.ru/man.shtml?topic=wget&category=1&russian=0

Загрузить файлы GIF папки на HTTP сервере.
Команда wget http://www.server.com/dir/*.gif не будет работать, так как маскировочные символы не поддерживаются при загрузке по протоколу HTTP. Используйте:  wget -r -l1 --no-parent -A.gif http://www.server.com/dir/-r -l1 включает рекурсивную загрузку с максимальной глубиной 1.
--no-parent выключает следование по ссылкам в родительскую папку, имеющую верхний уровень,
 -A.gif разрешает загружать только файлы с расширением .GIF.  -A "*.gif" также будет работать.

Vlasssov

  • Гость
Re: Руководство по работе с wget.
« Ответ #47 : 04 Октября 2009, 06:05:42 »
Почитал описание wget, и что-то не нашел там опции скачивания файлов с фильтром по имени файла. То есть чтобы было можно задать:
Скачивать ТОЛЬКО те файлы, в адресе которых будет слово ***

Есть там такая опция?

http://www.opennet.ru/man.shtml?topic=wget&category=1&russian=0

Загрузить файлы GIF папки на HTTP сервере.
Команда wget http://www.server.com/dir/*.gif не будет работать, так как маскировочные символы не поддерживаются при загрузке по протоколу HTTP. Используйте:  wget -r -l1 --no-parent -A.gif http://www.server.com/dir/-r -l1 включает рекурсивную загрузку с максимальной глубиной 1.
--no-parent выключает следование по ссылкам в родительскую папку, имеющую верхний уровень,
 -A.gif разрешает загружать только файлы с расширением .GIF.  -A "*.gif" также будет работать.
Мне фильтр по разрешению не нужен... Мне нужен фильтр по ИМЕНИ файла.
Например, мне нужно скачать с определенного ресурса все файлы, где в ссылке содержиться слово print
*print*.*
вот как это сделать?

Оффлайн Polkan

  • Участник
  • *
  • Сообщений: 124
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #48 : 05 Октября 2009, 12:38:28 »
...
wget -r -l1 --no-parent -A.gif http://www.server.com/dir/-r -l1 включает рекурсивную загрузку с максимальной глубиной 1.
--no-parent выключает следование по ссылкам в родительскую папку, имеющую верхний уровень,
 -A.gif разрешает загружать только файлы с расширением .GIF.  -A "*.gif" также будет работать.
Мне фильтр по разрешению не нужен... Мне нужен фильтр по ИМЕНИ файла.
Например, мне нужно скачать с определенного ресурса все файлы, где в ссылке содержиться слово print
*print*.*
вот как это сделать?
К.О. тактично намекает, что надо заменить -A "*.gif" на -A "*print*"  ;)

Оффлайн port72

  • Новичок
  • *
  • Сообщений: 7
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #49 : 19 Ноября 2009, 14:08:06 »
Загрузить файлы GIF папки на HTTP сервере.
Команда wget http://www.server.com/dir/*.gif не будет работать, так как маскировочные символы не поддерживаются при загрузке по протоколу HTTP. Используйте:  wget -r -l1 --no-parent -A.gif http://www.server.com/dir/-r -l1 включает рекурсивную загрузку с максимальной глубиной 1.
--no-parent выключает следование по ссылкам в родительскую папку, имеющую верхний уровень,
 -A.gif разрешает загружать только файлы с расширением .GIF.  -A "*.gif" также будет работать.

Хммм... а из-за чего эта конструкция может не работать?

proxy# wget -r -l1 --no-parent -A.GIF http://rp5.ru/img/
--2009-11-19 14:06:59--  http://rp5.ru/img/
Распознаётся rp5.ru... 217.16.28.152
Устанавливается соединение с rp5.ru|217.16.28.152|:80... соединение установлено.
Запрос HTTP послан, ожидается ответ... 200 OK
Длина: 5050 (4,9K) [text/html]
Сохраняется в каталог: `rp5.ru/img/index.html'.

100%[===================================================================================================================>] 5 050       --.-K/s   в 0,03s

2009-11-19 14:06:59 (159 KB/s) - `rp5.ru/img/index.html' сохранён [5050/5050]

Удаляется rp5.ru/img/index.html, т.к. он должен быть исключён.

ЗАВЕРШЕНО --2009-11-19 14:06:59--
Загружено: 1 файлов, 4,9K за 0,03s (159 KB/s)


В итоге вместо кучи gif файлов один Index of /img со ссылками на них

Serge

  • Гость
Re: Руководство по работе с wget.
« Ответ #50 : 30 Декабря 2009, 19:58:18 »
Как остановить или приостановить закачку? Кроме killall wget работает что-нибудь?

Оффлайн ArcFi

  • Старожил
  • *
  • Сообщений: 15189
    • Просмотр профиля
    • aetera.net
Re: Руководство по работе с wget.
« Ответ #51 : 30 Декабря 2009, 21:11:15 »
Serge,
pkill -STOP wget
pkill -CONT wget
pkill -9 wget

man kill
man pkill

Оффлайн nep

  • Новичок
  • *
  • Сообщений: 1
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #52 : 26 Января 2010, 22:57:10 »
столкнулся со следующим:

нужно - выкачать сайт целиком. использую: wget -rkp

проблема: в шаблоне сайта в css файле используются картинки (background: url(images/bg.gif); - так, к примеру), а они не подгружаются.
Есть ли возможность таки заставить wget их видеть и подгружать?

Спасибо.

Оффлайн svcunion

  • Активист
  • *
  • Сообщений: 565
  • Всё на самом деле не так, как на самом деле.
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #53 : 27 Января 2010, 10:17:31 »
Отличная тема, главное не увядающая свое актуальностью.
Конечно бывают случаи когда надо скинуть весь сайт, но немало вариантов когда надо копирнуть одну тему из этого сайта.
Пример: http://citforum.ru/programming/python.shtml
Надо скачать одну тему по питону. Зачем тянуть все эти новостные и прочие ветки. Ну ладно попадуться ветки и линки с искомой странице, но как ни искал в мане не нашел ключей на глубину погружения более допустим двух - трех страниц. Может кто-то читал иначе, у него успехов по - больше? Поделитесь тогда.

Пользователь решил продолжить мысль 27 Января 2010, 19:36:04:
Просьба оценить правильность. Напомню, моя задача сделать закачку с сайта глубиной не более трех переходов.

wget -r -l 3 -k /home/mycomp/admin/ http://www.openspin.org/materials/courses/admin/index.html

Качать - качает, хотя и с меньшими излишествами, но все равно в к общий юзерский каталог, а не в указанную /home/mycomp/admin/.
Не пойму почему. Не уверен, что во всем выполняется переход не более чем на три страницы.

Новая идея:
wget -r -l 3 -np -P /home/mycomp/admin/ http://www.openspin.org/materials/courses/admin/index.html
Вечером проверю.
« Последнее редактирование: 28 Января 2010, 08:08:45 от svcunion »

Оффлайн kotnaton

  • Участник
  • *
  • Сообщений: 149
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #54 : 09 Февраля 2010, 01:07:20 »
Почитал - трудно сразу понять  :D. wget -сильная вещь.
Если не трудно -подскажите как решить следующую задачу. Я понимаю что есть Filezilla, но интересует именно wget.
Допустим нужно скачать с FTP определённую папку с подпапками, ну соответственно с файлами, находящимися в них.
 Как реализовать это с помощью wget ?

wget -r ftp://www.aaa.com/files/*
А если, то же самое, только на страницу http с в вложенными папками, содержащими ссылки на доменном фтп, но которые сайт не хочет отдавать в index.html загружаемый wget ? Опция
Цитировать
--user-agent="Mozilla/5.0 (compatible; Konqueror/3.0.0/10; Linux)"

Не помогла. Спасибо :)
« Последнее редактирование: 09 Февраля 2010, 02:01:19 от kotnaton »
Проверяйте скачанные iso-шники командой: md5sum -c MD5SUMS.txt

Оффлайн andronix

  • Любитель
  • *
  • Сообщений: 57
  • I am doctor Freeman
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #55 : 27 Июля 2010, 19:32:55 »
Короче прочитал вчю тему и так и не понял.  Расскажите как качать вгетом с сайта сразу все песни mp3 с прямыми ссылками? сайт http://my-hit.ru/film/8314/tracks

Оффлайн ArcFi

  • Старожил
  • *
  • Сообщений: 15189
    • Просмотр профиля
    • aetera.net
Re: Руководство по работе с wget.
« Ответ #56 : 27 Июля 2010, 19:52:38 »
andronix, минимум, пара вариантов:
1) flashgot+wget
2) wget "http://my-hit.ru/film/8314/tracks" -O- | grep -o "saundtreki/.*.mp3" | sort -u | while read ; do wget "http://my-hit.ru/$REPLY" ; done
« Последнее редактирование: 27 Июля 2010, 19:54:17 от ArcFi »

Оффлайн nikolai_rys

  • Новичок
  • *
  • Сообщений: 1
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #57 : 28 Июля 2010, 00:24:04 »
Здравствуйте.

Следующая проблема:
Была установлена Ubuntu 9.10 Server
И функции fetch  curl wget  не работают..
Пишет:
-bash: fetch: command not found

И так со всеми функциями..
Более всего интересует wget.

Подскачите , куда копать.
Заранее спасибо.

Проблему решил.Решается:
sudo apt-get install wget

p.s.Пост оставил , может кто-то будет искать - накнется..А то я вот не нашел на рус..Только у буржуев.
« Последнее редактирование: 28 Июля 2010, 00:26:41 от nikolai_rys »

Оффлайн cooler_3105

  • Новичок
  • *
  • Сообщений: 3
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #58 : 13 Октября 2010, 22:02:48 »
А как можно мастроить категории закачек? Т.е. если wget получает файлы *.avi, *.mkv, то в одну папку, а *.rar, *.zip - в другую.

Оффлайн Noor

  • Новичок
  • *
  • Сообщений: 3
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #59 : 28 Ноября 2010, 23:29:04 »
помогите. у меня такая проблема.
  например когда пробую закачать сайт,где странички названы русскими или арбскими буквами, после скачки имена файлов нечитабельны, и в конце написано неверная кодировка. как сделать чтобы все было  правильно.

 

Страница сгенерирована за 0.106 секунд. Запросов: 25.