Русскоязычное сообщество Ubuntu Linux
*

Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Вам не пришло письмо с кодом активации?
Войти

 Получить помощь вы также можете в нашем списке рассылки:
ubuntu-ru@lists.ubuntu.com
Русскоязычное сообщество Ubuntu Linux  |  Поддержка  |  How-To & F.A.Q (Модераторы: victor53p, Дмитрий Бо, Offoff, vadimka, MadKox, EgoVir, Labaman, ubuntar)  |  Тема: Руководство по работе с wget.
Страниц: 1 2 3 [4]  Все   Вниз
Печать
Автор Тема: Руководство по работе с wget.  (Прочитано 14597 раз)
0 Пользователей и 2 Гостей смотрят эту тему.
Vlasssov
Гость
« Ответ #45 : 26 Сентября 2009, 00:42:18 »

Почитал описание wget, и что-то не нашел там опции скачивания файлов с фильтром по имени файла. То есть чтобы было можно задать:
Скачивать ТОЛЬКО те файлы, в адресе которых будет слово ***

Есть там такая опция?
Записан
Polkan
Любитель
**
Сообщений: 95



Просмотр профиля
« Ответ #46 : 28 Сентября 2009, 16:29:57 »

Почитал описание wget, и что-то не нашел там опции скачивания файлов с фильтром по имени файла. То есть чтобы было можно задать:
Скачивать ТОЛЬКО те файлы, в адресе которых будет слово ***

Есть там такая опция?

http://www.opennet.ru/man.shtml?topic=wget&category=1&russian=0

Загрузить файлы GIF папки на HTTP сервере.
Команда wget http://www.server.com/dir/*.gif не будет работать, так как маскировочные символы не поддерживаются при загрузке по протоколу HTTP. Используйте: 
Код:
wget -r -l1 --no-parent -A.gif http://www.server.com/dir/
-r -l1 включает рекурсивную загрузку с максимальной глубиной 1.
--no-parent выключает следование по ссылкам в родительскую папку, имеющую верхний уровень,
 -A.gif разрешает загружать только файлы с расширением .GIF.  -A "*.gif" также будет работать.
Записан
Vlasssov
Гость
« Ответ #47 : 04 Октября 2009, 06:05:42 »

Почитал описание wget, и что-то не нашел там опции скачивания файлов с фильтром по имени файла. То есть чтобы было можно задать:
Скачивать ТОЛЬКО те файлы, в адресе которых будет слово ***

Есть там такая опция?

http://www.opennet.ru/man.shtml?topic=wget&category=1&russian=0

Загрузить файлы GIF папки на HTTP сервере.
Команда wget http://www.server.com/dir/*.gif не будет работать, так как маскировочные символы не поддерживаются при загрузке по протоколу HTTP. Используйте: 
Код:
wget -r -l1 --no-parent -A.gif http://www.server.com/dir/
-r -l1 включает рекурсивную загрузку с максимальной глубиной 1.
--no-parent выключает следование по ссылкам в родительскую папку, имеющую верхний уровень,
 -A.gif разрешает загружать только файлы с расширением .GIF.  -A "*.gif" также будет работать.
Мне фильтр по разрешению не нужен... Мне нужен фильтр по ИМЕНИ файла.
Например, мне нужно скачать с определенного ресурса все файлы, где в ссылке содержиться слово print
*print*.*
вот как это сделать?
Записан
Polkan
Любитель
**
Сообщений: 95



Просмотр профиля
« Ответ #48 : 05 Октября 2009, 12:38:28 »

...
Код:
wget -r -l1 --no-parent -A.gif http://www.server.com/dir/
-r -l1 включает рекурсивную загрузку с максимальной глубиной 1.
--no-parent выключает следование по ссылкам в родительскую папку, имеющую верхний уровень,
 -A.gif разрешает загружать только файлы с расширением .GIF.  -A "*.gif" также будет работать.
Мне фильтр по разрешению не нужен... Мне нужен фильтр по ИМЕНИ файла.
Например, мне нужно скачать с определенного ресурса все файлы, где в ссылке содержиться слово print
*print*.*
вот как это сделать?
К.О. тактично намекает, что надо заменить -A "*.gif" на -A "*print*"  Wink
Записан
port72
Новичок
*
Сообщений: 8


Просмотр профиля
« Ответ #49 : 19 Ноября 2009, 14:08:06 »

Загрузить файлы GIF папки на HTTP сервере.
Команда wget http://www.server.com/dir/*.gif не будет работать, так как маскировочные символы не поддерживаются при загрузке по протоколу HTTP. Используйте: 
Код:
wget -r -l1 --no-parent -A.gif http://www.server.com/dir/
-r -l1 включает рекурсивную загрузку с максимальной глубиной 1.
--no-parent выключает следование по ссылкам в родительскую папку, имеющую верхний уровень,
 -A.gif разрешает загружать только файлы с расширением .GIF.  -A "*.gif" также будет работать.

Хммм... а из-за чего эта конструкция может не работать?

Код:
proxy# wget -r -l1 --no-parent -A.GIF http://rp5.ru/img/
--2009-11-19 14:06:59--  http://rp5.ru/img/
Распознаётся rp5.ru... 217.16.28.152
Устанавливается соединение с rp5.ru|217.16.28.152|:80... соединение установлено.
Запрос HTTP послан, ожидается ответ... 200 OK
Длина: 5050 (4,9K) [text/html]
Сохраняется в каталог: `rp5.ru/img/index.html'.

100%[===================================================================================================================>] 5 050       --.-K/s   в 0,03s

2009-11-19 14:06:59 (159 KB/s) - `rp5.ru/img/index.html' сохранён [5050/5050]

Удаляется rp5.ru/img/index.html, т.к. он должен быть исключён.

ЗАВЕРШЕНО --2009-11-19 14:06:59--
Загружено: 1 файлов, 4,9K за 0,03s (159 KB/s)


В итоге вместо кучи gif файлов один Index of /img со ссылками на них
Записан
Serge
Активист
****
Сообщений: 324

Debian Sid


Просмотр профиля
« Ответ #50 : 30 Декабря 2009, 19:58:18 »

Как остановить или приостановить закачку? Кроме killall wget работает что-нибудь?
Записан
ArcFi
Герой
*****
Сообщений: 5456


arcfi.x@gmail.com
Просмотр профиля
« Ответ #51 : 30 Декабря 2009, 21:11:15 »

Serge,
Код:
pkill -STOP wget
pkill -CONT wget
pkill -9 wget

man kill
man pkill
Записан
nep
Новичок
*
Сообщений: 1


Просмотр профиля
« Ответ #52 : 26 Января 2010, 22:57:10 »

столкнулся со следующим:

нужно - выкачать сайт целиком. использую: wget -rkp

проблема: в шаблоне сайта в css файле используются картинки (background: url(images/bg.gif); - так, к примеру), а они не подгружаются.
Есть ли возможность таки заставить wget их видеть и подгружать?

Спасибо.
Записан
svcunion
Участник
***
Сообщений: 206


Всё на самом деле не так, как на самом деле.


Просмотр профиля
« Ответ #53 : 27 Января 2010, 10:17:31 »

Отличная тема, главное не увядающая свое актуальностью.
Конечно бывают случаи когда надо скинуть весь сайт, но немало вариантов когда надо копирнуть одну тему из этого сайта.
Пример: http://citforum.ru/programming/python.shtml
Надо скачать одну тему по питону. Зачем тянуть все эти новостные и прочие ветки. Ну ладно попадуться ветки и линки с искомой странице, но как ни искал в мане не нашел ключей на глубину погружения более допустим двух - трех страниц. Может кто-то читал иначе, у него успехов по - больше? Поделитесь тогда.

Пользователь решил продолжить мысль 27 Января 2010, 19:36:04:
Просьба оценить правильность. Напомню, моя задача сделать закачку с сайта глубиной не более трех переходов.

wget -r -l 3 -k /home/mycomp/admin/ http://www.openspin.org/materials/courses/admin/index.html

Качать - качает, хотя и с меньшими излишествами, но все равно в к общий юзерский каталог, а не в указанную /home/mycomp/admin/.
Не пойму почему. Не уверен, что во всем выполняется переход не более чем на три страницы.

Новая идея:
wget -r -l 3 -np -P /home/mycomp/admin/ http://www.openspin.org/materials/courses/admin/index.html
Вечером проверю.
« Последнее редактирование: 28 Января 2010, 08:08:45 от svcunion » Записан
kotnaton
Участник
***
Сообщений: 125


Просмотр профиля
« Ответ #54 : 09 Февраля 2010, 01:07:20 »

Почитал - трудно сразу понять  Cheesy. wget -сильная вещь.
Если не трудно -подскажите как решить следующую задачу. Я понимаю что есть Filezilla, но интересует именно wget.
Допустим нужно скачать с FTP определённую папку с подпапками, ну соответственно с файлами, находящимися в них.
 Как реализовать это с помощью wget ?

wget -r ftp://www.aaa.com/files/*
А если, то же самое, только на страницу http с в вложенными папками, содержащими ссылки на доменном фтп, но которые сайт не хочет отдавать в index.html загружаемый wget ? Опция
Цитата
--user-agent="Mozilla/5.0 (compatible; Konqueror/3.0.0/10; Linux)"

Не помогла. Спасибо Smiley
« Последнее редактирование: 09 Февраля 2010, 02:01:19 от kotnaton » Записан

Проверяйте скачанные iso-шники командой: md5sum -c MD5SUMS.txt
andronix
Новичок
*
Сообщений: 47


404139459
Просмотр профиля Email
« Ответ #55 : 27 Июля 2010, 19:32:55 »

Короче прочитал вчю тему и так и не понял.  Расскажите как качать вгетом с сайта сразу все песни mp3 с прямыми ссылками? сайт http://my-hit.ru/film/8314/tracks
Записан
ArcFi
Герой
*****
Сообщений: 5456


arcfi.x@gmail.com
Просмотр профиля
« Ответ #56 : 27 Июля 2010, 19:52:38 »

andronix, минимум, пара вариантов:
1) flashgot+wget
2)
Код:
wget "http://my-hit.ru/film/8314/tracks" -O- | grep -o "saundtreki/.*.mp3" | sort -u | while read ; do wget "http://my-hit.ru/$REPLY" ; done
« Последнее редактирование: 27 Июля 2010, 19:54:17 от ArcFi » Записан
nikolai_rys
Новичок
*
Сообщений: 1


Просмотр профиля
« Ответ #57 : 28 Июля 2010, 00:24:04 »

Здравствуйте.

Следующая проблема:
Была установлена Ubuntu 9.10 Server
И функции fetch  curl wget  не работают..
Пишет:
-bash: fetch: command not found

И так со всеми функциями..
Более всего интересует wget.

Подскачите , куда копать.
Заранее спасибо.

Проблему решил.Решается:
sudo apt-get install wget

p.s.Пост оставил , может кто-то будет искать - накнется..А то я вот не нашел на рус..Только у буржуев.
« Последнее редактирование: 28 Июля 2010, 00:26:41 от nikolai_rys » Записан
Страниц: 1 2 3 [4]  Все   Вверх
Печать
Русскоязычное сообщество Ubuntu Linux  |  Поддержка  |  How-To & F.A.Q (Модераторы: victor53p, Дмитрий Бо, Offoff, vadimka, MadKox, EgoVir, Labaman, ubuntar)  |  Тема: Руководство по работе с wget.
Перейти в:  


Powered by MySQL Powered by PHP Powered by SMF 1.1.11 | SMF © 2006, Simple Machines LLC Best Hosting
Серверы на Ubuntu
Страница сгенерирована за 0.296 секунд. Запросов: 19.