Форум русскоязычного сообщества Ubuntu


Увидели сообщение с непонятной ссылкой, спам, непристойность или оскорбление?
Воспользуйтесь ссылкой «Сообщить модератору» рядом с сообщением!

Автор Тема: [Wiki] Руководство по работе с wget.  (Прочитано 86815 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн alexander.pronin

  • Старожил
  • *
  • Сообщений: 2539
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #60 : 29 Ноября 2010, 10:14:52 »
Если используется прокси

Редактируем файл /etc/wgetrc Находим и изменяем строки:
http_proxy = http://ip:порт/
ftp_proxy = http://ip:порт/
 
use_proxy = on

Взято отсюда
http://www.mikeryabov.tk/ubuntu/3proxy

Оффлайн Noor

  • Новичок
  • *
  • Сообщений: 3
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #61 : 29 Ноября 2010, 18:29:15 »
не используется.  и не знаю что это такое.  а других вариантов нет? 

Пользователь решил продолжить мысль 29 Ноября 2010, 21:29:06:
нашел. :) как решить описано здесь: http://linux-in-life.blogspot.com/2009/06/wget-utf8.html

 но мою проблему это не решило. кажется в другом проблема. :idiot2:
« Последнее редактирование: 29 Ноября 2010, 21:29:06 от assaso »

Оффлайн amph

  • Новичок
  • *
  • Сообщений: 34
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #62 : 04 Декабря 2010, 02:36:12 »
Для себя сделал так:
На панельке сверху создал ярлык с командой:
wget -c -i "/home/USER/Рабочий стол/downloads.txt" -P "/media/DATA/Incom" --content-disposition
Получил в итоге:
В файлик на рабочем столе downloads.txt кидаем нужную ссылку/ссылки, сохраняем, на панеле приложений кликаем по ярлыку wget'a .. и все ссылки с ПРАВИЛЬНЫМИ именами закачивает в указанный каталог :) как по мне удобнее некуда :) плюс докачка в пункте -с учтена :)
Linux Mint 15

Оффлайн ArcFi

  • Старожил
  • *
  • Сообщений: 15189
    • Просмотр профиля
    • aetera.net
Re: Руководство по работе с wget.
« Ответ #63 : 04 Декабря 2010, 12:51:34 »
amph, для запоминания опций есть .wgetrc

Оффлайн amph

  • Новичок
  • *
  • Сообщений: 34
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #64 : 04 Декабря 2010, 13:37:31 »
amph, для запоминания опций есть .wgetrc

я нигде не нашел человеческого FAQ по нем
Linux Mint 15

Оффлайн ArcFi

  • Старожил
  • *
  • Сообщений: 15189
    • Просмотр профиля
    • aetera.net
Re: Руководство по работе с wget.
« Ответ #65 : 04 Декабря 2010, 13:44:30 »
Вот пример синтаксиса:
(Нажмите, чтобы показать/скрыть)

Все опции из man wget

Оффлайн banan

  • Новичок
  • *
  • Сообщений: 18
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #66 : 23 Декабря 2010, 18:22:26 »
 Подскажите, кто знает, надо с сайта выкачать файлы по маске +определенного размера (там типа превьюшки есть - короткие mp3). Как короткие файлы  "отсечь"?  В manе нету про лимиты размеров. Поиск пока ничего не дал. Скрипты еще не осилил.
 делал так:
wget -r -l 3 -A mp3 site.com && find  \( -size -500 \) -exec rm  {} \;

Вот только ненужных файлов слишком много накачалось, может можно их не качать?

Прикольно, вот нашел ответ на похожий с моим  вопрос на англоязычном ресурсе: 
your question was: How can I? And both answered: You can't!
« Последнее редактирование: 23 Декабря 2010, 18:44:04 от banan »

Оффлайн ArcFi

  • Старожил
  • *
  • Сообщений: 15189
    • Просмотр профиля
    • aetera.net
Re: Руководство по работе с wget.
« Ответ #67 : 23 Декабря 2010, 21:13:14 »
Прикольно, вот нашел ответ на похожий с моим  вопрос на англоязычном ресурсе: 
your question was: How can I? And both answered: You can't!
Да, пожалуй, одним wget не обойтись.
Можно удалить лишнее после скачивания через find или из наутилуса, отсортировав файлы по размеру.

Оффлайн banan

  • Новичок
  • *
  • Сообщений: 18
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #68 : 23 Декабря 2010, 22:14:49 »
Сортировать и удалять после скачивания - это банально, хочется поинтеллектуальнее чего-нибудь. Будем искать.

Оффлайн ArcFi

  • Старожил
  • *
  • Сообщений: 15189
    • Просмотр профиля
    • aetera.net
Re: Руководство по работе с wget.
« Ответ #69 : 23 Декабря 2010, 22:31:33 »
хочется поинтеллектуальнее чего-нибудь

Можно удалить лишнее после скачивания через find

Оффлайн alexander.pronin

  • Старожил
  • *
  • Сообщений: 2539
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #70 : 24 Декабря 2010, 08:43:27 »
Там принцип такой. Если встречается какая-то ссылка, то по этой ссылке что-то еще скачается.
Далее в новой ссылке ситуация повторяется.
Возможно бесконечная закачка, если встречаются переходы на доп. ресурсы.
Для ограничения существует максимальное количество рекурсивных вложений.
Я ее в курсе, есть ли это в wget.

Оффлайн KotKit

  • Новичок
  • *
  • Сообщений: 9
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #71 : 21 Марта 2011, 08:09:02 »
Всем доброго времени суток!
Подскажите, как с помощью wget выкачать сайт, если он состоит из зипованных html:
$ file index.html
index.html: gzip compressed data, from Unix

при попытке выкачать  получаю:
(Нажмите, чтобы показать/скрыть)
т.е. скачивается тоглько один файл и все.
Пользуюсь Wget 1.12 , kubuntu 10.04 .

siteget, здесь где-то о нем писалось, код:
wget --mirror --convert-links --no-verbose --no-parent --page-requisites \
   --directory-prefix=/home/konst/SG1 \
   --user-agent="Mozilla/5.0 (compatible; Konqueror/3.0.0/10; Linux)" ${1}
« Последнее редактирование: 21 Марта 2011, 08:12:55 от KotKit »

Оффлайн dayser

  • Любитель
  • *
  • Сообщений: 82
  • Жизнь - вечная борьба
    • Просмотр профиля
    • -=FORSAGE=-
Re: Руководство по работе с wget.
« Ответ #72 : 21 Марта 2011, 17:02:14 »
Всем доброго времени суток!
Подскажите, как с помощью wget выкачать сайт, если он состоит из зипованных html:
$ file index.html
index.html: gzip compressed data, from Unix

при попытке выкачать  получаю:
(Нажмите, чтобы показать/скрыть)
т.е. скачивается тоглько один файл и все.
Пользуюсь Wget 1.12 , kubuntu 10.04 .

siteget, здесь где-то о нем писалось, код:
wget --mirror --convert-links --no-verbose --no-parent --page-requisites \
   --directory-prefix=/home/konst/SG1 \
   --user-agent="Mozilla/5.0 (compatible; Konqueror/3.0.0/10; Linux)" ${1}

выставте ограничение по входным каталогам. Мне кажется администратор сайта позаботился о правах доступа и admin панель скачать не даст)
Пожалуй я поселюсь у вас.....

Оффлайн AgenT_Vano

  • Новичок
  • *
  • Сообщений: 5
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #73 : 27 Апреля 2011, 20:02:06 »
Здравствуйте, у меня такая проблема нужно скачать все фотографии с помощью wget с сайта http://www.strnad.info/17plseMFFUK2011/ именно фотографии а не их уменьшенные изображения, помогите пожалуйста.

Оффлайн ArcFi

  • Старожил
  • *
  • Сообщений: 15189
    • Просмотр профиля
    • aetera.net
Re: Руководство по работе с wget.
« Ответ #74 : 27 Апреля 2011, 20:51:57 »
AgenT_Vano,
wget -qO- http://www.strnad.info/17plseMFFUK2011/ | grep -o 'images/[^"]*' | egrep -v '_t\.|\.js$|\.css$' | while read ; do wget -qP strnad.info http://www.strnad.info/$REPLY ; done

 

Страница сгенерирована за 0.018 секунд. Запросов: 21.