Форум русскоязычного сообщества Ubuntu


Хотите сделать посильный вклад в развитие Ubuntu и русскоязычного сообщества?
Помогите нам с документацией!

Автор Тема: [Wiki] Руководство по работе с wget.  (Прочитано 78437 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн AgenT_Vano

  • Новичок
  • *
  • Сообщений: 5
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #75 : 27 Апреля 2011, 22:37:32 »
AgenT_Vano,
wget -qO- http://www.strnad.info/17plseMFFUK2011/ | grep -o 'images/[^"]*' | egrep -v '_t\.|\.js$|\.css$' | while read ; do wget -qP strnad.info http://www.strnad.info/$REPLY ; done


Большое спасибо за помощь, всё работает. Ну вот я только не совсем понял с шаблоном у egrep и почему в цикле укана ссылка на главную страницу сайта а не на месорасположение фотографий ? Мне нужно вот с этого сайта http://photo.rdx.cz/index.php?show=album&aid=412 тоже выкачать все фотографии, надеелся сделать это по подобию ну у меня что то не получается. Заранее спасибо за ответ.

Оффлайн AgenT_Vano

  • Новичок
  • *
  • Сообщений: 5
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #76 : 20 Мая 2011, 00:49:03 »
wget -qO- 'http://photo.rdx.cz/index.php?show=album&aid=412' | egrep -o 'index.php\?show=photo&pid=[0-9]+&aid=412' | sed 's/.*pid=\([0-9]*\).*/\1/' | while read num; do wget -P photo.rdx http://photo.rdx.cz/"$(wget -qO- "http://photo.rdx.cz/index.php?show=photo&pid=$num&aid=412" | egrep -o '"showphoto/.+jpg"' | sed 's/"//g')"; done

 

Оффлайн guland2000

  • Участник
  • *
  • Сообщений: 144
  • www.andreid.ru
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #77 : 27 Мая 2011, 00:10:07 »
Теперь вопрос?А как это смотреть через что?Скачав сайт посредством: wget http://www.google.ru/ ;) --mirror,не могу просматривать скачанное,браузер всё время лезет в интернет :D
andreid.ru

Оффлайн alexander.pronin

  • Старожил
  • *
  • Сообщений: 2539
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #78 : 27 Мая 2011, 08:05:55 »
Файл - Работать автономно.
Бывает, что надо подкорректировать что-то ссылочное или убрать их совсем. Сейчас пошла мода, вставлять гугловские ссылки (какой-то маразм).
« Последнее редактирование: 27 Мая 2011, 08:23:51 от alexander.pronin »

Оффлайн guland2000

  • Участник
  • *
  • Сообщений: 144
  • www.andreid.ru
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #79 : 27 Мая 2011, 14:00:43 »
Скачал сайт посредством следующей команды: $ wget -r -l0 -k http://www.site.ru/
Но конечно же с проблемами:
1.Нельзя воспользоваться меню внизу страницы, хотя и установил значение -k.Страницы открываются но только как директории
(Нажмите, чтобы показать/скрыть)
2.Некоторые линки внутри сайта просят соединене с интеренетом.
Почему так? :D
 
andreid.ru

Оффлайн Yujen

  • Любитель
  • *
  • Сообщений: 83
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #80 : 01 Июня 2011, 15:06:48 »
2.Некоторые линки внутри сайта просят соединене с интеренетом.
Почему так? :D
 
Потому что, есть абсолютные, а, есть относительные пути

все зависит от разгильдяйства образованности кодера
ubuntu(KDE) => fedora(KDE)

Оффлайн guland2000

  • Участник
  • *
  • Сообщений: 144
  • www.andreid.ru
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #81 : 01 Июня 2011, 18:37:06 »
2.Некоторые линки внутри сайта просят соединене с интеренетом.
Почему так? :D
 
Потому что, есть абсолютные, а, есть относительные пути

все зависит от разгильдяйства образованности кодера

Лечению поддаётся с моей стороны????
andreid.ru

Оффлайн I_K

  • Новичок
  • *
  • Сообщений: 33
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #82 : 30 Июня 2011, 02:33:10 »
Хочу скачать все файлы из дирректории http://host/dir/

Если адрес http://host/dir/ ввести в строку браузера, то открывается директория с файлами, которые мне и нужны.

Пытаюсь скачать все эти файлы
wget -r -l1 http://host/dir/
в результате скачивается файл index.html с именами всех нужных мне файлов, а не сами файлы.

Как скачать именно сами файлы из директории?

Заранее спасибо!

Оффлайн alexander.pronin

  • Старожил
  • *
  • Сообщений: 2539
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #83 : 30 Июня 2011, 08:31:35 »
Принцип скачивания сайта следующий.
1. Скачивается стартовая страница.
2. В скачанной странице выделяются все ссылки. Скачиваются все ссылочные страницы.
3. Повторяется пункт 2 указанное (разумное) количество раз).

Здесь есть несколько засад.
1. Скачивается не модель сайта, а представление, генерируемое веб-сервером.
2. Можно уйти во внешние ссылки.
3. Нет ссылки - нет скачанной страницы.

ЗЫ. То что у Вас видны все директории - это дыра и ее надо заштопать.

Оффлайн oldTV

  • Новичок
  • *
  • Сообщений: 1
    • Просмотр профиля
Re: [Wiki] Руководство по работе с wget.
« Ответ #84 : 04 Октября 2011, 12:21:24 »
коллеги, как правильно получить файл полностью. Я использую
wget -c -P d:\GetFiles http://mySites.ru/BigLogo.jpgно иногда картинка закачивается не полностью, и об этом wget тоже говорит (он выдает что то типа)

Length: 87,008 [image/jpeg]
100%[====================================>] 87,008       247.00K/s    ETA 00:00

иногда 50%, иногда 95%.

Как составить команду так, чтобы только после загрузки на самой странице была скачана картинка?

Оффлайн Batja

  • Новичок
  • *
  • Сообщений: 13
    • Просмотр профиля
Re: [Wiki] Руководство по работе с wget.
« Ответ #85 : 24 Февраля 2012, 15:49:57 »
 :'( Как отменить зачачку в Wget? Чтобы она не возобновлялась?

Оффлайн ArcFi

  • Старожил
  • *
  • Сообщений: 15189
    • Просмотр профиля
    • aetera.net
Re: [Wiki] Руководство по работе с wget.
« Ответ #86 : 02 Марта 2012, 19:18:04 »
Batja, Ctrl+C, или вы про что?

Оффлайн oermolaev

  • Старожил
  • *
  • Сообщений: 1479
    • Просмотр профиля
Re: [Wiki] Руководство по работе с wget.
« Ответ #87 : 14 Июня 2012, 16:33:47 »
Batja, Ctrl+C, или вы про что?

Что то у меня по Ctrl+C не останавливается. Помогает только pkill -9 wget (xubuntu 12.04 x86_64)

Оффлайн tеma

  • Активист
  • *
  • Сообщений: 306
    • Просмотр профиля
Re: [Wiki] Руководство по работе с wget.
« Ответ #88 : 24 Июня 2012, 23:23:19 »
А как при помощи wget скачать список файлов так, чтобы каждый файл был в своей директории так-же, как и на сайте. При этом весь сайт скачивать не надо, а только файлы из списка в текстовом файлике.
Например даны следующие файлы:
http://abc.ru/abc/1.txt
http://abc.ru/abc/2.txt
http://abc.ru/abc/3.txt
http://abc.ru/abd/1.txt
http://abc.ru/abd/2.txt
http://abc.ru/abd/3.txt
При этом надо, чтобы первые 3 файла скачались в папку abc, а следующие 3 -- в папку abd. Как это реализовать?

Оффлайн Taumer

  • Новичок
  • *
  • Сообщений: 3
    • Просмотр профиля
Re: [Wiki] Руководство по работе с wget.
« Ответ #89 : 25 Июня 2012, 10:41:22 »
#!/bin/bash
cd abc
wget http://abc.ru/abc/1.txt
wget http://abc.ru/abc/2.txt
wget http://abc.ru/abc/3.txt
cd ../abd
wget http://abc.ru/abd/1.txt
wget http://abc.ru/abd/2.txt
wget http://abc.ru/abd/3.txt

 

Страница сгенерирована за 0.059 секунд. Запросов: 25.