Форум русскоязычного сообщества Ubuntu


Хотите сделать посильный вклад в развитие Ubuntu и русскоязычного сообщества?
Помогите нам с документацией!

Автор Тема: [Wiki] Руководство по работе с wget.  (Прочитано 77984 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн ArcFi

  • Старожил
  • *
  • Сообщений: 15189
    • Просмотр профиля
    • aetera.net
Re: Руководство по работе с wget.
« Ответ #30 : 09 Марта 2009, 05:44:55 »
le6681, тот большой зелёный прямоугольник наверху страницы для кого сделан?
google > настройка cron

Оффлайн psor

  • Участник
  • *
  • Сообщений: 107
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #31 : 20 Апреля 2009, 22:30:18 »
скажыте плз как скачивать с помощю wget фалы с сайта или со страницы/ниц по определенному формату .mp3 .jpg .txt читаю маны но не вижу там :(

Оффлайн ArcFi

  • Старожил
  • *
  • Сообщений: 15189
    • Просмотр профиля
    • aetera.net
Re: Руководство по работе с wget.
« Ответ #32 : 20 Апреля 2009, 23:19:34 »
psor,
Цитата: man wget
   Recursive Accept/Reject Options
       -A acclist --accept acclist
       -R rejlist --reject rejlist
           Specify comma-separated lists of file name suffixes or patterns to accept or reject. Note that if any of the wildcard characters,
           *, ?, [ or ], appear in an element of acclist or rejlist, it will be treated as a pattern, rather than a suffix.

Оффлайн dodther

  • Новичок
  • *
  • Сообщений: 44
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #33 : 21 Апреля 2009, 17:16:39 »
а вот не подскажите как скачать по ссылке типа
 http://files2.dsv.data.cod.ru/?WyIwYTJlY2RlYmRjY2RlMjFhNW чтобы файл сохранился именно с нормальным именем.
а то поставишь на ночь качаться 10-15 частей архива так потом фиг-же разберешься где какой :(
Ubuntu 10.04

Оффлайн ArcFi

  • Старожил
  • *
  • Сообщений: 15189
    • Просмотр профиля
    • aetera.net
Re: Руководство по работе с wget.
« Ответ #34 : 21 Апреля 2009, 17:24:08 »
а то поставишь на ночь качаться 10-15 частей архива так потом фиг-же разберешься где какой :(
Отсортируйте по дате, или используя лог закачки, или перенаправьте вывод wget в файл, или задайте имя выходного файла в простеньком скриптике.

Оффлайн dodther

  • Новичок
  • *
  • Сообщений: 44
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #35 : 22 Апреля 2009, 01:57:23 »
да я вот и задумался про задать имя в скрипте. но познаний нехватает :(
полез читать инфу по bash. ниосилил :(
мож подскажеш как сделать?
Ubuntu 10.04

Оффлайн ArcFi

  • Старожил
  • *
  • Сообщений: 15189
    • Просмотр профиля
    • aetera.net
Re: Руководство по работе с wget.
« Ответ #36 : 22 Апреля 2009, 02:13:13 »
dodther, надо более подробно обрисовать задачу.

Оффлайн dodther

  • Новичок
  • *
  • Сообщений: 44
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #37 : 22 Апреля 2009, 08:02:53 »
dodther, надо более подробно обрисовать задачу.

целиком моя задача выглядит так.

есть десоток ссылок вида http://files2.dsv.data.cod.ru/?WyIwYTJlY2RlYmRjY2RlMjFhNW

если я закину их в файл и скормлю wget
wget -i url.listто на выходе получу десяток файлов вида WyIwYTJlY2RlYmRjY2RlMjFhNW
вместо нормальных имен.

можно повозится и ручками исправить имена. но это гемор.

нужно чтобы на выходе были нормальные имена файлов.
Ubuntu 10.04

Оффлайн ArcFi

  • Старожил
  • *
  • Сообщений: 15189
    • Просмотр профиля
    • aetera.net
Re: Руководство по работе с wget.
« Ответ #38 : 22 Апреля 2009, 12:36:25 »
dodther, например, так:
cat url.list | while read; do wget $REPLY -O file_name_$((i++)).ext; done

Оффлайн dodther

  • Новичок
  • *
  • Сообщений: 44
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #39 : 22 Апреля 2009, 14:08:49 »
dodther, например, так:
cat url.list | while read; do wget $REPLY -O file_name_$((i++)).ext; done

спасиб. правда в этом коде почти ничего непонятно. буду разбираться :)

З.Ы
оказывается никакие скрипты ненужны, а достаточно указать опцию
--content-dispositionправда у этой опции стоит лайба   (ЭКСПЕРИМЕНТАЛЬНЫЙ).
но у мну норм сработала :)
« Последнее редактирование: 22 Апреля 2009, 15:38:56 от dodther »
Ubuntu 10.04

Оффлайн Polkan

  • Участник
  • *
  • Сообщений: 124
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #40 : 22 Апреля 2009, 16:05:26 »
Подскажите, а как поднять wget из фона? Просто я сижу на сервере по ssh и естественно не круглосуточно. После отключения wget уходит работать в фон, а вот как его оттуда поднять, чтобы посмотреть что он в данный момент делает, я не знаю. Подскажите знающие, как мне это сделать.
jobs показывает задачи, fg выводит из фона. Если в фоне несколько задач, то указывай jobID.

Оффлайн pol01

  • Новичок
  • *
  • Сообщений: 1
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #41 : 28 Мая 2009, 19:13:22 »
День добрый.
Подскажите, как с помощью wget решить следующую задачу.
Нужно полностью скачать учебник. Вот ссылка:http://mysopromat.ru/uchebnye_kursy/ustalost/.

Скачивал вот так:
wget -k -np -r -p  http://mysopromat.ru/uchebnye_kursy/ustalost/

Но все изображения находятся в каталоге: http://mysopromat.ru/images/, и они не скачиваются из-за опции -np.
Убираю -np - качается много лишнего.

Как правильно скачивать такие документы?

Оффлайн MusicMan

  • Любитель
  • *
  • Сообщений: 61
  • ubuntu 9.10
    • Просмотр профиля
    • Круглосуточная стоматологическая клиника доктора Бабенкова
Re: Руководство по работе с wget.
« Ответ #42 : 14 Июня 2009, 09:59:02 »
Приблизительно такая же проблема.
Нужно сохранить веб-страницы со ВСЕМИ изображениями, что там находятся.
Ввожу wget http://www.xyz.ru/ и скачивается только индексная страница в html-формате и ничего больше. А мне необходимо выкачать всё как есть. И при этом мне не нужно скачивать весь сайт, а считать данные из файла download.txt.

Приблизительно мне это видится, как
wget -i download.txt

если добавить -r, то качается слишком много ерунды и занимает слишком много времени.
А мне нужно конкретные урлы сохранить со всем его содержимым!
Как такого добиться, кто подскажет?

Оффлайн cyber-punk

  • Любитель
  • *
  • Сообщений: 65
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #43 : 20 Июня 2009, 13:12:21 »
cyber-punk, я решил эту проблему с помощью screen.
Вот, например, краткое руководство: http://rus-linux.net/kos.php?name=MyLDP/consol/screen.html

Согласен, screen приятная весчь, если работа идёт через ssh, но на самом деле для поднятия из фона нужно просто ввести fg wget, или fg $pid, если wget запускался с указанием pid=$!

Оффлайн strah4

  • Новичок
  • *
  • Сообщений: 19
    • Просмотр профиля
Re: Руководство по работе с wget.
« Ответ #44 : 30 Июля 2009, 11:13:51 »
Использую дома под убунтой для закачки сайтов снятых с делегирования, у которых хостинг не истек с синтаксисом wget --recursive -E - K --header='Host: WWW.ACCEPT.RU' 'http://89.108.89.51' все пашет на ура

Поставил на работе wget под винду не работает в лог выдает:
--2009-07-30 11:07:18--  http://www.accept.ru'/
Распознаётся www.accept.ru'... сбой: Host not found.
C:\Program Files\GnuWin32\bin\wget: невозможно распознать адрес `www.accept.ru''
'http://89.108.89.51': Неподдерживаемая схема.

 

Страница сгенерирована за 0.068 секунд. Запросов: 25.