Категория:
GNU Wget - это открыто распространяемая утилита для загрузки файлов из интернета. Она поддерживает протоколы HTTP, HTTPS, и FTP, загрузку с серверов прокси по протоколу HTTP.
Благодаря рекурсивной загрузке Wget может создавать локальные копии удаленных сайтов.
Проверка заголовков файлов по протоколам HTTP и FTP дает возможность обновлять ранее загруженные файлы, а также при использовании Wget можно реализовывать зеркальное хранение сайтов или набора файлов на FTP.
Если сервер, с которого загружается файл, поддерживает докачку файла, то в случае обрыва Wget продолжит загружать файл именно с того места, где оборвалась загрузка.
Для простой загрузки файла наберем в терминале
wget http://mirror.suse.ru/distribution/11.2/iso/openSUSE-11.2-DVD-i586.iso
Эта же команда с параметром "-c" или "-continue" продолжит оборванную загрузку.
wget -c http://mirror.suse.ru/distribution/11.2/iso/openSUSE-11.2-DVD-i586.iso
По умолчанию файл будет сохранен в домашней директории пользователя, но если wget запустили из другой директории, то в ней и сохранится файл.
Для загрузки из файла, содержащего ссылки либо html-страницы нужно использовать параметр "-i"
wget -i mirrorlist
Для создания локальной копии сайта используется параметр "-m"
wget -m http://www.open-suse.ru
Кроме этого ключ "-r" означает рекурсивную загрузку, "-к" конвертирует ссылки в автономные для удобства просмотра, а "-np" не выпустит Wget выше начального адреса.
Другие полезные ключи:
Включение и исключение файлов при загрузке
-A acclist | -accept acclist
-R rejlist | -reject rejlist
Задаёт разделяемые запятыми шаблоны имён файлов, которые следует загружать (acclist) или игнорировать (rejlist).
-k | -convert-links
Превращает абсолютные ссылки (типа http://www...) в относительные (типа file///home/vasya/www/index.html) для удобства локального просмотра. Чтобы локально в броузере просмотреть скачанный сайт, открываете файл index.html в броузере и бродите по ссылкам точно так же, как если бы вы были подключены к Интернету.
-p --page-requisites
Загружать все файлы, которые нужны для отображения страниц HTML. Например: рисунки, звук и каскадные стили. После завершения загрузки конвертировать ссылки в документе для просмотра в автономном режиме. Это касается не только видимых ссылок на другие документы, а ссылок на все внешние локальные файлы.
Ограничение канала загрузки –limit-rate=значение в кб. Например:
wget --limit-rate=50k http://www....
Это приведет к тому, что скорость загрузки не будет превышать указанных в примере пятидесяти килобайт/сек.
Подробный русский man Wget можно найти в интерактивной системе просмотра системных руководств (man-ов).
PS: Статья перенесена из WIKI со старого форума, под авторством Kot-potaskun 28/03/2010