Gelegentlich möchtest Du vielleicht nicht nur einzelne HTML-Dateien mit Informationen aus dem Internet auf Deiner Festplatte speichern, sondern gleich ganze Websites oder Teile davon zum Offline-Lesen herunterladen. Für Windows-Betriebssysteme gibt es diverse kleine Download-Tools, die Dir das Herunterladen erleichtern und verschiedene Einstellungsmöglichkeiten erlauben.
Linux hat für sowas den Befehl wget, mit dem Du ebenfalls ganze Websites oder Teile davon herunterladen kannst. Was Du unter Windows mit grafischen Optionsfenstern einstellen würdest, machst Du bei wget in der Linux-Shell ausschließlich mit Parametern. Von den richtigen Parametern hängt alles ab: Sie entscheiden darüber, ob Du auch wirklich das herunterlädst, was Du haben wolltest.
Nützliche Parameter, die Dir dabei helfen, Dateien gezielt von einer URL herunterzuladen:
-r |
rekursiv: verlinkte Seiten ebenfalls herunterladen (von der Startseite aus) |
-l |
level: max. bis zur angegebenen Linktiefe herunterladen |
-k |
convert links: Links auf alle heruntergeladenen Seiten anpassen für lokales Browsen, Links auf nicht heruntergeladene Seiten auf die Ursprungs-URL setzen (=> keine toten Links) |
-p |
page requisites: alle zu einer Seite gehörenden Dateien mit herunterladen (Bilder, Sounds, etc.), falls nötig, auch einen Schritt über die mit -l angegebene Linktiefe hinaus |
-np |
no parent: beim rekursiven Download sinnvoll: nur Dateien herunterladen, die in der Verzeichnishierarchie unter dem Startverzeichnis liegen, nicht in übergeordneten Verzeichnissen |
einzelne html-Datei herunterladen
meg@rutabaga:~> wget http://www.server.org/datei.html
einzelne Seite herunterladen, aber mit allen dazugehörigen Dateien (Bilder, Sounds, etc.)
meg@rutabaga:~> wget -p http://www.server.org/datei.html
alle verlinkten Dateien bis zu einer Linktiefe von 3 herunterladen, mit allen Dateien, die notwendig sind, um die Seiten korrekt anzuzeigen (Bilder, Sounds, etc.)
meg@rutabaga:~> wget -rpl 3 http://www.server.org/datei.html
wie oben, zusätzlich Links für lokales Browsen anpassen
meg@rutabaga:~> wget -rkpl 3 http://www.server.org/datei.html
verlinkte Dateien rekursiv herunterladen, aber nur solche Dateien, die unterhalb des aktuellen Verzeichnisses liegen
meg@rutabaga:~> wget -r -np http://www.server.org/verzeichnis/datei.html
Text und Design © 2002 Meg Palffy & Tux J. Palffy | gebaut nach Webstandards