Ein Projekt von Meg Palffy

Dateien und Informationen aus dem Internet herunterladen

Parameter statt grafischer Optionen

Gelegentlich möchtest Du vielleicht nicht nur einzelne HTML-Dateien mit Informationen aus dem Internet auf Deiner Festplatte speichern, sondern gleich ganze Websites oder Teile davon zum Offline-Lesen herunterladen. Für Windows-Betriebssysteme gibt es diverse kleine Download-Tools, die Dir das Herunterladen erleichtern und verschiedene Einstellungsmöglichkeiten erlauben.

Linux hat für sowas den Befehl wget, mit dem Du ebenfalls ganze Websites oder Teile davon herunterladen kannst. Was Du unter Windows mit grafischen Optionsfenstern einstellen würdest, machst Du bei wget in der Linux-Shell ausschließlich mit Parametern. Von den richtigen Parametern hängt alles ab: Sie entscheiden darüber, ob Du auch wirklich das herunterlädst, was Du haben wolltest.

Dateien herunterladen

Nützliche Parameter, die Dir dabei helfen, Dateien gezielt von einer URL herunterzuladen:

-r rekursiv: verlinkte Seiten ebenfalls herunterladen (von der Startseite aus)
-l level: max. bis zur angegebenen Linktiefe herunterladen
-k convert links: Links auf alle heruntergeladenen Seiten anpassen für lokales Browsen, Links auf nicht heruntergeladene Seiten auf die Ursprungs-URL setzen (=> keine toten Links)
-p page requisites: alle zu einer Seite gehörenden Dateien mit herunterladen (Bilder, Sounds, etc.), falls nötig, auch einen Schritt über die mit -l angegebene Linktiefe hinaus
-np no parent: beim rekursiven Download sinnvoll: nur Dateien herunterladen, die in der Verzeichnishierarchie unter dem Startverzeichnis liegen, nicht in übergeordneten Verzeichnissen

einzelne html-Datei herunterladen

    meg@rutabaga:~> wget http://www.server.org/datei.html

einzelne Seite herunterladen, aber mit allen dazugehörigen Dateien (Bilder, Sounds, etc.)

    meg@rutabaga:~> wget -p http://www.server.org/datei.html

alle verlinkten Dateien bis zu einer Linktiefe von 3 herunterladen, mit allen Dateien, die notwendig sind, um die Seiten korrekt anzuzeigen (Bilder, Sounds, etc.)

    meg@rutabaga:~> wget -rpl 3 http://www.server.org/datei.html

wie oben, zusätzlich Links für lokales Browsen anpassen

    meg@rutabaga:~> wget -rkpl 3 http://www.server.org/datei.html

verlinkte Dateien rekursiv herunterladen, aber nur solche Dateien, die unterhalb des aktuellen Verzeichnisses liegen

    meg@rutabaga:~> wget -r -np http://www.server.org/verzeichnis/datei.html