jeudi 10 février 2011

Aspirer un site avec wget




Ce matin je voulais pouvoir accéder à la documentation GWT offline, mais Google ne propose pas cette option, alors j'ai essayé de récupérer le maximum d'informations avec wget.



Voici les options que j'ai choisi et pourquoi je les ai choisies:




$ wget -nc -k -q -r -p -L -R community.html http://code.google.com/webtoolkit/doc/latest/



-nc: no clobber: pour que chaque ressource ne soit téléchargée qu'une seule fois

-k : pour que les liens soient transformés en liens locaux de manière à faciliter la consultation locale

-q : pour que l'affichage sur la console ne prenne pas plus de temps que le téléchargement lui même!

-p : pour que toutes les ressources nécessaire à chaque page soit également téléchargées

-L: pour éviter de télécharger tout Internet

-R: je ne voulais pas community car j'avais peur de télécharger tout le forum!

-r : recursive... of course



Voilà, c'est une note de coin de table, n'hésitez pas à apporter des précisions si elle vous semble incomplète.


Aucun commentaire: