wget et décompression gzip

Le
fabrice régnier
salut la liste ;)

J'ai un serveur ouaib qui génère des pages avec php. Pour compresser ces
pages, j'utilise l'instruction ob_start("ob_gzhandler") en début de
chaque page qui fait la compression automatique des tampons si le
navigateur supporte les pages compressées. (Je n'utilise donc pas le
module apache mod_gzip ou deflate).

Coté client, j'ai wget 1.11.4, qui récupère ces pages avec quelque chose
du genre:

wget -S --header='Accept-Encoding: gzip,deflate' mon_url

Le résultat de wget est bien sous format gzip.

Mais, le hic, c'est lorsque je veux utiliser firefox pour ouvrir cette
page téléchargée et gzipée, je vois le format "binaire" de gzip. Firefox
ne fait pas de décompression à la volée.

Ma question est: faut-il que je décompresse à la main tous les fichiers
qui ont été téléchargés avec wget avant de les ouvrir avec firefox ?
Ou est-ce que wget est capable de décompresser tout seul la page ?
Ou est-ce que ff en est capable lui ?

merki et a+

f.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers debian-user-french-REQUEST@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmaster@lists.debian.org
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Julien
Le #19365811
Le mardi 19 mai 2009 à 09:49 +0200, fabrice régnier a écrit :

wget -S --header='Accept-Encoding: gzip,deflate' mon_url

Le résultat de wget est bien sous format gzip.



wget ne gère pas lui-même la décompression, il télécharge le fichier
comme il arrive... il faut le décompresser avec la commande gunzip :

wget http://foo.com/bob/pipe/xday && gunzip -f xday

ou

wget -O - -S --header='Accept-Encoding: gzip,deflate' mon_url | gunzip >
fichier-decompresser.html


Julien

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Fanfan
Le #19365801
--x+6KMIRAuhnl3hBn
Content-Type: text/plain; charset=iso-8859-1
Content-Disposition: inline
Content-Transfer-Encoding: quoted-printable

Le Tuesday 19 May 2009 à 09:49:49 (+0200), fabrice régnier a écrit :
Coté client, j'ai wget 1.11.4, qui récupère ces pages avec quelque chose
du genre:
wget -S --header='Accept-Encoding: gzip,deflate' mon_url



Salut Fabrice,

Il y a peut-être plus propre, mais tu peux essayer d'ajouter "-O -" aux
options de wget et de chainer le résultat dans gzip :
wget -S --header='Accept-Encoding: gzip,deflate' -O - mon_url | gunzip - > mon_fichier.html

Sinon, tu peux aussi décompresser tous les fichiers de ton répertoire
avec la commande :
for i in *.gz; do gunzip "$i"; done

Fanfan
--
La santé, c'est ce qui sert à ne pas mourir chaque fois qu'on est
gravement malade.
[ Georges Perros ]

--x+6KMIRAuhnl3hBn
Content-Type: application/pgp-signature; name="signature.asc"
Content-Description: Digital signature
Content-Disposition: inline

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.9 (GNU/Linux)

iD8DBQFKEnL+n0FdfiSfsswRAjJqAKCznKholc60Sm0+yKGlTYl2z2mTBACfSrsb
xrtI4366z7uRt3vJLpXuhaU =9SXb
-----END PGP SIGNATURE-----

--x+6KMIRAuhnl3hBn--

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
fabrice régnier
Le #19373091
yop,

Comme indiqué ci-dessus (merci à Fanfan et Julien), je télécharge toutes
mes pages gzipée avec wget. Ensuite, j'utilise gunzip pour leur rendre
leur clarté originelle. (oui, gunzip lave plus blanc;) )

Sinon, j'attends avec impatience des nouvelles de la mailing list de
wget. A mon avis, puisque wget est un client web, alors il devrait
prendre en charge tout seul les pages avec un header Content-Encoding à
gzip ou deflate. Ou alors fournir un moyen de post-traitement qui
pourrait finir le boulot.

a+

f.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Publicité
Poster une réponse
Anonyme