Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

charset et meta ?

7 réponses
Avatar
unbewusst.sein
la page :
<http://www.macruby.org/files/nightlies/>
indique :
<meta http-equiv="Content-Type" content="text/html; charset=utf-8"/>

MAIS, quand je la télécharge avec ruby celui-ci me dit que l'encodage
est "ISO-8859-1".

c'est kika raison ?
et comment le savoir ?

en tk avec ruby je transcode vers utf-8 et ça ne râle pas...


--
« Les conneries c'est comme les impôts,
on finit toujours par les payer. »
(Michel Audiard)

7 réponses

Avatar
Andreas Prilop
On Wed, 12 May 2010, Une Bévue wrote:

<http://www.macruby.org/files/nightlies/>
indique :
<meta http-equiv="Content-Type" content="text/html; charset=utf-8"/>



$ lynx -head -dump http://www.macruby.org/files/nightlies/

--> Content-Type: text/html;charset=ISO-8859-1

--
¹ superscript 1 ¼ fraction 1/4 Ð D stroke ð d stroke
² superscript 2 ½ fraction 1/2 Þ Thorn þ thorn
³ superscript 3 ¾ fraction 3/4 Ý Y acute ý y acute
× multiply sign ¦ broken bar
Avatar
unbewusst.sein
Andreas Prilop wrote:

$ lynx -head -dump http://www.macruby.org/files/nightlies/



tiens, j'avais oublié lynx...

--> Content-Type: text/html;charset=ISO-8859-1



bon, ça confirme, de toute façon, amha, la page ne contient pas de
caractères accentués.

avec lynx j'ai ça :
zsh-% /opt/local/bin/lynx -head -dump
http://www.macruby.org/files/nightlies/
HTTP/1.1 200 OK
Date: Wed, 12 May 2010 17:06:14 GMT
Server: Apache/2.2.15 (Unix) mod_ssl/2.2.15 OpenSSL/0.9.8n DAV/2
mod_python/3.3.
1 Python/2.6.5
Vary: Accept-Encoding
Connection: close
Content-Type: text/html;charset=ISO-8859-1


qu'est-ce que ça veut dire "Vary: Accept-Encoding" ?

curieux tout de même un serveur avec Python pour servir des pkgs Ruby...
--
« Les conneries c'est comme les impôts,
on finit toujours par les payer. »
(Michel Audiard)
Avatar
SAM
Le 5/12/10 6:44 PM, Une Bévue a écrit :
la page :
<http://www.macruby.org/files/nightlies/>
indique :
<meta http-equiv="Content-Type" content="text/html; charset=utf-8"/>

MAIS, quand je la télécharge avec ruby celui-ci me dit que l'encodage
est "ISO-8859-1".

c'est kika raison ?



celui qui a raison est le serveur qui a envoyé l'en-tête
(le meta n'est qu'une béquille à défaut d'indication par le serveur)

L'iso-truc ne devrait pas poser trop de pb,
s'il n'y a pas dans la page des machins hors de sa compétence.
Mais ... vaudrait mieux que l'encodage de la page soit le même que celui
indiqué par le serveur.

et comment le savoir ?



extension Web Developer dans Firefox ?
Pour savoir quel en-tête a été envoyé par le serveur.

BBEdit ou TextWrangler (peut-être même TextEdit)
pour savoir en quel encodage a été *écrit* le fichier
(si toutefois, à l'enregistrement, le navigateur ne l'a pas modifié)
car ça peut être écrit en Windows,
avoir un meta en utf-8,
et être servi en ISO-truc
... bonjour le résultat !

en tk avec ruby je transcode vers utf-8 et ça ne râle pas...



transcoder == traduire, convertir ?

oui, why not.

--
sm
Avatar
unbewusst.sein
SAM wrote:

celui qui a raison est le serveur qui a envoyé l'en-tête
(le meta n'est qu'une béquille à défaut d'indication par le serveur)



ouais...

L'iso-truc ne devrait pas poser trop de pb,



non je n'ai pas vu de caractères accentués, et d'ailleurs je ne
m'intéresse qu'au nom de la dernière release de MacRuby pour la
télécharger (sa date y est incluse).

> et comment le savoir ?

extension Web Developer dans Firefox ?
Pour savoir quel en-tête a été envoyé par le serveur.



merci, je ne savais pas qu'on pouvait trouver ça là...

BBEdit ou TextWrangler (peut-être même TextEdit)
pour savoir en quel encodage a été *écrit* le fichier
(si toutefois, à l'enregistrement, le navigateur ne l'a pas modifié)
car ça peut être écrit en Windows,
avoir un meta en utf-8,
et être servi en ISO-truc
... bonjour le résultat !



je n'enregistre pas le fichier, je regarde juste si il y a une nightly +
récente que ce que j'ai sur mon disque.

> en tk avec ruby je transcode vers utf-8 et ça ne râle pas...

transcoder == traduire, convertir ?



convertir de ISO-... en UTF-8 les regex de Ruby ne marche pas si on n'a
pas le "bon" encodage mon script, lui, est écrit en utf-8 donc je dois
convertir les ISO-... dans cet encodage d'où la nécessité de savoir
lequel est le vrai. C'est pas celui écrit dans la nalise meta.

d'ailleurs, dans cette page ya même pas de </body></html>, c'est du
"xhtml1-transitional.dtd"...
--
« Les conneries c'est comme les impôts,
on finit toujours par les payer. »
(Michel Audiard)
Avatar
Andreas Prilop
On Wed, 12 May 2010, Une Bévue wrote:

qu'est-ce que ça veut dire "Vary: Accept-Encoding" ?



Voir http://web-sniffer.net/ "Accept-Encoding: gzip"

--
¹ superscript 1 ¼ fraction 1/4 Ð D stroke ð d stroke
² superscript 2 ½ fraction 1/2 Þ Thorn þ thorn
³ superscript 3 ¾ fraction 3/4 Ý Y acute ý y acute
× multiply sign ¦ broken bar
Avatar
unbewusst.sein
Andreas Prilop wrote:

Voir http://web-sniffer.net/ "Accept-Encoding: gzip"



ok, merci !
--
« Quand tu lances la flèche de la vérité,
trempe la pointe dans du miel. »
(Proverbe arabe)
Avatar
Pierre Goiffon
On 12/05/2010 19:35, SAM wrote:
et comment le savoir ?



extension Web Developer dans Firefox ?
Pour savoir quel en-tête a été envoyé par le serveur.



Ou Live HTTP Headers (qui ajoute un onglet dans la boite page info)