OVH Cloud OVH Cloud

Mystères du codage...

7 réponses
Avatar
dominique
Bonjour,
Fx 1.5, Linux.
Je ne connais rien au html mais tout de même...
Je charge cette page :
http://www.french.xinhuanet.com/french/2005-12/10/content_192700.htm
Problème d'accents !
Bien, j'affiche le source et j'y trouve :
content="text/html; charset=iso-8859-1" />
J'en déduis que c'est de l'ISO-8859-1.
Finement observé, isn't ?
Je vais modifier l'affichage de mon navigateur. Il est dans ce codage...
Je tente l'UTF-8 et tout rentre dans l'ordre.
Je regarde les informations sur la page, elle dite encodée en UTF-8
mais, dans la fenêtre du bas, j'apprends que :
text/html; charset=iso-8859-1

C'est moi qui bat la campagne ou il y a quelque chose que je ne
comprends pas...
[HS]
Pour le fond de cette page, no comments. Il n'y a pas qu'en France où
des politiciens, enfin un en particulier, jouent avec le feu...

Bon dimanche,
Dominique

7 réponses

Avatar
Xavier Robin
dominique a écrit :
Bonjour,
Fx 1.5, Linux.
Je ne connais rien au html mais tout de même...
Je charge cette page :
http://www.french.xinhuanet.com/french/2005-12/10/content_192700.htm
Problème d'accents !
Bien, j'affiche le source et j'y trouve :
content="text/html; charset=iso-8859-1" />
J'en déduis que c'est de l'ISO-8859-1.
Finement observé, isn't ?
Je vais modifier l'affichage de mon navigateur. Il est dans ce codage...
Je tente l'UTF-8 et tout rentre dans l'ordre.
Je regarde les informations sur la page, elle dite encodée en UTF-8
mais, dans la fenêtre du bas, j'apprends que :
text/html; charset=iso-8859-1

C'est moi qui bat la campagne ou il y a quelque chose que je ne
comprends pas...



C'est un wembaster qui n'a rien compris, et qui n'a surtout jamais lu ça
: http://french.joelonsoftware.com/Articles/Unicode.html

Il déclare que son site est en iso-8859-1 (meta et entêtes HTTP), et
c'est ce que tu vois et que Firefox croit naivement.

Sauf qu'en fait dans la réalité le site est encodé en UTF-8. Donc
évidemment ça ne va pas.

Reste à comprendre comment on peut faire une telle erreur. L'explication
est peut-être à chercher du côté d'IE ?

--
Xavier
Avatar
Damien Hardy
dominique a écrit :
Bonjour,
Fx 1.5, Linux.
Je ne connais rien au html mais tout de même...
Je charge cette page :
http://www.french.xinhuanet.com/french/2005-12/10/content_192700.htm
Problème d'accents !
Bien, j'affiche le source et j'y trouve :
content="text/html; charset=iso-8859-1" />
J'en déduis que c'est de l'ISO-8859-1.
Finement observé, isn't ?
Je vais modifier l'affichage de mon navigateur. Il est dans ce codage...
Je tente l'UTF-8 et tout rentre dans l'ordre.
Je regarde les informations sur la page, elle dite encodée en UTF-8
mais, dans la fenêtre du bas, j'apprends que :
text/html; charset=iso-8859-1

C'est moi qui bat la campagne ou il y a quelque chose que je ne
comprends pas...
[HS]
Pour le fond de cette page, no comments. Il n'y a pas qu'en France où
des politiciens, enfin un en particulier, jouent avec le feu...

Bon dimanche,
Dominique



Bonjour,
en fait c'est le webmaster de cette page qui fait des betises, il précise que la page est en iso-8859-1 (dans la balise meta) alors que visiblement
elle est enregistrée en utf-8 (le fait de cahnger le nom du charset dans la balise ne change pas la maniere dont est enregistrée le fichier), le
navigateur ne fait que ce qu'on lui dit, on lui dit iso-8859-1 il l'affiche ... et il y a des caractere cabalistiques ... ensuite il affiche les
propriétés qu'il connait du document on lui dit que c'est de l'iso-8859-1 il va te dire la même chose
tu peux envoyer un mail au webmaster qu'il corrige sa bévue ...

Dam
Avatar
Sergio
Le 11/12/2005, Xavier Robin a supposé :

http://www.french.xinhuanet.com/french/2005-12/10/content_192700.htm





(idem l'accueil http://www.french.xinhuanet.com/french/ )

C'est un wembaster qui n'a rien compris, et qui n'a surtout jamais lu ça
: http://french.joelonsoftware.com/Articles/Unicode.html



+1

Il déclare que son site est en iso-8859-1 (meta et entêtes HTTP), et c'est ce
que tu vois et que Firefox croit naivement.



Sauf qu'en fait dans la réalité le site est encodé en UTF-8. Donc évidemment
ça ne va pas.



Reste à comprendre comment on peut faire une telle erreur. L'explication est
peut-être à chercher du côté d'IE ?



Effectivement IE affiche "correctement". On se demande pourquoi...
Opera fait comme FF. Erreur d'autant plus impardonable que c'est un
site chinois, qui devrait être au courant des problèmes de codage !

Rapport envoyé via "rapporter un site non fonctionnel".


--
Serge http://leserged.online.fr/
Mon blog: http://cahierdesergio.free.fr/
Soutenez le libre: http://www.framasoft.org
Avatar
Francois Constantineau
dominique wrote in
news:439c26c2$0$21258$:

Je charge cette page :
http://www.french.xinhuanet.com/french/2005-12/10/content_192700.htm
Problème d'accents !



Si tu regardes au début du code source, il y a un Byte Order Mark.

<q cite="http://www.unicode.org/versions/Unicode4.0.0/ch15.pdf">

In UTF-8, the BOM corresponds to the byte sequence <EF16 BB16 BF16>.
Although there are never any questions of byte order with UTF-8 text,
this sequence can serve as signature for UTF-8 encoded text where the
character set is unmarked. As with a BOM in UTF-16, this sequence of
bytes will be extremely rare at the beginning of text files in other
character encodings. For example, in systems that employ Microsoft
Windows ANSI Code Page 1252, <EF16 BB16 BF16> corresponds to the
sequence <i diaeresis, guillemet, inverted question mark> ï » ¿.

</q>


François
Avatar
Florian Sinatra
Sergio a écrit :
Reste à comprendre comment on peut faire une telle erreur. L'explication est
peut-être à chercher du côté d'IE ?




Effectivement IE affiche "correctement". On se demande pourquoi...
Opera fait comme FF. Erreur d'autant plus impardonable que c'est un
site chinois, qui devrait être au courant des problèmes de codage !

Rapport envoyé via "rapporter un site non fonctionnel".



Eh ben, j'ai enfin compris, moi qui pensais que ces sites étaient
destinés à des martiens, en fait non ce ne sont que les utilisateurs
d'IE (quoique c'est un pléonasme) :-)
Avatar
Pierre Goiffon
dominique wrote:
http://www.french.xinhuanet.com/french/2005-12/10/content_192700.htm
Problème d'accents !



Comme plusieurs personnes l'ont répondu, la page est déclarée être en
iso latin-1, ce en balise meta comme dans les entêtes HTTP. La méthode
d'autodétection de Mozilla n'y trouve rien à redire d'ailleurs - normal,
le codage étant correctement déclaré aux 2 endroits.

Je vous encourage vivement à signaler son erreur au responsable du site
! Par ailleurs, petit truc : vous voyez que des caractères accentués
sont remplacés par 2 caractères qui n'ont pas de rapport : c'est souvent
le signe que vous visualisez de l'UTF-8
Avatar
dominique
Pierre Goiffon a écrit :

Je vous encourage vivement à signaler son erreur au responsable du site


C'est fait.

! Par ailleurs, petit truc : vous voyez que des caractères accentués
sont remplacés par 2 caractères qui n'ont pas de rapport : c'est souvent
le signe que vous visualisez de l'UTF-8



Effectivement. C'est pourquoi j'ai testé ce codage.
bonne journée,
Dominique