Ajax et accent

39 réponses

osele

16/04/2007 à 16:52

Bonjour,

J'ai beau avoir lu pas mal de page sur le sujet je ne comprends pas le
pb.

J'ai une page ou=C3=A8be qui s'affiche tr=C3=A8s bien en direct, avec des
accents, sous Firefox:

http://osele.free.fr/prg/accent.html

Dans, cette page, j'ai un script qui la charge en ajax et l'affiche =C3=A0
la suite.

Visiblement, la page est syst=C3=A9matiquement r=C3=A9cup=C3=A9r=C3=A9e en =
utf-8 !

Ca ne marche pas pour les accents, qui sont remplac=C3=A9s par des ?

Quel est le pb ?

(Je ne peux pas toucher la page source qui est sur un autre site.)

J'ai simplifi=C3=A9 le code et voici le source (j'ai essay=C3=A9 diff=C3=A9=
rents
RequestHeader) :
<html><head>
<meta http-equiv=3D"Content-Type" content=3D"text/html;
charset=3DISO-8859-1">
<meta http-equiv=3D"Content-Style-Type" content=3D"text/css">
<title>pas de titre</title>
<script language=3D"Javascript" type=3D"text/javascript">
function ajax(url) {
var xhr=3Dnull;
// d=C3=A9tection du navigateur pour la cr=C3=A9ation de l'objet XMLHttpRe=
quest
(soit l'acronyme xhr)
if (window.XMLHttpRequest) {
xhr =3D new XMLHttpRequest();
}
else if (window.ActiveXObject) {
xhr =3D new ActiveXObject("Microsoft.XMLHTTP");
}
xhr.open( "GET", url,false);
// xhr.setRequestHeader("Content-Type", "application/x-www-form-
urlencoded;");
// xhr.setRequestHeader("Content-Type", "application/x-www-form-
urlencoded;charset=3DISO-8859-1");
// xhr.setRequestHeader("Content-Type", "text/html");
xhr.setRequestHeader("Content-Type", "text/html;
charset=3DISO-8859-1;");
// xhr.setRequestHeader("Accept-Charset", "ISO-8859-1;q=3D0.7");
// xhr.setRequestHeader("Accept-Language", "fr;q=3D0.8");
// xhr.setRequestHeader("Content-Type", "text/html; charset=3Dutf-8");
// xhr.setRequestHeader("Content-Type", "text/
html;","charset=3DISO-8859-1;");
xhr.send(null);
var tmpdiv =3D document.createElement('div');
tmpdiv.innerHTML =3D xhr.responseText;
document.body.appendChild(tmpdiv);
}
</script>
</head>
<body>
=C3=A9<p/>
=E2=82=AC<p/>
<a href=3D'javascript:void(0);' onclick=3D'ajax(location.href);'>cliquez
ici</a>
</body>

a+
Vincent

10 réponses

1 2 3 4

Patrick Mevzek

20/04/2007 à 04:05

- Safari importe en iso-Latin
(là je pense que c'est son réglage par défaut)

L'ISO-8859-1 est la valeur par défaut en HTTP/HTML.

--
Patrick Mevzek . . . . . . . . . . . . . . Dot and Co
<http://www.dotandco.net/> <http://www.dotandco.com/>
Dépêches sur le nommage <news://news.dotandco.net/dotandco.info.news>

Olivier Miakinen

20/04/2007 à 09:25

Alors pourquoi, lorsqu'il n'y a pas de charset
- Fx importe en je ne sais quoi

Je parierais qu'il importe en UTF-8 qui, si je ne m'abuse, est la valeur
par défaut pour XML. Cela expliquerait que j'obtienne des points
d'interrogation pour chaque octet 8 bits reçu ne faisant pas partie d'un
codage UTF-8 valide.

Essaye de mettre « Ã© » dans ton fichier, tu verras bien si ça se
transforme en « é ».

- Safari importe en iso-Latin
(là je pense que c'est son réglage par défaut)

Cf. réponse de Patrick Mevzek.

Pierre Goiffon

20/04/2007 à 10:59

Patrick Mevzek wrote:

- Safari importe en iso-Latin
(là je pense que c'est son réglage par défaut)

L'ISO-8859-1 est la valeur par défaut en HTTP/HTML.

Je ne suis pas sûr qu'en pratique cela ait dépassé la RFC et les peut
être 2 tous premiers clients : depuis que j'utilise un navigateur j'ai
toujours vu un charset par défaut paramétrable.

Pierre Goiffon

20/04/2007 à 11:02

ASM wrote:

Suite à ta réponse Stéphane, j'ai repris ton exemple ici :
http://pgoiffon.free.fr/_temp/XHR_charset.html

et dans mon exemple as-tu vu s'il y avait un charset qque part ?
(je crois que non)

Non, ta page (pour mémoire :
<http://stephane.moriaux.perso.wanadoo.fr/truc/accent_non_charset.html>
) ne contenait aucune information de codage (ni en entête HTTP, ni en meta)
Mon Firefox la lit comme du Windows-1252...

Alors pourquoi, lorsqu'il n'y a pas de charset
- Fx importe en je ne sais quoi
- Safari importe en iso-Latin
(là je pense que c'est son réglage par défaut)

Les hypothèses conjointes de Olivier et Patrick (en HTTP codage par
défaut dans la RFC ISO Latin-1, et en XML c'est UTF-8) me semblent assez
bonnes pour expliquer cette différence d'implémentation.

De toute façon dans tous les cas, il faut _toujours_ indiquer le codage
utilisé.

Pierre Goiffon

20/04/2007 à 11:06

Olivier Miakinen wrote:

(...)
Après comment convertir du utf-8 en iso-8859 en javascript ?
Par un iframe correctement codé ?
Si la page principale est servie en UTF-8 et la page appelée par XHR en

ISO Latin-1... Je suppose qu'il n'y aura pas besoin de conversion, les
chaines JS étant stockées de la même manière.

Euh... avec un entête correct, je suis d'accord, mais ce n'est pas
propre à UTF-8 et ISO Latin-1.

Oui, tout à fait.

En revanche, si les octets ne sont pas traduits en UTF-16 ou équivalent,
alors l'encodage UTF-8 n'est identique à l'encodage ISO Latin-1 que pour
la partie basse (ASCII), même si les numéros Unicode et Latin-1 sont,
eux, identiques.

Plus précisément pour les 127 premiers caractères, ceux qui sont
contenus dans us-ascii. L'exemple repris de ASM utilise é et ç, soit
respectivement U+00E9 et U+00E7, soit respectivement les caractères 233
et 231 en ISO Latin-1 : ces caractères sont en-dehors d'us-ascii et ne
sont pas codés de la même manière en ISO Latin-1 et en UTF-8 (encore une
fois l'outil d'Olivier est parfait pour ce genre de choses :
http://www.miakinen.net/vrac/charsets/)

Jean-Marc Desperrier

20/04/2007 à 11:07

Patrick Mevzek wrote:

- Safari importe en iso-Latin
(là je pense que c'est son réglage par défaut)

L'ISO-8859-1 est la valeur par défaut en HTTP/HTML.

Non, c'est la valeur par défaut en HTTP à condition que le format
transporté n'ait pas une autre norme (ce qui est le cas de xml, norme
UTF-8).

Corrigé par les évolutions suivantes de RFC qui disent "surtout si vous
ne savez pas, ne supposez rien" (ce qui n'est pas très applicable en
pratique il faut bien choisir quelquechose).

Olivier Miakinen

20/04/2007 à 11:52

En revanche, si les octets ne sont pas traduits en UTF-16 ou équivalent,
alors l'encodage UTF-8 n'est identique à l'encodage ISO Latin-1 que pour
la partie basse (ASCII), même si les numéros Unicode et Latin-1 sont,
eux, identiques.

Plus précisément pour les 127 premiers caractères, ceux qui sont
contenus dans us-ascii. L'exemple repris de ASM utilise é et ç, soit
respectivement U+00E9 et U+00E7, soit respectivement les caractères 233
et 231 en ISO Latin-1 : ces caractères sont en-dehors d'us-ascii et ne
sont pas codés de la même manière en ISO Latin-1 et en UTF-8 (encore une
fois l'outil d'Olivier est parfait pour ce genre de choses :
http://www.miakinen.net/vrac/charsets/)

Puisque tu en parles, j'en profite pour signaler que j'ai amélioré ma
page. Par exemple on peut afficher les tables verticalement, et surtout
on peut référencer directement un caractère donné d'une table donnée
(même si l'utilisateur n'a pas JavaScript, car c'est alors PHP qui
pré-remplit les tableaux de droite).

Exemple pour le ç d'ISO Latin-1, en orientation verticale :
http://www.miakinen.net/vrac/charsets/?hv=v&or=2&pr#1

Par ailleurs, j'ai corrigé mon code JavaScript qui déclenchait un bug
dans Internet Explorer, le faisant passer de plus en plus de temps à
chaque appel.

Pierre Goiffon

20/04/2007 à 12:18

Olivier Miakinen wrote:

http://www.miakinen.net/vrac/charsets/

Puisque tu en parles, j'en profite pour signaler que j'ai amélioré ma
page. Par exemple on peut afficher les tables verticalement, et surtout
on peut référencer directement un caractère donné d'une table donnée
(même si l'utilisateur n'a pas JavaScript, car c'est alors PHP qui
pré-remplit les tableaux de droite).

Excellente idée ! Ca va être très pratique pour les différents post
usenet |-)

Euh par contre de ce je comprend de ton exemple, la position de
référence est en décimal... ce n'est pas très pratique ! En fait en
lisant le début de ton mail j'ai ouvert ta page et essayé d'afficher le
caractère de Windows-1252. J'ai donc entré 80 dans position de
référence... mais c'est la valeur hexa ! Vu que tout est exprimé en hexa
dans cette page, la position de référence ne pourrait elle pas être elle
aussi en hexa ?

Olivier Miakinen

20/04/2007 à 12:32

http://www.miakinen.net/vrac/charsets/

Euh par contre de ce je comprend de ton exemple, la position de
référence est en décimal... ce n'est pas très pratique ! En fait en
lisant le début de ton mail j'ai ouvert ta page et essayé d'afficher le
caractère ¤ de Windows-1252. J'ai donc entré 80 dans position de
référence... mais c'est la valeur hexa ! Vu que tout est exprimé en hexa
dans cette page, la position de référence ne pourrait elle pas être elle
aussi en hexa ?

C'est une excellente suggestion. En fait j'envisage de faire encore plus
simple (mais qui ne fonctionnera qu'avec JavaScript), c'est que les deux
champs de saisie se pré-remplissent quand on clique sur un caractère
donné d'une table donnée. Je ferai peut-être les deux.

(Et note que c'est maintenant MacRoman qui est la table par défaut pour
le 6e onglet, ainsi que je l'explique dans ma doc remaniée).

Olivier Miakinen

20/04/2007 à 12:37

C'est une excellente suggestion. En fait j'envisage de faire encore plus
simple (mais qui ne fonctionnera qu'avec JavaScript), [...]

Oh, j'ai une idée encore meilleure ! Mais chut, j'en parlerai plus
tard... ;-)

1 2 3 4

Ajax et accent

10 réponses

Veuillez sélectionner un problème