OVH Cloud OVH Cloud

e dans l'o

4 réponses
Avatar
gloops
Bonjour tout le monde,

Je reçois régulièrement par liste de distribution des messages devant
contenir le caractère "e dans l'o" (oelig ?), et il est codé A6
hexadécimal (= 166 décimal).

Ce caractère apparaît sous la forme de la barre verticale en deux
morceaux comme on utilisait sous DOS pour un filtre (sur le clavier :
AltGr 6), et si je regarde la table ISO-8859-1, annoncée comme codage
pour ce mail, je vois que c'est normal.

Le même document, publié sur le web, code ce caractère 9C hexadécimal (=
156 décimal), ce qui donne bien e dans l'o, et Internet Explorer
l'affiche correctement.

Quelqu'un connaît-il un codage qui accepte le caractère 166 décimal pour
e dans l'o ?

Quelqu'un a-t-il déjà rencontré ce problème et eu des éléments
d'explication sur ce qui a pu se produire, comme un mauvais paramétrage
d'un outil ?

Un extrait des champs du dernier message :

Mime-Version: 1.0

Content-Type: text/plain; charset="iso-8859-1"

Content-Transfer-Encoding: 8bit

X-MIME-Autoconverted: from quoted-printable to 8bit by
ernesto.ras.eu.org id jBTEntMi019258

(ah, peut-être un début d'explication au niveau de ce dernier champ ?)

*
Une page où trouver les jeux de caractères :
http://fr.selfhtml.org/internationalisation/jeux_caracteres.htm
--
______________________________________________________________
niark.fr ... Vous avez déjà vu un nom de domaine pareil, vous ?
Complètement gloops, ce mec ...

4 réponses

Avatar
Olivier Miakinen

Je reçois régulièrement par liste de distribution des messages devant
contenir le caractère "e dans l'o" (oelig ?), et il est codé A6
hexadécimal (= 166 décimal).

[...]

Le même document, publié sur le web, code ce caractère 9C hexadécimal (=
156 décimal), ce qui donne bien e dans l'o, et Internet Explorer
l'affiche correctement.


Ce caractère est inexistant dans ISO-8859-1 ; il est codé 9C hex (156)
dans windows-1252 ; BD hex (189) dans ISO-8859-15 ; CF hex (207) dans
MacRoman ; 0153 hex (339) en Unicode ; C5 93 hex en UTF-8 ; enfin il
n'existe ni dans CP 850 ni dans CP 437.

Quelqu'un connaît-il un codage qui accepte le caractère 166 décimal pour
e dans l'o ?


Pas moi. Pourtant j'ai fait des efforts.

Quelqu'un a-t-il déjà rencontré ce problème et eu des éléments
d'explication sur ce qui a pu se produire, comme un mauvais paramétrage
d'un outil ?

Un extrait des champs du dernier message :
Content-Type: text/plain; charset="iso-8859-1"
X-MIME-Autoconverted: from quoted-printable to 8bit by
ernesto.ras.eu.org id jBTEntMi019258


Moi j'aurais bien une tentative d'explication. La machine ernesto,
devant traduire en ISO-8859-1 un caractère inexistant dans cette table,
est bien incapable de le faire, et choisit un caractère bidon à la place
(sauf que, personnellement, j'aurais choisi « ? » plutôt que « ¦ »...)

--
Olivier Miakinen
Troll du plus sage chez les conviviaux : le nouveau venu, avec
son clan, s'infiltre dans les groupes de nouvelles. (3 c.)

Avatar
gloops
Ah, d'accord.

Donc, si je te suis bien, pour simplifier on a utilisé pour les listes
de distribution quelque chose qui avait le mérite d'exister, mais qui
n'est pas en mesure de transmettre proprement le caractère e dans l'o ...

C'est vrai qu'entre 128 et 159, je n'ai rien vu de publié comme
graphismes pour la norme ISO-8859.

C'est dommage cette conversion, parce qu'en laissant le 156 qu'on avait
au départ, même si il n'est pas dans le code officiel ISO-8859, les
outils s'en sortent très bien. Enfin ... tant qu'on est entre Français
en tout cas.

Apparemment, ça serait plutôt du ressort d'Ernesto que de l'expéditeur
j'imagine.

En attendant de pouvoir faire avancer le Schmilblick je vais me
contenter de me créer un bouton pour remplacer le caractère 166 par le
156 ... Et voir ce qui se passera quand il y aura un souci du même ordre
avec un autre caractère.

Merci pour cet éclairage.
_______________________________________________
Olivier Miakinen a écrit, le 29/12/2005 20:54 :


Je reçois régulièrement par liste de distribution des messages devant
contenir le caractère "e dans l'o" (oelig ?), et il est codé A6
hexadécimal (= 166 décimal).

[...]

Le même document, publié sur le web, code ce caractère 9C hexadécimal (=
156 décimal), ce qui donne bien e dans l'o, et Internet Explorer
l'affiche correctement.



Ce caractère est inexistant dans ISO-8859-1 ; il est codé 9C hex (156)
dans windows-1252 ; BD hex (189) dans ISO-8859-15 ; CF hex (207) dans
MacRoman ; 0153 hex (339) en Unicode ; C5 93 hex en UTF-8 ; enfin il
n'existe ni dans CP 850 ni dans CP 437.


Quelqu'un connaît-il un codage qui accepte le caractère 166 décimal pour
e dans l'o ?



Pas moi. Pourtant j'ai fait des efforts.


Quelqu'un a-t-il déjà rencontré ce problème et eu des éléments
d'explication sur ce qui a pu se produire, comme un mauvais paramétrage
d'un outil ?

Un extrait des champs du dernier message :
Content-Type: text/plain; charset="iso-8859-1"
X-MIME-Autoconverted: from quoted-printable to 8bit by
ernesto.ras.eu.org id jBTEntMi019258



Moi j'aurais bien une tentative d'explication. La machine ernesto,
devant traduire en ISO-8859-1 un caractère inexistant dans cette table,
est bien incapable de le faire, et choisit un caractère bidon à la place
(sauf que, personnellement, j'aurais choisi « ? » plutôt que « ¦ »...)



--
______________________________________________________________
niark.fr ... Vous avez déjà vu un nom de domaine pareil, vous ?
Complètement gloops, ce mec ...


Avatar
Olivier Miakinen

C'est vrai qu'entre 128 et 159, je n'ai rien vu de publié comme
graphismes pour la norme ISO-8859.


En effet. Si j'ai bien tout compris (ce qui n'est pas sûr), il y a
une différence entre les normes ISO 8859 et ISO-8859, les dernières
définissant des caractères de contrôle dans la zone de 128 à 159.

http://fr.wikipedia.org/wiki/ISO_8859-1#ISO_8859-1_par_rapport_.C3.A0_ISO-8859-1

Ainsi, à l'emplacement 9C réservé à ½ dans windows-1252, il n'y a rien
dans ISO 8859-1 mais il y a le caractère de contrôle ST dans ISO-8859-1.

En attendant de pouvoir faire avancer le Schmilblick je vais me
contenter de me créer un bouton pour remplacer le caractère 166 par le
156 ... Et voir ce qui se passera quand il y aura un souci du même ordre
avec un autre caractère.


Si tu fais ça, peut-être faudrait-il remplacer aussi « iso-8859-1 » par
« windows-1252 ». Une autre possibilité serait de remplacer le caractère
166 par 189, et « iso-8859-1 » par « iso-8859-15 ». Pour les autres
remplacements, voir ceci : <http://www.miakinen.net/vrac/charsets/>.

Olivier Miakinen a écrit, le 29/12/2005 20:54 :
[ copie intégrale de ma réponse ]


Tu serais sympa de lire ceci également :
<http://www.giromini.org/usenet-fr/repondre.html>

Merci !

--
Olivier Miakinen
Troll du plus sage chez les conviviaux : le nouveau venu, avec
son clan, s'infiltre dans les groupes de nouvelles. (3 c.)

Avatar
gloops
Olivier Miakinen a écrit, le 29/12/2005 22:47 :

C'est vrai qu'entre 128 et 159, je n'ai rien vu de publié comme
graphismes pour la norme ISO-8859.



En effet. Si j'ai bien tout compris (ce qui n'est pas sûr), il y a
une différence entre les normes ISO 8859 et ISO-8859, les dernières
définissant des caractères de contrôle dans la zone de 128 à 159.


Ah voilà une subtilité que j'ignorais.
Pour ce qui est de la liste de distribution, j'ai copié le champ
charset, donc là on sait à quoi on a affaire.

En attendant de pouvoir faire avancer le Schmilblick je vais me
contenter de me créer un bouton pour remplacer le caractère 166 par le
156 ... Et voir ce qui se passera quand il y aura un souci du même ordre
avec un autre caractère.



Si tu fais ça, peut-être faudrait-il remplacer aussi « iso-8859-1 » par
« windows-1252 ». Une autre possibilité serait de remplacer le caractère
166 par 189, et « iso-8859-1 » par « iso-8859-15 ». Pour les autres
remplacements, voir ceci : <http://www.miakinen.net/vrac/charsets/>.


Très pratique, ton tableau.

En fait, changer le champ qui annonce la couleur, c'est une chose, mais
l'essentiel est d'être en conformité avec le contenu du message. Donc,
effectuer des remplacements de caractères peut aider ...

Pour ce qui est du choix du jeu de caractères dans le message émis, je
n'ai pas trop la main sur le volant : je suis juste un adhérent parmi
quelques milliers dans l'association utilisatrice, et il m'a semblé que
c'était Ernesto qui mettait sa sauce en cours de route.

Je croiserai bien un jour quelqu'un de chez eux.
Parce que webmaster, je n'y crois que très modérément.
--
______________________________________________________________
niark.fr ... Vous avez déjà vu un nom de domaine pareil, vous ?
Complètement gloops, ce mec ...