Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

xml encoding="windows-1252"

1 réponse
Avatar
m.banaouas
bonjour,
je suis confronté à un problème d'encodage xml.
Une application w envoie un fichier xml dont voici un résumé:
"""
<?xml version="1.0"
encoding="windows-1252"?><DOSSIER><NOM>f‚lix</NOM></DOSSIER>
"""
la caractère <,> correspond au byte $82.
en réalité, c'est un e accent aigu (é).
c'est un cas d'espèce d'une situation qui se répète très souvent.
Quand je traite ce fichier avec python, les modules elementtree et
minidom détectent une erreur d'encodage.

j'ai vérifié sur le site http://fr.wikipedia.org/wiki/Windows-1252
la case $82 ne correspond pas du tout au caractère attendu.

de trois choses l'une :
1- les applications windows se comprennent entre elles ...
2- le rédacteur du fichier xml commet beaucoup de fautes d'orthographe
3- l'entête encoding="windows-1252" n'est pas du tout réfléchie.

un avis ? merci

1 réponse

Avatar
Amaury Forgeot d'Arc
bonjour,
je suis confronté à un problème d'encodage xml.
Une application w envoie un fichier xml dont voici un résumé:
"""
<?xml version="1.0"
encoding="windows-1252"?><DOSSIER><NOM>f‚lix</NOM></DOSSIER>
"""
la caractère <,> correspond au byte $82.
en réalité, c'est un e accent aigu (é).
c'est un cas d'espèce d'une situation qui se répète très souvent.
Quand je traite ce fichier avec python, les modules elementtree et
minidom détectent une erreur d'encodage.

j'ai vérifié sur le site http://fr.wikipedia.org/wiki/Windows-1252
la case $82 ne correspond pas du tout au caractère attendu.

de trois choses l'une :
1- les applications windows se comprennent entre elles ...
2- le rédacteur du fichier xml commet beaucoup de fautes d'orthographe
3- l'entête encoding="windows-1252" n'est pas du tout réfléchie.

un avis ? merci


Je penche pour le numéro 3: le code $82 (130) représente bien le e
accent aigu, mais c'est dans le jeu de caractères DOS (cp437 ou cp850)
http://en.wikipedia.org/wiki/CP437


--
Amaury