xml encoding="windows-1252"

Le
m.banaouas
bonjour,
je suis confronté à un problème d'encodage xml.
Une application w envoie un fichier xml dont voici un résumé:
"""
<?xml version="1.0"
encoding="windows-1252"?><DOSSIER><NOM>f‚lix</NOM></DOSSIER>
"""
la caractère <,> correspond au byte $82.
en réalité, c'est un e accent aigu (é).
c'est un cas d'espèce d'une situation qui se répète très souvent.
Quand je traite ce fichier avec python, les modules elementtree et
minidom détectent une erreur d'encodage.

j'ai vérifié sur le site http://fr.wikipedia.org/wiki/Windows-1252
la case $82 ne correspond pas du tout au caractère attendu.

de trois choses l'une :
1- les applications windows se comprennent entre elles
2- le rédacteur du fichier xml commet beaucoup de fautes d'orthographe
3- l'entête encoding="windows-1252" n'est pas du tout réfléchie.

un avis ? merci
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Amaury Forgeot d'Arc
Le #657800
bonjour,
je suis confronté à un problème d'encodage xml.
Une application w envoie un fichier xml dont voici un résumé:
"""
<?xml version="1.0"
encoding="windows-1252"?><DOSSIER><NOM>f‚lix</NOM></DOSSIER>
"""
la caractère <,> correspond au byte $82.
en réalité, c'est un e accent aigu (é).
c'est un cas d'espèce d'une situation qui se répète très souvent.
Quand je traite ce fichier avec python, les modules elementtree et
minidom détectent une erreur d'encodage.

j'ai vérifié sur le site http://fr.wikipedia.org/wiki/Windows-1252
la case $82 ne correspond pas du tout au caractère attendu.

de trois choses l'une :
1- les applications windows se comprennent entre elles ...
2- le rédacteur du fichier xml commet beaucoup de fautes d'orthographe
3- l'entête encoding="windows-1252" n'est pas du tout réfléchie.

un avis ? merci


Je penche pour le numéro 3: le code $82 (130) représente bien le e
accent aigu, mais c'est dans le jeu de caractères DOS (cp437 ou cp850)
http://en.wikipedia.org/wiki/CP437


--
Amaury

Publicité
Poster une réponse
Anonyme