bonjour,
je suis confronté à un problème d'encodage xml.
Une application w envoie un fichier xml dont voici un résumé:
"""
<?xml version="1.0"
encoding="windows-1252"?><DOSSIER><NOM>flix</NOM></DOSSIER>
"""
la caractère <,> correspond au byte $82.
en réalité, c'est un e accent aigu (é).
c'est un cas d'espèce d'une situation qui se répète très souvent.
Quand je traite ce fichier avec python, les modules elementtree et
minidom détectent une erreur d'encodage.
j'ai vérifié sur le site http://fr.wikipedia.org/wiki/Windows-1252
la case $82 ne correspond pas du tout au caractère attendu.
de trois choses l'une :
1- les applications windows se comprennent entre elles ...
2- le rédacteur du fichier xml commet beaucoup de fautes d'orthographe
3- l'entête encoding="windows-1252" n'est pas du tout réfléchie.
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
Amaury Forgeot d'Arc
bonjour, je suis confronté à un problème d'encodage xml. Une application w envoie un fichier xml dont voici un résumé: """ <?xml version="1.0" encoding="windows-1252"?><DOSSIER><NOM>flix</NOM></DOSSIER> """ la caractère <,> correspond au byte $82. en réalité, c'est un e accent aigu (é). c'est un cas d'espèce d'une situation qui se répète très souvent. Quand je traite ce fichier avec python, les modules elementtree et minidom détectent une erreur d'encodage.
j'ai vérifié sur le site http://fr.wikipedia.org/wiki/Windows-1252 la case $82 ne correspond pas du tout au caractère attendu.
de trois choses l'une : 1- les applications windows se comprennent entre elles ... 2- le rédacteur du fichier xml commet beaucoup de fautes d'orthographe 3- l'entête encoding="windows-1252" n'est pas du tout réfléchie.
un avis ? merci
Je penche pour le numéro 3: le code $82 (130) représente bien le e accent aigu, mais c'est dans le jeu de caractères DOS (cp437 ou cp850) http://en.wikipedia.org/wiki/CP437
-- Amaury
bonjour,
je suis confronté à un problème d'encodage xml.
Une application w envoie un fichier xml dont voici un résumé:
"""
<?xml version="1.0"
encoding="windows-1252"?><DOSSIER><NOM>flix</NOM></DOSSIER>
"""
la caractère <,> correspond au byte $82.
en réalité, c'est un e accent aigu (é).
c'est un cas d'espèce d'une situation qui se répète très souvent.
Quand je traite ce fichier avec python, les modules elementtree et
minidom détectent une erreur d'encodage.
j'ai vérifié sur le site http://fr.wikipedia.org/wiki/Windows-1252
la case $82 ne correspond pas du tout au caractère attendu.
de trois choses l'une :
1- les applications windows se comprennent entre elles ...
2- le rédacteur du fichier xml commet beaucoup de fautes d'orthographe
3- l'entête encoding="windows-1252" n'est pas du tout réfléchie.
un avis ? merci
Je penche pour le numéro 3: le code $82 (130) représente bien le e
accent aigu, mais c'est dans le jeu de caractères DOS (cp437 ou cp850)
http://en.wikipedia.org/wiki/CP437
bonjour, je suis confronté à un problème d'encodage xml. Une application w envoie un fichier xml dont voici un résumé: """ <?xml version="1.0" encoding="windows-1252"?><DOSSIER><NOM>flix</NOM></DOSSIER> """ la caractère <,> correspond au byte $82. en réalité, c'est un e accent aigu (é). c'est un cas d'espèce d'une situation qui se répète très souvent. Quand je traite ce fichier avec python, les modules elementtree et minidom détectent une erreur d'encodage.
j'ai vérifié sur le site http://fr.wikipedia.org/wiki/Windows-1252 la case $82 ne correspond pas du tout au caractère attendu.
de trois choses l'une : 1- les applications windows se comprennent entre elles ... 2- le rédacteur du fichier xml commet beaucoup de fautes d'orthographe 3- l'entête encoding="windows-1252" n'est pas du tout réfléchie.
un avis ? merci
Je penche pour le numéro 3: le code $82 (130) représente bien le e accent aigu, mais c'est dans le jeu de caractères DOS (cp437 ou cp850) http://en.wikipedia.org/wiki/CP437