J'ai eu un petit souci avec la génération de fichier XML. Je lis un fichier
texte et je génère un fichier XML. Or dans mon fichier initial il peut avoir
des accents (ce qui est mal pour un fichier XML). J'ai bien contourné le
problème en testant dans une liste de caractère "interdits" fait maison mais
je voulais savoir si ça existait et si ça ne savait pas faire la converison
seul (en effet je pense que ma liste n'est pas exhaustive).
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
News M Claveau /Hamster-P
Bonsoir !
XML utilisant Unicode, il ne devrait pas y avoir de problème d'accents. A condition de bien choisir l'encodage approprié. Mais, comme, avec Unicode, une absence de précision sur l'encodage correspond à l'utf-8, autant l'utiliser.
@-salutations -- Michel Claveau
Bonsoir !
XML utilisant Unicode, il ne devrait pas y avoir de problème d'accents. A
condition de bien choisir l'encodage approprié. Mais, comme, avec Unicode,
une absence de précision sur l'encodage correspond à l'utf-8, autant
l'utiliser.
XML utilisant Unicode, il ne devrait pas y avoir de problème d'accents. A condition de bien choisir l'encodage approprié. Mais, comme, avec Unicode, une absence de précision sur l'encodage correspond à l'utf-8, autant l'utiliser.
@-salutations -- Michel Claveau
Encolpe DEGOUTE
Dans fr.comp.lang.python, Sébastien V. écrivit:
Bonjour,
J'ai eu un petit souci avec la génération de fichier XML. Je lis un fichier texte et je génère un fichier XML. Or dans mon fichier initial il peut avoir des accents (ce qui est mal pour un fichier XML). J'ai bien contourné le problème en testant dans une liste de caractère "interdits" fait maison mais je voulais savoir si ça existait et si ça ne savait pas faire la converison seul (en effet je pense que ma liste n'est pas exhaustive).
Tant que les accents ne sont pas dans les identifiants d'attributs il n'y a pas de problème. Dans la définition de votre fichier xml, dans l'entête, vous devez mettre l'encodage du fichier. Comme dans les scripts python d'ailleurs.
Le problème vient du non respect des encodages par microsoft... J'ai déjà réalisé une fonction qui corrige ce problème. Les caractères posant problèmes sont: - l'apostrophe - OE et oe - les points de suspension - un que j'oublie
Le mieux est de considéré que le texte en entrée est de l'unicode et de le transformer avant de changer son encodage.
C'est en gros ça. Je peux retrouver la fonction complète demain si besoin est.
-- Encolpe DEGOUTE http://fleurbleue.colpi.info/~encolpe/ Logiciels libres, hockey sur glace et autres activités cérébrales
Dans fr.comp.lang.python, Sébastien V. écrivit:
Bonjour,
J'ai eu un petit souci avec la génération de fichier XML. Je lis un fichier
texte et je génère un fichier XML. Or dans mon fichier initial il peut avoir
des accents (ce qui est mal pour un fichier XML). J'ai bien contourné le
problème en testant dans une liste de caractère "interdits" fait maison mais
je voulais savoir si ça existait et si ça ne savait pas faire la converison
seul (en effet je pense que ma liste n'est pas exhaustive).
Tant que les accents ne sont pas dans les identifiants d'attributs il
n'y a pas de problème.
Dans la définition de votre fichier xml, dans l'entête, vous devez
mettre l'encodage du fichier. Comme dans les scripts python d'ailleurs.
Le problème vient du non respect des encodages par microsoft...
J'ai déjà réalisé une fonction qui corrige ce problème.
Les caractères posant problèmes sont:
- l'apostrophe
- OE et oe
- les points de suspension
- un que j'oublie
Le mieux est de considéré que le texte en entrée est de l'unicode et de
le transformer avant de changer son encodage.
J'ai eu un petit souci avec la génération de fichier XML. Je lis un fichier texte et je génère un fichier XML. Or dans mon fichier initial il peut avoir des accents (ce qui est mal pour un fichier XML). J'ai bien contourné le problème en testant dans une liste de caractère "interdits" fait maison mais je voulais savoir si ça existait et si ça ne savait pas faire la converison seul (en effet je pense que ma liste n'est pas exhaustive).
Tant que les accents ne sont pas dans les identifiants d'attributs il n'y a pas de problème. Dans la définition de votre fichier xml, dans l'entête, vous devez mettre l'encodage du fichier. Comme dans les scripts python d'ailleurs.
Le problème vient du non respect des encodages par microsoft... J'ai déjà réalisé une fonction qui corrige ce problème. Les caractères posant problèmes sont: - l'apostrophe - OE et oe - les points de suspension - un que j'oublie
Le mieux est de considéré que le texte en entrée est de l'unicode et de le transformer avant de changer son encodage.
C'est en gros ça. Je peux retrouver la fonction complète demain si besoin est.
-- Encolpe DEGOUTE http://fleurbleue.colpi.info/~encolpe/ Logiciels libres, hockey sur glace et autres activités cérébrales
Wilk
Encolpe DEGOUTE writes:
Dans fr.comp.lang.python, Sébastien V. écrivit:
Bonjour,
J'ai eu un petit souci avec la génération de fichier XML. Je lis un fichier texte et je génère un fichier XML. Or dans mon fichier initial il peut avoir des accents (ce qui est mal pour un fichier XML). J'ai bien contourné le problème en testant dans une liste de caractère "interdits" fait maison mais je voulais savoir si ça existait et si ça ne savait pas faire la converison seul (en effet je pense que ma liste n'est pas exhaustive).
Tant que les accents ne sont pas dans les identifiants d'attributs il n'y a pas de problème. Dans la définition de votre fichier xml, dans l'entête, vous devez mettre l'encodage du fichier. Comme dans les scripts python d'ailleurs.
Le problème vient du non respect des encodages par microsoft...
Tu parles de ça je suppose : http://openweb.eu.org/articles/caracteres_illegaux/
J'ai eu un petit souci avec la génération de fichier XML. Je lis un fichier
texte et je génère un fichier XML. Or dans mon fichier initial il peut avoir
des accents (ce qui est mal pour un fichier XML). J'ai bien contourné le
problème en testant dans une liste de caractère "interdits" fait maison mais
je voulais savoir si ça existait et si ça ne savait pas faire la converison
seul (en effet je pense que ma liste n'est pas exhaustive).
Tant que les accents ne sont pas dans les identifiants d'attributs il
n'y a pas de problème.
Dans la définition de votre fichier xml, dans l'entête, vous devez
mettre l'encodage du fichier. Comme dans les scripts python d'ailleurs.
Le problème vient du non respect des encodages par microsoft...
Tu parles de ça je suppose :
http://openweb.eu.org/articles/caracteres_illegaux/
J'ai eu un petit souci avec la génération de fichier XML. Je lis un fichier texte et je génère un fichier XML. Or dans mon fichier initial il peut avoir des accents (ce qui est mal pour un fichier XML). J'ai bien contourné le problème en testant dans une liste de caractère "interdits" fait maison mais je voulais savoir si ça existait et si ça ne savait pas faire la converison seul (en effet je pense que ma liste n'est pas exhaustive).
Tant que les accents ne sont pas dans les identifiants d'attributs il n'y a pas de problème. Dans la définition de votre fichier xml, dans l'entête, vous devez mettre l'encodage du fichier. Comme dans les scripts python d'ailleurs.
Le problème vient du non respect des encodages par microsoft...
Tu parles de ça je suppose : http://openweb.eu.org/articles/caracteres_illegaux/
XML utilisant Unicode, il ne devrait pas y avoir de problème d'accents. A condition de bien choisir l'encodage approprié. Mais, comme, avec Unicode, une absence de précision sur l'encodage correspond à l'utf-8, autant l'utiliser.
Tout à fait. Après avoir rencontré pas mal de problèmes d'encodages de caractères avec Python et XML j'en étais arrivé à la conclusion que le plus simple était d'effectuer tous les traitements XML en Unicode. On fera au besoin des conversion des données en entrée et en sortie si celles-ci ne peuvent être en Unicode. Mais conserver l'Unicode pour tous ses traitements XML évite bien des surprises.
Mes deux centimes.
-- Alex
News M Claveau /Hamster-P wrote:
XML utilisant Unicode, il ne devrait pas y avoir de problème d'accents. A
condition de bien choisir l'encodage approprié. Mais, comme, avec Unicode,
une absence de précision sur l'encodage correspond à l'utf-8, autant
l'utiliser.
Tout à fait. Après avoir rencontré pas mal de problèmes d'encodages de
caractères avec Python et XML j'en étais arrivé à la conclusion que le
plus simple était d'effectuer tous les traitements XML en Unicode. On
fera au besoin des conversion des données en entrée et en sortie si
celles-ci ne peuvent être en Unicode. Mais conserver l'Unicode pour tous
ses traitements XML évite bien des surprises.
XML utilisant Unicode, il ne devrait pas y avoir de problème d'accents. A condition de bien choisir l'encodage approprié. Mais, comme, avec Unicode, une absence de précision sur l'encodage correspond à l'utf-8, autant l'utiliser.
Tout à fait. Après avoir rencontré pas mal de problèmes d'encodages de caractères avec Python et XML j'en étais arrivé à la conclusion que le plus simple était d'effectuer tous les traitements XML en Unicode. On fera au besoin des conversion des données en entrée et en sortie si celles-ci ne peuvent être en Unicode. Mais conserver l'Unicode pour tous ses traitements XML évite bien des surprises.