OVH Cloud OVH Cloud

xml parser et les accents

6 réponses
Avatar
Don HO
Bonsoir,

J'utilise xml_parse() pour parser un fichier xml.

l'option ISO-8859-1 est activée pour avoir les accents correctement :
xml_parser_set_option($xml_parseur, XML_OPTION_TARGET_ENCODING, ISO-8859-1);

mais tous ce que j'ai obtenu sont des caractères bizarres
(ex: Conférence - débats -> Conf?nces - d?ts).

Qu'est-ce que j'ai oublié à faire?
ou bien il y a un moyen pour contourner ce problème?

Merci d'avance

Don

6 réponses

Avatar
Bruno Baguette

l'option ISO-8859-1 est activée pour avoir les accents correctement :
xml_parser_set_option($xml_parseur, XML_OPTION_TARGET_ENCODING,
ISO-8859-1);

mais tous ce que j'ai obtenu sont des caractères bizarres
(ex: Conférence - débats -> Conf?nces - d?ts).

Qu'est-ce que j'ai oublié à faire?
ou bien il y a un moyen pour contourner ce problème?


Bonjour,

Sauf erreur de ma part ISO-8859-1 ne comporte aucun caractère accentué.
Essayez un coup avec ISO-8859-15 qui est plus adapté ?

Si cela ne fonctionne pas, vérifiez bien que le XML recu n'est pas en
UTF-8, c'est relativement fréquent.

En espérant que ca aide ! :-)

--
Bruno BAGUETTE -

"Nous souhaitons aider les communautés les plus pauvres de ce pays.
Que personne ne croie qu'aux Etats-Unis tout le monde vit dans
l'abondance. Ils ont des millions de pauvres là-bas"
Aout 2005 - Hugo Chavez, Président du Vénézuela.

Avatar
Olivier Miakinen
Bruno Baguette a écrit en ISO-8859-1 :

Sauf erreur de ma part ISO-8859-1 ne comporte aucun caractère accentué.
^ ^

Ahem...

Essayez un coup avec ISO-8859-15 qui est plus adapté ?


N'importe quoi. Les seuls caractères accentués en plus dans ISO-8859-15,
par rapport à ISO-8859-1, sont : ¦, ¨, ´, ¸ et ¾. (Sans compter ½ et ¼
qui sont des ligatures.)

Jette un ½il ici pour ton information :
http://www.miakinen.net/vrac/charsets/


--
Olivier Miakinen
Troll du plus sage chez les conviviaux : le nouveau venu, avec
son clan, s'infiltre dans les groupes de nouvelles. (3 c.)

Avatar
Bruno Baguette
Bruno Baguette a écrit en ISO-8859-1 :
Sauf erreur de ma part ISO-8859-1 ne comporte aucun caractère accentué.
^ ^

Ahem...


Olivier, je te donne mes coordonnées pour me faire subir un chatiment
avec une flagellation aux orties et aux ronces, le tout sur un fond de
StarAcademy ?

Essayez un coup avec ISO-8859-15 qui est plus adapté ?


N'importe quoi. Les seuls caractères accentués en plus dans ISO-8859-15,
par rapport à ISO-8859-1, sont : ¦, ¨, ´, ¸ et ¾. (Sans compter ½ et ¼
qui sont des ligatures.)

Jette un ½il ici pour ton information :
http://www.miakinen.net/vrac/charsets/


Merci Olivier d'avoir rectifié ma science à ce sujet là, je serais moins
con en allant me coucher ce soir ! :-)

Et désolé d'avoir induit le posteur initial en erreur. Quoique la piste
de l'UTF-8 me parait quand même quelque chose à regarder.

--
Bruno BAGUETTE -

"Nous souhaitons aider les communautés les plus pauvres de ce pays.
Que personne ne croie qu'aux Etats-Unis tout le monde vit dans
l'abondance. Ils ont des millions de pauvres là-bas"
Aout 2005 - Hugo Chavez, Président du Vénézuela.


Avatar
dwojylac.nospam
Don HO wrote:

Bonsoir,
Bonjour


J'utilise xml_parse() pour parser un fichier xml.

l'option ISO-8859-1 est activée pour avoir les accents correctement :
xml_parser_set_option($xml_parseur, XML_OPTION_TARGET_ENCODING, ISO-8859-1);


et 'ISO-8859-1' (entre quote ou entre guillemets) ?
vu que c'est une chaine, pas une variable que tu passes à ta fonction.

xml_parser_set_option($xml_parseur, XML_OPTION_TARGET_ENCODING,
'ISO-8859-1');

--
Dominique
http://wojylac.free.fr

Avatar
Olivier Miakinen

[...] la piste de l'UTF-8 me parait quand même quelque chose
à regarder.


À propos d'encodage et d'UTF-8, tu ne nous as pas dit si tu avais résolu
ton problème de décembre dernier :
http://groups.google.fr/group/fr.comp.lang.php/browse_frm/thread/ee579fe6d4a86e3/

--
Olivier Miakinen
Troll du plus sage chez les conviviaux : le nouveau venu, avec
son clan, s'infiltre dans les groupes de nouvelles. (3 c.)

Avatar
ASM

xml_parser_set_option($xml_parseur, XML_OPTION_TARGET_ENCODING,
ISO-8859-1);

mais tous ce que j'ai obtenu sont des caractères bizarres
(ex: Conférence - débats -> Conf?nces - d?ts).


le header de la page où tu affiches ce xml
est-il bien en iso-8859-1 ?

ou

ne faut-il pas tout bêtement :
xml_parser_set_option($xml_parseur,
XML_OPTION_TARGET_ENCODING,
'ISO-8859-1');

ne pas oublier les quotes pour la chaîne de caractères

--
Stephane Moriaux et son [moins] vieux Mac