J'ai un fichier en entr=E9 que je dois traiter avec Perl pour extraire
les infos qui m'int=E9resses
mais dans ces infos il y a des caract=E8res accentu=E9s (et oui :))
Si je li le fichier en local sur une station microsoft je vois
correctement les accents,
mais pas si je fait un 'cat' sur le fichier....
Le script perl est sens=E9 tourner sur Linux et lorsque que je le fait
tourner les accents sont transorm=E9s par exemple en:
=E7 devient =C3=A7
=E9 devient =C3(c)
=E8 devient =C3=A8
=EF devient =C3=AF
bref mon fichier en sorti est du coup v=E9rol=E9 mais mon perl (mon
systeme je pense) li mal le fichier =E0 priori...
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
Vincent Ramos
égrapsen en :
J'ai un fichier en entré que je dois traiter avec Perl pour extraire les infos qui m'intéresses mais dans ces infos il y a des caractères accentués (et oui :)) Si je li le fichier en local sur une station microsoft je vois correctement les accents, mais pas si je fait un 'cat' sur le fichier.... Le script perl est sensé tourner sur Linux et lorsque que je le fait tourner les accents sont transormés par exemple en: ç devient ç é devient Ã(c) è devient Ã? ï devient ï
Ces transformations sont caractéristiques de l'UTF-8 (transformation sur 8 bits de données unicodées).
Cherchez du côté de recode¹, par exemple, application qui permet de recoder à la volée des données. Il existe sûrement un moyen de faire cela directement en Perl.
1. -- info recode.
P.-S. Copie et suivi sur <news:fr.comp.lang.perl>. Le forum <news:fr.comp.normes.unicode> pourrait aussi vous être utile si vous ne voyez pas du tout ce que sont Unicode et UTF-8
my.perl@gmail.com égrapsen en
<1132155340.595699.308360@g43g2000cwa.googlegroups.com> :
J'ai un fichier en entré que je dois traiter avec Perl pour extraire
les infos qui m'intéresses
mais dans ces infos il y a des caractères accentués (et oui :))
Si je li le fichier en local sur une station microsoft je vois
correctement les accents,
mais pas si je fait un 'cat' sur le fichier....
Le script perl est sensé tourner sur Linux et lorsque que je le fait
tourner les accents sont transormés par exemple en:
ç devient ç
é devient Ã(c)
è devient Ã?
ï devient ï
Ces transformations sont caractéristiques de l'UTF-8 (transformation
sur 8 bits de données unicodées).
Cherchez du côté de recode¹, par exemple, application qui permet de
recoder à la volée des données. Il existe sûrement un moyen de faire
cela directement en Perl.
1. -- info recode.
P.-S. Copie et suivi sur <news:fr.comp.lang.perl>. Le forum
<news:fr.comp.normes.unicode> pourrait aussi vous être utile si vous
ne voyez pas du tout ce que sont Unicode et UTF-8
J'ai un fichier en entré que je dois traiter avec Perl pour extraire les infos qui m'intéresses mais dans ces infos il y a des caractères accentués (et oui :)) Si je li le fichier en local sur une station microsoft je vois correctement les accents, mais pas si je fait un 'cat' sur le fichier.... Le script perl est sensé tourner sur Linux et lorsque que je le fait tourner les accents sont transormés par exemple en: ç devient ç é devient Ã(c) è devient Ã? ï devient ï
Ces transformations sont caractéristiques de l'UTF-8 (transformation sur 8 bits de données unicodées).
Cherchez du côté de recode¹, par exemple, application qui permet de recoder à la volée des données. Il existe sûrement un moyen de faire cela directement en Perl.
1. -- info recode.
P.-S. Copie et suivi sur <news:fr.comp.lang.perl>. Le forum <news:fr.comp.normes.unicode> pourrait aussi vous être utile si vous ne voyez pas du tout ce que sont Unicode et UTF-8
Emmanuel Florac
Le Wed, 16 Nov 2005 07:35:40 -0800, a écrit :
Avez-vous une piste à me suggérer ?
Déjà il faudra que tu utilises perl 5.8 pour avoir un support correct de l'unicode. Est-ce le cas ?
-- In girum imus nocte ecce et consumimur igni
Le Wed, 16 Nov 2005 07:35:40 -0800, my.perl@gmail.com a écrit :
Avez-vous une piste à me suggérer ?
Déjà il faudra que tu utilises perl 5.8 pour avoir un support correct de
l'unicode. Est-ce le cas ?