OVH Cloud OVH Cloud

Problème d'accent

2 réponses
Avatar
my.perl
Bonjour,

Je vous expose mon petit souci

J'ai un fichier en entr=E9 que je dois traiter avec Perl pour extraire
les infos qui m'int=E9resses
mais dans ces infos il y a des caract=E8res accentu=E9s (et oui :))

Si je li le fichier en local sur une station microsoft je vois
correctement les accents,
mais pas si je fait un 'cat' sur le fichier....

Le script perl est sens=E9 tourner sur Linux et lorsque que je le fait
tourner les accents sont transorm=E9s par exemple en:

=E7 devient =C3=A7
=E9 devient =C3(c)
=E8 devient =C3=A8
=EF devient =C3=AF

bref mon fichier en sorti est du coup v=E9rol=E9 mais mon perl (mon
systeme je pense) li mal le fichier =E0 priori...

Avez-vous une piste =E0 me sugg=E9rer ?

2 réponses

Avatar
Vincent Ramos
égrapsen en
 :

J'ai un fichier en entré que je dois traiter avec Perl pour extraire
les infos qui m'intéresses
mais dans ces infos il y a des caractères accentués (et oui :))
Si je li le fichier en local sur une station microsoft je vois
correctement les accents,
mais pas si je fait un 'cat' sur le fichier....
Le script perl est sensé tourner sur Linux et lorsque que je le fait
tourner les accents sont transormés par exemple en:
ç devient ç
é devient Ã(c)
è devient Ã?
ï devient ï


Ces transformations sont caractéristiques de l'UTF-8 (transformation
sur 8 bits de données unicodées).

Cherchez du côté de recode¹, par exemple, application qui permet de
recoder à la volée des données. Il existe sûrement un moyen de faire
cela directement en Perl.

1. -- info recode.

P.-S. Copie et suivi sur <news:fr.comp.lang.perl>. Le forum
<news:fr.comp.normes.unicode> pourrait aussi vous être utile si vous
ne voyez pas du tout ce que sont Unicode et UTF-8

Avatar
Emmanuel Florac
Le Wed, 16 Nov 2005 07:35:40 -0800, a écrit :


Avez-vous une piste à me suggérer ?


Déjà il faudra que tu utilises perl 5.8 pour avoir un support correct de
l'unicode. Est-ce le cas ?

--
In girum imus nocte ecce et consumimur igni