Comment convertir un fichier texte encodé en UNICODE vers de l'ASCII pour le
lire/traiter correctement dans un script Perl ?
J'ai regardé la doc, la fonction pack() je n'y comprends rien (et pourtant
je m'acharne !), j'ai regardé aussi du côté des modules sur cpan, rien de
concluant.
La fonction open() me dit que je peux mettre des filtres de lecture, mais
cela me retourne une jolie erreur quand je tente par exemple de faire un
open(file,":utf8","monfichier.txt");
Pour info, le fichier export_incident.txt provient de l'outil d'extraction fourni avec SQL Server.
Si tu es sous Windows, fais attention, le latin1 (nom courant de ISO-8859-1) n'est peut etre pas exactement ce qu'il te faut. Si je me rapelle bien, Microsoft a sa propre version, legerement differente, qui inclue par exemple les "smart quotes" au lieu de caracteres standards.
Je ne connais pas trop ces encodages, regarde du cote de http://www.cs.tut.fi/~jkorpela/chars.html qui semble avoir pas mal d'explications sur le sujet.
-- mirod
Yoann Wyffels wrote:
Pour info, le fichier export_incident.txt provient de l'outil d'extraction
fourni avec SQL Server.
Si tu es sous Windows, fais attention, le latin1 (nom courant de
ISO-8859-1) n'est peut etre pas exactement ce qu'il te faut. Si je me
rapelle bien, Microsoft a sa propre version, legerement differente, qui
inclue par exemple les "smart quotes" au lieu de caracteres standards.
Je ne connais pas trop ces encodages, regarde du cote de
http://www.cs.tut.fi/~jkorpela/chars.html qui semble avoir pas mal
d'explications sur le sujet.
Pour info, le fichier export_incident.txt provient de l'outil d'extraction fourni avec SQL Server.
Si tu es sous Windows, fais attention, le latin1 (nom courant de ISO-8859-1) n'est peut etre pas exactement ce qu'il te faut. Si je me rapelle bien, Microsoft a sa propre version, legerement differente, qui inclue par exemple les "smart quotes" au lieu de caracteres standards.
Je ne connais pas trop ces encodages, regarde du cote de http://www.cs.tut.fi/~jkorpela/chars.html qui semble avoir pas mal d'explications sur le sujet.