OVH Cloud OVH Cloud

Perl et conversion UTF-8

5 réponses
Avatar
Maxime Wojtczak
Bonjour,

Je me demandais si vous aviez des méthodes pour convertir du texte
iso-8859-1 vers de l'UTF-8.
En effet, j'ai recodé un forum en le gérant entièrement en UTF-8 mais il
faut que je migre tous les messages de la version antérieure dans ce codage.
A vrai dire, les seuls caractères à convertir sont les accents français,
donc si vous aviez une fonctions à me proposer (même si je sais que cela
peut se faire à l'aide d'une regex assez simple), ce serait très
sympatique de m'en faire part.

Merci d'avance!

Maxime Wojtczak

5 réponses

Avatar
Maxime Wojtczak
Maxime Wojtczak wrote:

Bonjour,

Je me demandais si vous aviez des méthodes pour convertir du texte
iso-8859-1 vers de l'UTF-8.
En effet, j'ai recodé un forum en le gérant entièrement en UTF-8 mais il
faut que je migre tous les messages de la version antérieure dans ce
codage.
A vrai dire, les seuls caractères à convertir sont les accents français,
donc si vous aviez une fonctions à me proposer (même si je sais que cela
peut se faire à l'aide d'une regex assez simple), ce serait très
sympatique de m'en faire part.

Merci d'avance!

Maxime Wojtczak



Euuuh... J'oubliait : La conversion ne doit pas se faire à l'aide de
module, Encode n'étant pas installé chez mon hebergeur...

Avatar
Denis -esp2008-
Bonjour,

Euuuh... J'oubliait : La conversion ne doit pas se faire à l'aide de
module, Encode n'étant pas installé chez mon hebergeur...


Le plus simple est de récupérer le module correspondant, de récupérer
les données sur la machine de l'hébergeur, et de faire le traitement sur
sa propre machine...

--
Denis

Avatar
jean-charles Gibier
"Denis -esp2008-" a écrit dans le
message news:

Bonjour,

Euuuh... J'oubliait : La conversion ne doit pas se faire à l'aide de
module, Encode n'étant pas installé chez mon hebergeur...


Le plus simple est de récupérer le module correspondant, de récupérer
les données sur la machine de l'hébergeur, et de faire le traitement sur
sa propre machine...



Comme le problème correspond un peu au mien (cf thread pécédent), et si le
module sugéré est encode,
je rappelle qu'il ne s'installe que sur des version > à 5.7.
C'est peut être le problème du posteur initial et dans ce cas également le
mien ;-)


Avatar
gregory.schmitt
"jean-charles Gibier" wrote in message news:<41064342$0$29376$...
"Denis -esp2008-" a écrit dans le
message news:

Bonjour,

Euuuh... J'oubliait : La conversion ne doit pas se faire à l'aide de
module, Encode n'étant pas installé chez mon hebergeur...


Le plus simple est de récupérer le module correspondant, de récupérer
les données sur la machine de l'hébergeur, et de faire le traitement sur
sa propre machine...



Comme le problème correspond un peu au mien (cf thread pécédent), et si le
module sugéré est encode,
je rappelle qu'il ne s'installe que sur des version > à 5.7.
C'est peut être le problème du posteur initial et dans ce cas également le
mien ;-)



Euh... sinon y'a iconv (disponible en programme ou en package Perl).
Si tu as accès à un petit shell unix et que les messages des forums
sont conservés sous forme de fichiers, un petit "find [...] -exec
iconv -f iso8859-1 -t utf-8 -o [...] {} ;" devrait convenir et
automatiser tout ca.



Avatar
jean-charles Gibier
"Gr?gory SCHMITT" a écrit dans le message news:

"jean-charles Gibier" wrote in message
news:<41064342$0$29376$...

"Denis -esp2008-" a écrit dans
le


message news:

Bonjour,

Euuuh... J'oubliait : La conversion ne doit pas se faire à l'aide de
module, Encode n'étant pas installé chez mon hebergeur...


Le plus simple est de récupérer le module correspondant, de récupérer
les données sur la machine de l'hébergeur, et de faire le traitement
sur



sa propre machine...



Comme le problème correspond un peu au mien (cf thread pécédent), et si
le


module sugéré est encode,
je rappelle qu'il ne s'installe que sur des version > à 5.7.
C'est peut être le problème du posteur initial et dans ce cas également
le


mien ;-)



Euh... sinon y'a iconv (disponible en programme ou en package Perl).
Si tu as accès à un petit shell unix et que les messages des forums
sont conservés sous forme de fichiers, un petit "find [...] -exec
iconv -f iso8859-1 -t utf-8 -o [...] {} ;" devrait convenir et
automatiser tout ca.


Effectivement le package Text::Iconv est une bonne solution pour moi.
Merci.