OVH Cloud OVH Cloud

module HTML::TextToHTML et accents

3 réponses
Avatar
Jean-Michel Caricand
Bonjour à tous,

J'utilise le module HTML::TextToHTML pour créer une sortie HTML à partir
d'un texte formaté. Mon soucis :

Soit le texte :
C'est un #texte formate en HTML#

Je le passe à la moulinette et j'obtiens une page HTML avec le texte entre
les deux # en gras.

Maintenant le texte :
C'est un #texte formaté en HTML#

La différence c'est l'accent. C'est fois plus de gras.

Une solution serait de modifier le fichier dictionnaire utilisé par txt2html
mais je souhaiterai savoir s'il est possible de gérer simplement les accents
dans les ER afin d'éviter cette méthode.

Merci d'avance.

--
Jean-Michel Caricand
Equipe systèmes
LIFC 16 route de Gray 25030 Besançon
Tél: 03 81 66 20 63
Mail : infoalao@univ-fcomte.fr

3 réponses

Avatar
DoMinix
Bonjour à tous,

J'utilise le module HTML::TextToHTML pour créer une sortie HTML à partir
d'un texte formaté. Mon soucis :

Soit le texte :
C'est un #texte formate en HTML#

Je le passe à la moulinette et j'obtiens une page HTML avec le texte entre
les deux # en gras.

Maintenant le texte :
C'est un #texte formaté en HTML#

La différence c'est l'accent. C'est fois plus de gras.

Une solution serait de modifier le fichier dictionnaire utilisé par txt2html
mais je souhaiterai savoir s'il est possible de gérer simplement les accents
dans les ER afin d'éviter cette méthode.

Merci d'avance.



peut etre un coup de
use HTML::Entities;
encode_entities($_);
reglera le probleme ? (pas testé)

--
dominix

Avatar
Jean-Michel Caricand
Bonjour,

Dommage, cela ne suffit pas. Les accents sont bien transformés mais le texte
n'est en gras. txt2html n'a pas l'air d'aimer les accents. Du coup, certains
formatages sont oubliés et les balises html ne sont pas insérées
correctement.



"DoMinix" a écrit dans le message de news:
45bc6c52$0$16155$
Bonjour à tous,

J'utilise le module HTML::TextToHTML pour créer une sortie HTML à partir
d'un texte formaté. Mon soucis :

Soit le texte :
C'est un #texte formate en HTML#

Je le passe à la moulinette et j'obtiens une page HTML avec le texte
entre
les deux # en gras.

Maintenant le texte :
C'est un #texte formaté en HTML#

La différence c'est l'accent. C'est fois plus de gras.

Une solution serait de modifier le fichier dictionnaire utilisé par
txt2html
mais je souhaiterai savoir s'il est possible de gérer simplement les
accents
dans les ER afin d'éviter cette méthode.

Merci d'avance.



peut etre un coup de
use HTML::Entities;
encode_entities($_);
reglera le probleme ? (pas testé)

--
dominix



Avatar
Paul Gaborit
À (at) Sat, 27 Jan 2007 17:29:12 +0100,
"Jean-Michel Caricand" écrivait (wrote):
Bonjour à tous,

J'utilise le module HTML::TextToHTML pour créer une sortie HTML à partir
d'un texte formaté. Mon soucis :

Soit le texte :
C'est un #texte formate en HTML#

Je le passe à la moulinette et j'obtiens une page HTML avec le texte entre
les deux # en gras.

Maintenant le texte :
C'est un #texte formaté en HTML#

La différence c'est l'accent. C'est fois plus de gras.

Une solution serait de modifier le fichier dictionnaire utilisé par txt2html
mais je souhaiterai savoir s'il est possible de gérer simplement les accents
dans les ER afin d'éviter cette méthode.


Trois suggestions :

1- Avez-vous essayé l'option 'eight_biy_clean' ? Essayez-la et voyez
le résultat...

2- Pour le gras (mais c'est vrai aussi pour l'italique et autres trucs
délimités), le code de HTML::TextToHTML utilise la classe [:alpha:]
des expressions rationnelles qui, normalement, est sensible au
'locale' courant. Donc si vous définissez un 'locale' français (du
genre fr_FR.ISO8859-1), les accents devraient passer.

3- Si les 'locale' ne sont pas utilisables chez vous, vous pouvez
tenter un passage en UTF-8.

--
Paul Gaborit - <http://perso.enstimac.fr/~gaborit/>
Perl en français - <http://perl.enstimac.fr/>