OVH Cloud OVH Cloud

D'un charset a l'autre

1 réponse
Avatar
Laurent Seguin
Salut !

Dans un BO pour un site majoritairement en ISO-8859-15, les utilisateurs
utilisent Word pour rédiger leurs texte qu'ils copient et collent ensuite
dans le BO. On se retrouve donc avec le problèmes bien connu des caractères
Windows illégaux en HTML et XHTML.

Nous avons donc 2 solutions pour faire quelque chose "valide"
- Mettre tout le site en windows-1252 (beark)
- Transformer les caractères en entité HTML avec htmlentities (pas top)

Seulement aucune de ces solutions ne me satisfait réellement je me suis
donc en train de mitonner une moulinette qui va :
1- Convertir les caractères invalides en entité HTML (le guillemet anglais
simple fermant utilisé comme apostrophe par word deviens donc ’)
2- Remplacer ces entités par leur codage ISO-8859-15 (le ’ deviens
alors une ')

Je me demande donc si il est possible de virer ma moulinette par quelque
chose de plus malin.

Des idées/suggestions/trucs&astuces ?

1 réponse

Avatar
Jean-Marc Molina
- Transformer les caractères en entité HTML avec htmlentities (pas top)


J'utiliserai cette fonction à l'insertion du texte copié-collé dans la base
de données.

S'il s'agit de documents Word à intégrer vous pourriez aussi les éditer au
format HTML, les exporter puis les intégrer dans votre application.
J'utilisais un plugin pour exporter mes documents Word 2000 au format HTML.