OVH Cloud OVH Cloud

Utilisation de recode

2 réponses
Avatar
Vincent Ramos
Bonsoir,

J'ai besoin de transcoder des fichiers textes en utf-8 de manière à
ce qu'à l'arrivée j'ai du latin-1 *et* des entités html numériques ou
non pour tout caractère qui ne soit pas inclus dans latin-1, sans
toucher aux caractères qui sont inclus dans latin-1...

Je suis sûr que c'est faisable avec recode, mais je n'arrive pas à
obtenir cela : avec
recode ..latin1 essai.txt
(je suis en utf-8 par défaut), je perds les caractères non latin-1,
avec
recode ..html4 essai.txt
tous les caractères non ASCII sont transcodés. Or, je voudrais à
l'arrivée que seuls les caractères non latin-1 le soient, de manière
à ce que le texte d'arrivée reste le plus lisible possible.

Par exemple, avec une phrase comme « J'étais un vrai <un caractère
chinois signifiant "cochon"> », j'aimerais obtenir « J'étais un vrai
&#35948; » ou bien « J'étais un vrai &x8C6C; » mais surtout pas
« J'&eacute;tais un vrai &#35948; ».

Quelqu'un connaît-il la marche à suivre ? J'ai beau lire le manuel,
je ne vois pas comment faire.

Merci,

Vincent

--
Je participe au projet Wikipédia <http://fr.wikipedia.org/>, et vous ?
<http://fr.wikipedia.org/wiki/Utilisateur:Vincent_Ramos>

2 réponses

Avatar
Stephane Chazelas
2003-12-17, 20:39(+01), Vincent Ramos:
[...]
Par exemple, avec une phrase comme « J'étais un vrai <un caractère
chinois signifiant "cochon"> », j'aimerais obtenir « J'étais un vrai
&#35948; » ou bien « J'étais un vrai &x8C6C; » mais surtout pas
« J'&eacute;tais un vrai &#35948; ».

Quelqu'un connaît-il la marche à suivre ? J'ai beau lire le manuel,
je ne vois pas comment faire.
[...]


Ce n'est pas possible avec recode. Ce ne devrait pas être trop
compliqué avec perl.

--
Stéphane ["Stephane.Chazelas" arobase "free.fr"]

Avatar
Vincent Ramos

Ce n'est pas possible avec recode. Ce ne devrait pas être trop
compliqué avec perl.


Bon bon bon... Je ne connais rien à Perl mais cela me fera de la
lecture pour les vacances. Merci.