J'ai besoin de transcoder des fichiers textes en utf-8 de manière à
ce qu'à l'arrivée j'ai du latin-1 *et* des entités html numériques ou
non pour tout caractère qui ne soit pas inclus dans latin-1, sans
toucher aux caractères qui sont inclus dans latin-1...
Je suis sûr que c'est faisable avec recode, mais je n'arrive pas à
obtenir cela : avec
recode ..latin1 essai.txt
(je suis en utf-8 par défaut), je perds les caractères non latin-1,
avec
recode ..html4 essai.txt
tous les caractères non ASCII sont transcodés. Or, je voudrais à
l'arrivée que seuls les caractères non latin-1 le soient, de manière
à ce que le texte d'arrivée reste le plus lisible possible.
Par exemple, avec une phrase comme « J'étais un vrai <un caractère
chinois signifiant "cochon"> », j'aimerais obtenir « J'étais un vrai
豬 » ou bien « J'étais un vrai &x8C6C; » mais surtout pas
« J'étais un vrai 豬 ».
Quelqu'un connaît-il la marche à suivre ? J'ai beau lire le manuel,
je ne vois pas comment faire.
Merci,
Vincent
--
Je participe au projet Wikipédia <http://fr.wikipedia.org/>, et vous ?
<http://fr.wikipedia.org/wiki/Utilisateur:Vincent_Ramos>
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
Stephane Chazelas
2003-12-17, 20:39(+01), Vincent Ramos: [...]
Par exemple, avec une phrase comme « J'étais un vrai <un caractère chinois signifiant "cochon"> », j'aimerais obtenir « J'étais un vrai 豬 » ou bien « J'étais un vrai &x8C6C; » mais surtout pas « J'étais un vrai 豬 ».
Quelqu'un connaît-il la marche à suivre ? J'ai beau lire le manuel, je ne vois pas comment faire. [...]
Ce n'est pas possible avec recode. Ce ne devrait pas être trop compliqué avec perl.
Par exemple, avec une phrase comme « J'étais un vrai <un caractère
chinois signifiant "cochon"> », j'aimerais obtenir « J'étais un vrai
豬 » ou bien « J'étais un vrai &x8C6C; » mais surtout pas
« J'étais un vrai 豬 ».
Quelqu'un connaît-il la marche à suivre ? J'ai beau lire le manuel,
je ne vois pas comment faire.
[...]
Ce n'est pas possible avec recode. Ce ne devrait pas être trop
compliqué avec perl.
Par exemple, avec une phrase comme « J'étais un vrai <un caractère chinois signifiant "cochon"> », j'aimerais obtenir « J'étais un vrai 豬 » ou bien « J'étais un vrai &x8C6C; » mais surtout pas « J'étais un vrai 豬 ».
Quelqu'un connaît-il la marche à suivre ? J'ai beau lire le manuel, je ne vois pas comment faire. [...]
Ce n'est pas possible avec recode. Ce ne devrait pas être trop compliqué avec perl.