Rendre l'encodage d'un fichier texte valide

Le
Vincent Lefevre
Bonjour,

Est-ce que quelqu'un connaîtrait un utilitaire pour rendre l'encodage
d'un fichier texte valide (par exemple, en enlevant les séquences
invalides ou en les remplaçant par tel ou tel caractère valide).

iconv refuse de convertir tout fichier contenant des séquences
invalides.

Quand à recode, il laisse les caractères invalides inchangés (je viens
de rapporter le bug, car le manuel dit qu'il ne devrait pas générer de
sortie invalide). Bref, en théorie, recode -f utf-8..utf-8 (dans le
cas d'un fichier en utf-8) devrait être la solution, mais ça ne fait
rien.

Idem pour konwert.

--
Vincent Lefèvre <vincent@vinc17.org> - Web: <http://www.vinc17.org/>
100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17,
Championnat International des Jeux Mathématiques et Logiques, etc.
Work: CR INRIA - computer arithmetic / SPACES project at LORIA


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Xavier Maillard
Le #7519391
On 27 jui 2004, Vincent Lefevre wrote:

Bonjour,



Plop,

[ ... ]

Idem pour konwert.



Et à grands renforts de sed/awk ?

--
In Gruuik we trust



--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Vincent Lefevre
Le #7519141
On 2004-07-27 21:35:26 +0200, Xavier Maillard wrote:
Et à grands renforts de sed/awk ?



Je me demandais surtout s'il existait un utilitaire déjà écrit.
Mais bon, ceci le fait (pour l'encodage local, en supposant qu'il
est différent de ucs, ce qui est le cas en pratique):

charset=`locale charmap`
recode -f "${charmap}..ucs,ucs..${charmap}" "$1"

--
Vincent Lefèvre 100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17,
Championnat International des Jeux Mathématiques et Logiques, etc.
Work: CR INRIA - computer arithmetic / SPACES project at LORIA


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Publicité
Poster une réponse
Anonyme