Utilitaire de transcription ISO-8859 --> entités Unicode
4 réponses
Sergio
Y'a quelqu'un qui a ça ? J'ai du texte écrit en ISO-8859-1 (en fait
tapé sous Windows bêtement) et il le faut absolument en ASCII pur avec
les caractères accentués en entités Unicode (cad é -> é ).
Je suis sous Windows, éventuellement un source en C, je sais le
compiler...
--
Serge http://leserged.online.fr/
Mon blog: http://cahierdesergio.free.fr/
Soutenez le libre: http://www.framasoft.org
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
Laurent Wacrenier
Sergio écrit:
Y'a quelqu'un qui a ça ? J'ai du texte écrit en ISO-8859-1 (en fait tapé sous Windows bêtement) et il le faut absolument en ASCII pur avec les caractères accentués en entités Unicode (cad é -> é ).
Je suis sous Windows, éventuellement un source en C, je sais le compiler...
Pas testé (tapé au vol), prend les données dans l'entrée standart et les converti sur la sortie standart :
Pour autre chose que du ISO-8859-1, utiliser iconv() au milieu.
Sergio <laposte@serge.delbono.net.invalid> écrit:
Y'a quelqu'un qui a ça ? J'ai du texte écrit en ISO-8859-1 (en fait
tapé sous Windows bêtement) et il le faut absolument en ASCII pur avec
les caractères accentués en entités Unicode (cad é -> é ).
Je suis sous Windows, éventuellement un source en C, je sais le
compiler...
Pas testé (tapé au vol), prend les données dans l'entrée standart et
les converti sur la sortie standart :
Y'a quelqu'un qui a ça ? J'ai du texte écrit en ISO-8859-1 (en fait tapé sous Windows bêtement) et il le faut absolument en ASCII pur avec les caractères accentués en entités Unicode (cad é -> é ).
Je suis sous Windows, éventuellement un source en C, je sais le compiler...
Pas testé (tapé au vol), prend les données dans l'entrée standart et les converti sur la sortie standart :
Pour autre chose que du ISO-8859-1, utiliser iconv() au milieu.
Pierre Goiffon
[Copie et suivi sur fr.comp.normes.unicode, qui me semble plus indiqué]
Sergio wrote:
Y'a quelqu'un qui a ça ? J'ai du texte écrit en ISO-8859-1 (en fait tapé sous Windows bêtement) et il le faut absolument en ASCII pur avec les caractères accentués en entités Unicode (cad é -> é ).
Je suis sous Windows, éventuellement un source en C, je sais le compiler...
Voir la liste des caractères en ISO Latin-1, et comparer les no de caractères avec les code points Unicode : http://www.unicode.org/Public/MAPPINGS/ISO8859/8859-1.TXT
La solution vient vite :) Une petite moulinette en WSH devrait faire l'affaire.
[Copie et suivi sur fr.comp.normes.unicode, qui me semble plus indiqué]
Sergio wrote:
Y'a quelqu'un qui a ça ? J'ai du texte écrit en ISO-8859-1 (en fait tapé
sous Windows bêtement) et il le faut absolument en ASCII pur avec les
caractères accentués en entités Unicode (cad é -> é ).
Je suis sous Windows, éventuellement un source en C, je sais le compiler...
Voir la liste des caractères en ISO Latin-1, et comparer les no de
caractères avec les code points Unicode :
http://www.unicode.org/Public/MAPPINGS/ISO8859/8859-1.TXT
La solution vient vite :)
Une petite moulinette en WSH devrait faire l'affaire.
[Copie et suivi sur fr.comp.normes.unicode, qui me semble plus indiqué]
Sergio wrote:
Y'a quelqu'un qui a ça ? J'ai du texte écrit en ISO-8859-1 (en fait tapé sous Windows bêtement) et il le faut absolument en ASCII pur avec les caractères accentués en entités Unicode (cad é -> é ).
Je suis sous Windows, éventuellement un source en C, je sais le compiler...
Voir la liste des caractères en ISO Latin-1, et comparer les no de caractères avec les code points Unicode : http://www.unicode.org/Public/MAPPINGS/ISO8859/8859-1.TXT
La solution vient vite :) Une petite moulinette en WSH devrait faire l'affaire.
Sergio
Laurent Wacrenier a écrit :
Y'a quelqu'un qui a ça ? J'ai du texte écrit en ISO-8859-1 (en fait tapé sous Windows bêtement) et il le faut absolument en ASCII pur avec les caractères accentués en entités Unicode (cad é -> é ).
Pas testé (tapé au vol), prend les données dans l'entrée standart et les converti sur la sortie standart :
-- Serge http://leserged.online.fr/ Mon blog: http://cahierdesergio.free.fr/ Soutenez le libre: http://www.framasoft.org
Laurent Wacrenier a écrit :
Y'a quelqu'un qui a ça ? J'ai du texte écrit en ISO-8859-1 (en fait
tapé sous Windows bêtement) et il le faut absolument en ASCII pur avec
les caractères accentués en entités Unicode (cad é -> é ).
Pas testé (tapé au vol), prend les données dans l'entrée standart et
les converti sur la sortie standart :
Y'a quelqu'un qui a ça ? J'ai du texte écrit en ISO-8859-1 (en fait tapé sous Windows bêtement) et il le faut absolument en ASCII pur avec les caractères accentués en entités Unicode (cad é -> é ).
Pas testé (tapé au vol), prend les données dans l'entrée standart et les converti sur la sortie standart :
-- Serge http://leserged.online.fr/ Mon blog: http://cahierdesergio.free.fr/ Soutenez le libre: http://www.framasoft.org
loufoque
Sergio a dit le 18/02/2005 à 15:30:
Y'a quelqu'un qui a ça ? J'ai du texte écrit en ISO-8859-1 (en fait tapé sous Windows bêtement) et il le faut absolument en ASCII pur avec les caractères accentués en entités Unicode (cad é -> é ).
Voici une solution en PHP [1]. Commence par convertir en UTF-8 (utf8_encode) Ensuite convertis en Unicode avec utf8_to_unicode Puis utilise unicode_to_entities_preserving_ascii
Y'a quelqu'un qui a ça ? J'ai du texte écrit en ISO-8859-1 (en fait tapé
sous Windows bêtement) et il le faut absolument en ASCII pur avec les
caractères accentués en entités Unicode (cad é -> é ).
Voici une solution en PHP [1].
Commence par convertir en UTF-8 (utf8_encode)
Ensuite convertis en Unicode avec utf8_to_unicode
Puis utilise unicode_to_entities_preserving_ascii
Y'a quelqu'un qui a ça ? J'ai du texte écrit en ISO-8859-1 (en fait tapé sous Windows bêtement) et il le faut absolument en ASCII pur avec les caractères accentués en entités Unicode (cad é -> é ).
Voici une solution en PHP [1]. Commence par convertir en UTF-8 (utf8_encode) Ensuite convertis en Unicode avec utf8_to_unicode Puis utilise unicode_to_entities_preserving_ascii