Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

cherche sites avec encodages variés

15 réponses
Avatar
Une Bévue
Comme ruby n'utilisera plus iconv dans le futur, il me faudra utiliser
String#encode pour les conversions.

J'aimerais tester ça avec des encodages connus pour convertir en UTF-8.

Connaissez-vous des sites d'encodages connus ?

5 réponses

1 2
Avatar
Pierre Goiffon
Le 25/06/2012 19:05, Une Bévue a écrit :
c'est pour tester un/des scripts ruby que je dois mettre à jour suite à
l'évolution future de ruby en matière de transcodage.



Pas clair ce que vous voulez tester...
Si c'est simplement prendre un flux dans en codage et le sortir
convertit dans un autre codage, alors vous pouvez utiliser un éditeur
comme Unired (http://www.esperanto.mv.ru/UniRed/ENG/) qui gère un très
vaste panel de charset et permet donc de générer des fichiers dans à peu
près tout ce que l'on veut.
Avatar
SAM
Le 02/07/12 10:14, Pierre Goiffon a écrit :
Le 25/06/2012 19:05, Une Bévue a écrit :
c'est pour tester un/des scripts ruby que je dois mettre à jour suite à
l'évolution future de ruby en matière de transcodage.



Pas clair ce que vous voulez tester...
Si c'est simplement prendre un flux dans en codage et le sortir
convertit dans un autre codage, alors vous pouvez utiliser un éditeur



non, Yvon veut ça "tout en automatique"
il a déjà une routine qui le fait
mais suite à une évolution du langage de programmation utilisé il doit
tester sa nouvelle routine

comme Unired (http://www.esperanto.mv.ru/UniRed/ENG/) qui gère un très
vaste panel de charset et permet donc de générer des fichiers dans à peu
près tout ce que l'on veut.



Si Unired sait capter un fichier (une liste de fichiers) html sur le Net
puis le sauvegarder sur disque-dur tout en le convertissant en utf-8 (et
correction des meta charset) ça devrait aider

sauf ... que ... c'est pas du Ruby ;-)


De plus Unired <http://www.esperanto.mv.ru/UniRed/FRA/>
c'est un prg pour Windows ... pas glop ! :-/
(ça va pas l'faire sur nos Macs là !)

--
Stéphane Moriaux avec/with iMac-intel
Avatar
Une Bévue
Le 02/07/2012 15:19, SAM a écrit :
non, Yvon veut ça "tout en automatique"
il a déjà une routine qui le fait
mais suite à une évolution du langage de programmation utilisé il doit
tester sa nouvelle routine


Oui c'est exactement ça.

en fait précédemment ruby utilisait iconv et, dans le futur proche
String#encode('UTF-8', <charset d'origine>)

bon, j'ai testé mon script sur les pages données par Andreas Prilop tout
au début du fil : <4fe5ad9a$0$1744$.

Soit :

http://www.user.uni-hannover.de/nhtcapri/arabic.iso.html
http://www.user.uni-hannover.de/nhtcapri/arabic.win.html
http://www.user.uni-hannover.de/nhtcapri/baltic.iso.html
http://www.user.uni-hannover.de/nhtcapri/baltic.win.html
http://www.user.uni-hannover.de/nhtcapri/central-european.iso.html
http://www.user.uni-hannover.de/nhtcapri/central-european.mac.html
http://www.user.uni-hannover.de/nhtcapri/central-european.win.html
http://www.user.uni-hannover.de/nhtcapri/cyrillic.iso.html
http://www.user.uni-hannover.de/nhtcapri/cyrillic.koi.html
http://www.user.uni-hannover.de/nhtcapri/cyrillic.mac.html
http://www.user.uni-hannover.de/nhtcapri/cyrillic.win.html
http://www.user.uni-hannover.de/nhtcapri/greek.iso.html
http://www.user.uni-hannover.de/nhtcapri/greek.mac.html
http://www.user.uni-hannover.de/nhtcapri/greek.win.html
http://www.user.uni-hannover.de/nhtcapri/hebrew.iso.html
http://www.user.uni-hannover.de/nhtcapri/hebrew.win.html
http://www.user.uni-hannover.de/nhtcapri/south-european.iso.html
http://www.user.uni-hannover.de/nhtcapri/turkish.iso.html
http://www.user.uni-hannover.de/nhtcapri/turkish.mac.html
http://www.user.uni-hannover.de/nhtcapri/vietnamese.win.html

Mon script "marche" pour tous les encodages iso vers UTF-8, certains ne
sont pas reconnus, mais bon le vietnamien, je n'utilise pas ...

Comme Ruby est d'origine japonaise, je doute que ça ne s'améliore pas au
fil du temps.

J'ai donc basculé mon script, ça roule en "real life".
Avatar
Pierre Goiffon
Le 02/07/2012 16:57, Une Bévue a écrit :
non, Yvon veut ça "tout en automatique"
il a déjà une routine qui le fait
mais suite à une évolution du langage de programmation utilisé il doit
tester sa nouvelle routine





Ok !

en fait précédemment ruby utilisait iconv et, dans le futur proche
String#encode('UTF-8', <charset d'origine>)



Ok...
Je ne sais pas ce qu'il est possible d'intégrer comme librairie en Ruby,
mais en Java il existe quelques librairies comme Rhino.
Avatar
Une Bévue
Le 06/07/12 16:30, Pierre Goiffon a écrit :
Je ne sais pas ce qu'il est possible d'intégrer comme librairie en Ruby,
mais en Java il existe quelques librairies comme Rhino.


Euh, Rhino, j'ai utilisé jadis, c'est pour le JS non ?
ça fait aussi du transcodage ?

Mais bon, ça roule en ruby, heureusement d'ailleurs, le concepteur étant
japonais...
1 2