j'ai tente un recode -f UTF-8 <fic>
et apres 15mn de moulinage mon parser se plante au meme endroit...
D'ou ma question, il y a t'il des outils plus avances que file / recode
pour manipuler les charsets ?des algos de detection plus aboutis...
j'ai tente un recode -f UTF-8 <fic>
et apres 15mn de moulinage mon parser se plante au meme endroit...
D'ou ma question, il y a t'il des outils plus avances que file / recode
pour manipuler les charsets ?des algos de detection plus aboutis...
j'ai tente un recode -f UTF-8 <fic>
et apres 15mn de moulinage mon parser se plante au meme endroit...
D'ou ma question, il y a t'il des outils plus avances que file / recode
pour manipuler les charsets ?des algos de detection plus aboutis...
Bonjour a tous,
j'ai un souci avec un fichier (export enorme en XMl de data venant
d'un systeme proprio sous Windows) je dois parser ce fichier et j'ai
des plantages ...
J'ai tente un :
file -bi <monfic>
il me dit ISO-8859-1
les editeurs de texte genre UltraEdit le voient en ISO-8859-15
j'ai tente un recode -f UTF-8 <fic>
et apres 15mn de moulinage mon parser se plante au meme endroit...
D'ou ma question, il y a t'il des outils plus avances que file /
recode pour manipuler les charsets ?des algos de detection plus
aboutis... bref je ne sais pas quelle tactique adoptee car changer le
file.encoding de ma JVM ne marche pas en fonctionnant a tatons
cordialement
J.MOLIERE - Mentor/J
Bonjour a tous,
j'ai un souci avec un fichier (export enorme en XMl de data venant
d'un systeme proprio sous Windows) je dois parser ce fichier et j'ai
des plantages ...
J'ai tente un :
file -bi <monfic>
il me dit ISO-8859-1
les editeurs de texte genre UltraEdit le voient en ISO-8859-15
j'ai tente un recode -f UTF-8 <fic>
et apres 15mn de moulinage mon parser se plante au meme endroit...
D'ou ma question, il y a t'il des outils plus avances que file /
recode pour manipuler les charsets ?des algos de detection plus
aboutis... bref je ne sais pas quelle tactique adoptee car changer le
file.encoding de ma JVM ne marche pas en fonctionnant a tatons
cordialement
J.MOLIERE - Mentor/J
Bonjour a tous,
j'ai un souci avec un fichier (export enorme en XMl de data venant
d'un systeme proprio sous Windows) je dois parser ce fichier et j'ai
des plantages ...
J'ai tente un :
file -bi <monfic>
il me dit ISO-8859-1
les editeurs de texte genre UltraEdit le voient en ISO-8859-15
j'ai tente un recode -f UTF-8 <fic>
et apres 15mn de moulinage mon parser se plante au meme endroit...
D'ou ma question, il y a t'il des outils plus avances que file /
recode pour manipuler les charsets ?des algos de detection plus
aboutis... bref je ne sais pas quelle tactique adoptee car changer le
file.encoding de ma JVM ne marche pas en fonctionnant a tatons
cordialement
J.MOLIERE - Mentor/J
Le Tue, 23 Jul 2013 17:22:58 +0200,
jerome moliere a écrit :
> Bonjour a tous,
> j'ai un souci avec un fichier (export enorme en XMl de data venant
> d'un systeme proprio sous Windows) je dois parser ce fichier et j'ai
> des plantages ...
> J'ai tente un :
> file -bi <monfic>
> il me dit ISO-8859-1
>
> les editeurs de texte genre UltraEdit le voient en ISO-8859-15
>
> j'ai tente un recode -f UTF-8 <fic>
> et apres 15mn de moulinage mon parser se plante au meme endroit...
>
> D'ou ma question, il y a t'il des outils plus avances que file /
> recode pour manipuler les charsets ?des algos de detection plus
> aboutis... bref je ne sais pas quelle tactique adoptee car changer le
> file.encoding de ma JVM ne marche pas en fonctionnant a tatons
>
> cordialement
> J.MOLIERE - Mentor/J
Bonjour,
ne serait pas possible d'employer Iconv et de réencoder
le fichier originel balte 1252 vers utf8 ?
slt
bernard
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists
Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive:
http://lists.debian.org/ fr
Le Tue, 23 Jul 2013 17:22:58 +0200,
jerome moliere <jerome.moliere@gmail.com> a écrit :
> Bonjour a tous,
> j'ai un souci avec un fichier (export enorme en XMl de data venant
> d'un systeme proprio sous Windows) je dois parser ce fichier et j'ai
> des plantages ...
> J'ai tente un :
> file -bi <monfic>
> il me dit ISO-8859-1
>
> les editeurs de texte genre UltraEdit le voient en ISO-8859-15
>
> j'ai tente un recode -f UTF-8 <fic>
> et apres 15mn de moulinage mon parser se plante au meme endroit...
>
> D'ou ma question, il y a t'il des outils plus avances que file /
> recode pour manipuler les charsets ?des algos de detection plus
> aboutis... bref je ne sais pas quelle tactique adoptee car changer le
> file.encoding de ma JVM ne marche pas en fonctionnant a tatons
>
> cordialement
> J.MOLIERE - Mentor/J
Bonjour,
ne serait pas possible d'employer Iconv et de réencoder
le fichier originel balte 1252 vers utf8 ?
slt
bernard
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists
Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers debian-user-french-REQUEST@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmaster@lists.debian.org
Archive:
http://lists.debian.org/20130723180431.75f8122d.bernard.schoenacker@free. fr
Le Tue, 23 Jul 2013 17:22:58 +0200,
jerome moliere a écrit :
> Bonjour a tous,
> j'ai un souci avec un fichier (export enorme en XMl de data venant
> d'un systeme proprio sous Windows) je dois parser ce fichier et j'ai
> des plantages ...
> J'ai tente un :
> file -bi <monfic>
> il me dit ISO-8859-1
>
> les editeurs de texte genre UltraEdit le voient en ISO-8859-15
>
> j'ai tente un recode -f UTF-8 <fic>
> et apres 15mn de moulinage mon parser se plante au meme endroit...
>
> D'ou ma question, il y a t'il des outils plus avances que file /
> recode pour manipuler les charsets ?des algos de detection plus
> aboutis... bref je ne sais pas quelle tactique adoptee car changer le
> file.encoding de ma JVM ne marche pas en fonctionnant a tatons
>
> cordialement
> J.MOLIERE - Mentor/J
Bonjour,
ne serait pas possible d'employer Iconv et de réencoder
le fichier originel balte 1252 vers utf8 ?
slt
bernard
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists
Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive:
http://lists.debian.org/ fr
merci a vous, en fait le probleme n'etait pas de l'encoding
mais de la donnee reellement pourrie et comment l'exploiter
avec un fichier XML de 4Go, vue la volumetrie du fichier [â¦]
merci a vous, en fait le probleme n'etait pas de l'encoding
mais de la donnee reellement pourrie et comment l'exploiter
avec un fichier XML de 4Go, vue la volumetrie du fichier [â¦]
merci a vous, en fait le probleme n'etait pas de l'encoding
mais de la donnee reellement pourrie et comment l'exploiter
avec un fichier XML de 4Go, vue la volumetrie du fichier [â¦]
âjour,
Le mercredi 24 juillet 2013 10:41:53 jerome moliere a écrit :
> merci a vous, en fait le probleme n'etait pas de l'encoding
> mais de la donnee reellement pourrie et comment l'exploiter
> avec un fichier XML de 4Go, vue la volumetrie du fichier [â¦]
Bonheurifié que ta problématique a été solutionnali sée dans
une temporalité écourtée mais câest le *volume* de s données ou
la taille du fichier. La volumétrie, câest la mesure du volu me,
donc la méthode ou la technique utilisée, pas le résultat.
Juste parce que cette dérive mâénerveâ¦
[Au passage, ce serait bien dâapprendre à citerâ¦]
--
Sylvain Sauvage
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists
Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
âjour,
Le mercredi 24 juillet 2013 10:41:53 jerome moliere a écrit :
> merci a vous, en fait le probleme n'etait pas de l'encoding
> mais de la donnee reellement pourrie et comment l'exploiter
> avec un fichier XML de 4Go, vue la volumetrie du fichier [â¦]
Bonheurifié que ta problématique a été solutionnali sée dans
une temporalité écourtée mais câest le *volume* de s données ou
la taille du fichier. La volumétrie, câest la mesure du volu me,
donc la méthode ou la technique utilisée, pas le résultat.
Juste parce que cette dérive mâénerveâ¦
[Au passage, ce serait bien dâapprendre à citerâ¦]
--
Sylvain Sauvage
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists
Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers debian-user-french-REQUEST@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmaster@lists.debian.org
Archive: http://lists.debian.org/1374668297.777KbM182G@earendil
âjour,
Le mercredi 24 juillet 2013 10:41:53 jerome moliere a écrit :
> merci a vous, en fait le probleme n'etait pas de l'encoding
> mais de la donnee reellement pourrie et comment l'exploiter
> avec un fichier XML de 4Go, vue la volumetrie du fichier [â¦]
Bonheurifié que ta problématique a été solutionnali sée dans
une temporalité écourtée mais câest le *volume* de s données ou
la taille du fichier. La volumétrie, câest la mesure du volu me,
donc la méthode ou la technique utilisée, pas le résultat.
Juste parce que cette dérive mâénerveâ¦
[Au passage, ce serait bien dâapprendre à citerâ¦]
--
Sylvain Sauvage
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists
Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/