OVH Cloud OVH Cloud

nom de fichier en japonais sur ext3

13 réponses
Avatar
Philippe ROGER
Bonjour à tous,

je dispose de la mandrake 9.2 version powerpack et j'ai formaté mes
partitions avec le système de fichier ext3.
Je suis un grand adèpte de musique japonaise et je possède quelques
"mp3" dont les noms et les id3 sont écrient en japonais. Linux est
incapable de m'afficher les kanjis et autres kanas, à la place il
m'affiche des caractère spéciaux. Windows me fesait exactement la même
chose.

exemple d'un fichier:
version linux: 06-:03b1°¬+:2590:03c0.mp3
version windows: 06-Ó°¬+ÌÒ.mp3

Bon, ça je m'en fiche un peu. Ce qui me gène vraiment c'est que Windows
était capable de jouer, renommer et déplacer ces fichiers normalement
alors que linux lui en est incapable!! Voici le message d'erreur:
"06-:03b1°¬+:2590:03c0.mp3 ne semble pas exister!"

J'ai essayé de passer mon système linux en japonais en utilisant
localeDrake, mais rien n'y fait.
Je voulais donc savoir si quelqu'un avait la solution à ce problème, car
je suis surpris de ne trouver aucune pleinte sur le net. Suis le seul à
avoir ce rpoblème?

Merci d'avance pour vos réponse.

10 réponses

1 2
Avatar
Nicolas George
Philippe ROGER wrote in message <cbsfnn$klo$:
version linux: 06-:03b1°¬+:2590:03c0.mp3


Que donne « ls | xxd » ? Et saurais-tu, par hasard, ré-écrire le nom
original (ça aiderait pour comparer).

Avatar
Philippe ROGER
Philippe ROGER wrote in message <cbsfnn$klo$:

version linux: 06-:03b1°¬+:2590:03c0.mp3



Que donne « ls | xxd » ?


Je vais plutot utiliser un autre dossier dans lequel il y a des
sous-dossiers dont les noms ont des kanjis:

version linux (ls -l):

total 36
drwxrwxrwx 1 root root 4096 fév 16 16:40 1980 - Southern
All Stars ga yatte kuru - nyaa! nyaa! nyaa/
drwxrwxrwx 1 root root 4096 fév 16 16:40 1982.07.28 - NHK
FM Live/
drwxrwxrwx 1 root root 4096 fév 16 16:39 1989 ~ 1990 -
Itchae '89 Sazan de '90/
drwxrwxrwx 1 root root 4096 mar 26 22:09 1991 - The
Ongakusai/
drwxrwxrwx 1 root root 4096 fév 16 16:40 1993 - Utau
Nihon Series (%:2590':2567"ú-{:0192V:0192S?[:0192Y)/
drwxrwxrwx 1 root root 4096 fév 16 16:40 1998.08.08, 09 -
Super Live in Nagisaen/
drwxrwxrwx 1 root root 4096 fév 16 16:39 1999.05.26,27 -
Se O no Luja na Quites ?`'f"G':2558?t':2590^:2321?£?`/
drwxrwxrwx 1 root root 4096 fév 16 16:40 2000.08.20 -
Chigasaki live/
drwxrwxrwx 1 root root 4096 fév 16 16:40 2000.12.31 -
Toshikoshi Live - Gonta-kun no Tsudoi/

Voila, je precise également que ces dossiers se trouve physiquement sur
une partition windows au format NTFS. J'utilise donc SAMBA pour y
acceder sous linux mais je ne peut pas entrer dans les sous-dossiers
dont les noms possèdent des kanjis!! d'ailleurs je ne peut pas non plus
les copiers ou les renommer, tout comme les fichiers!

Sinon, je ne sais pas trop à quoi correspond cette commande (ls|xxd),
donc je l'ai tapé telle quelle et le résultat est:

0000000: 3139 3830 202d 2053 6f75 7468 6572 6e20 1980 - Southern
0000010: 416c 6c20 5374 6172 7320 6761 2079 6174 All Stars ga yat
0000020: 7465 206b 7572 7520 2d20 6e79 6161 2120 te kuru - nyaa!
0000030: 6e79 6161 2120 6e79 6161 2f0a 3139 3832 nyaa! nyaa/.1982
0000040: 2e30 372e 3238 202d 204e 484b 2046 4d20 .07.28 - NHK FM
0000050: 4c69 7665 2f0a 3139 3839 207e 2031 3939 Live/.1989 ~ 199
0000060: 3020 2d20 4974 6368 6165 2027 3839 2053 0 - Itchae '89 S
0000070: 617a 616e 2064 6520 2739 302f 0a31 3939 azan de '90/.199
0000080: 3120 2d20 5468 6520 4f6e 6761 6b75 7361 1 - The Ongakusa
0000090: 692f 0a31 3939 3320 2d20 5574 6175 204e i/.1993 - Utau N
00000a0: 6968 6f6e 2053 6572 6965 7320 2825 3a32 ihon Series (%:2
00000b0: 3539 3027 3a32 3536 3722 fa2d 7b3a 3031 590':2567"ú-{:01
00000c0: 3932 563a 3031 3932 533f 5b3a 3031 3932 92V:0192S?[:0192
00000d0: 5929 2f0a 3139 3938 2e30 382e 3038 2c20 Y)/.1998.08.08,
00000e0: 3039 202d 2053 7570 6572 204c 6976 6520 09 - Super Live
00000f0: 696e 204e 6167 6973 6165 6e2f 0a31 3939 in Nagisaen/.199
0000100: 392e 3035 2e32 362c 3237 202d 2053 6520 9.05.26,27 - Se
0000110: 4f20 6e6f 204c 756a 6120 6e61 2051 7569 O no Luja na Qui
0000120: 7465 7320 3f60 2766 2247 273a 3235 3538 tes ?`'f"G':2558
0000130: 3f74 273a 3235 3930 5e3a 3233 3231 3fa3 ?t':2590^:2321?.
0000140: 3f60 2f0a 3230 3030 2e30 382e 3230 202d ?`/.2000.08.20 -
0000150: 2043 6869 6761 7361 6b69 206c 6976 652f Chigasaki live/
0000160: 0a32 3030 302e 3132 2e33 3120 2d20 546f .2000.12.31 - To
0000170: 7368 696b 6f73 6869 204c 6976 6520 2d20 shikoshi Live -
0000180: 476f 6e74 612d 6b75 6e20 6e6f 2054 7375 Gonta-kun no Tsu
0000190: 646f 692f 0a74 656d 702e 7478 742a 0a doi/.temp.txt*.

Et saurais-tu, par hasard, ré-écrire le nom
original (ça aiderait pour comparer).


Désolé je ne sais pas encore comment ecrire des kanjis sous linux ^^;;
mais si tu parles et lis le japonais voici en roumaji ce qui est ecrit
pour ce repertoire:
1993 - Utau Nihon Series (%:2590':2567"ú-{:0192V:0192S?[:0192Y)/

Il est tout simplement ecrit:
(Utau Nihon shirizu) "utau" en kanjis, "nihon" en kanjis, "shirizu" en
katakana.

Voila j'éspère que j'ai pu aider ^^;;;


Avatar
Nicolas George
[Warning : UTF-8 ahead]

Philippe ROGER wrote in message <cbsl7c$1d9$:
Sinon, je ne sais pas trop à quoi correspond cette commande (ls|xxd),
donc je l'ai tapé telle quelle et le résultat est:


Ça permet d'afficher le code des octets écrits par ls, et ça devrait
permettre de se rendre comte s'il y a des caractères bizaroïdes qui ne
passent pas au copier-coller. Mais je me rends compte que ce n'est pas
suffisant : selon la config ls lui-même peut filtrer certains
caractères. C'est ennuyeux, je ne vois que perl à qui faire entièrement
confiance.

perl -e 'for (<*Utau*>) { for (split "", $_) { printf "%2.2x ", ord };
print "n" }'

(à taper sur une seule ligne) devrait faire l'affaire. Ceci dit, avec ce
qu'on peut déjà voir ici, je n'arrive vraiment pas à saisir quel
encodage c'est.

Désolé je ne sais pas encore comment ecrire des kanjis sous linux ^^;;


<URL: http://www.tuteurs.ens.fr/unix/editeurs/unicode.html > peut aider
pour apprendre.

1993 - Utau Nihon Series (%:2590':2567"ú-{:0192V:0192S?[:0192Y)/

Il est tout simplement ecrit:
(Utau Nihon shirizu) "utau" en kanjis, "nihon" en kanjis, "shirizu" en
katakana.


Je ne lis pas le japonais, mais je sais me servir d'une méthode
d'entrée. En l'occurence, celle que j'ai sous la main me propose :

utau -> 歌う, 謡う, 謳う, 唄う, 唱う ou 詠う
nihon -> 日本 ou 二本

Mais je suis bien incapable de trancher. Quant à shirizu, j'imagine que
c'est « しりず » ?

Entre tout ça, il serait intéressant également de préciser exactement
quelles ponctuations/espaces peuvent se trouver.

Ceci dit, si le but est uniquement d'arriver à entrer dans le
répertoire, ou à le renommer, deux solutions immédiates se présentent,
qui ne nécessitent pas de comprendre comment c'est codé :

- Écrire « *Utau* », ou tout autre motif qui identifie uniquement le
répertoire (« *"Utau N"?"hon Series"* » par exemple pour être plus
précis.

- Taper les premières lettres du nom, puis la touche tabulation jusqu'à
ce que le shell complète en ce qu'il faut.

Ceci dit, les deux sont assez peu satisfaisants d'un point de vue
intellectuel.

Avatar
Philippe ROGER
[Warning : UTF-8 ahead]

Philippe ROGER wrote in message <cbsl7c$1d9$:

Sinon, je ne sais pas trop à quoi correspond cette commande (ls|xxd),
donc je l'ai tapé telle quelle et le résultat est:



Ça permet d'afficher le code des octets écrits par ls, et ça devrait
permettre de se rendre comte s'il y a des caractères bizaroïdes qui ne
passent pas au copier-coller. Mais je me rends compte que ce n'est pas
suffisant : selon la config ls lui-même peut filtrer certains
caractères. C'est ennuyeux, je ne vois que perl à qui faire entièrement
confiance.

perl -e 'for (<*Utau*>) { for (split "", $_) { printf "%2.2x ", ord };
print "n" }'

(à taper sur une seule ligne) devrait faire l'affaire. Ceci dit, avec ce
qu'on peut déjà voir ici, je n'arrive vraiment pas à saisir quel
encodage c'est.


voici les resultat:
31 39 39 33 20 2d 20 55 74 61 75 20 4e 69 68 6f 6e 20 53 65 72 69 65 73
20 28 25 3a 32 35 39 30 27 3a 32 35 36 37 22 fa 2d 7b 3a 30 31 39 32 56
3a 30 31 39 32 53 3f 5b 3a 30 31 39 32 59 29

sinon pour l'encodage, ca ne peut-être qu'un encodage japonais.

Désolé je ne sais pas encore comment ecrire des kanjis sous linux ^^;;



<URL: http://www.tuteurs.ens.fr/unix/editeurs/unicode.html > peut aider
pour apprendre.


Oui en fait je connais plein de site mais comme je viens de passer
complètement sous linux il n'y a que 2 jours, je ne connais pas encore
toutes les téchniques ^^;

1993 - Utau Nihon Series (%:2590':2567"ú-{:0192V:0192S?[:0192Y)/

Il est tout simplement ecrit:
(Utau Nihon shirizu) "utau" en kanjis, "nihon" en kanjis, "shirizu" en
katakana.



Je ne lis pas le japonais, mais je sais me servir d'une méthode
d'entrée. En l'occurence, celle que j'ai sous la main me propose :

utau -> 歌う, 謡う, 謳う, 唄う, 唱う ou 詠う
nihon -> 日本 ou 二本

Mais je suis bien incapable de trancher. Quant à shirizu, j'imagine que
c'est « しりず » ?


hop un petit copier collé et voici ce que ca donne en japonais:
歌う日本しりず
(en fait le "shiriizu" doit s'ecririre en katakana et pas en hiragana,
mais c'est pas grave)

Entre tout ça, il serait intéressant également de préciser exactement
quelles ponctuations/espaces peuvent se trouver.


il n'y a ici aucun espace ni ponctuation dans ce texte japonais

Ceci dit, si le but est uniquement d'arriver à entrer dans le
répertoire, ou à le renommer, deux solutions immédiates se présentent,
qui ne nécessitent pas de comprendre comment c'est codé :

- Écrire « *Utau* », ou tout autre motif qui identifie uniquement le
répertoire (« *"Utau N"?"hon Series"* » par exemple pour être plus
précis.

- Taper les premières lettres du nom, puis la touche tabulation jusqu'à
ce que le shell complète en ce qu'il faut.

Ceci dit, les deux sont assez peu satisfaisants d'un point de vue
intellectuel.


Ce qui me gène le plus c'est de ne pas pouvoir ouvrir (lire) ces mp3 et
de ne pas pouvoir entrer dans ces dossiers. Qu'il ne m'affiche pas les
kanjis, ça je m'en fiche complètement, ce que je voudrais c'est qu'il
traite ces fichiers et dossiers comme n'importe quel autre fichier ou
dossier!
Ne me dite pas que la solution se trouve dans la config du kernel!! (je
veux pas le recompiler please T____T).


Avatar
Michel Tatoute

Bonjour à tous,

Bonjour,


je dispose de la mandrake 9.2 version powerpack et j'ai formaté mes
partitions avec le système de fichier ext3.
Je suis un grand adèpte de musique japonaise et je possède quelques
"mp3" dont les noms et les id3 sont écrient en japonais. Linux est
incapable de m'afficher les kanjis et autres kanas, à la place il
m'affiche des caractère spéciaux. Windows me fesait exactement la même
chose.

exemple d'un fichier:
version linux: 06-:03b1°¬+:2590:03c0.mp3
version windows: 06-Ó°¬+ÌÒ.mp3



Tout d'abord, je te conseillerais de tenter le transfert de tes fichiers
de win à linux via un zip, ou par montage direct des partitions fat (si
ce sont des fat) sur ton linux. Mais le mieux serait zip (ou autre
archiveur).

Ainsi tes fichiers devraient suivre.


Pour ce qui est des noms de fichiers sur ext3, fondementalement ils
sontcapables d'absormer n'importe quel chaine de caractères 8 bits à
l'exception des caracteres :
slash '/' (on comprend pourquoi)
et
zero binaire (fin de la chaine) ''

Tous les autres carateres sonbt autorises.

Malheureusement, l'encodage des kanji (que je connais pas) vers 8 bits
pourrait tres facilement faire appoaraitre un slash.. et selon le cas , un
zero (ca depend de l'encodage, en unicode 16 raw... le 0 est possible,
par exemple les carateres ASCCI vont faire apparaitre un 0 sur le 1er
octet.


Bon, ça je m'en fiche un peu. Ce qui me gène vraiment c'est que Windows
était capable de jouer, renommer et déplacer ces fichiers normalement
alors que linux lui en est incapable!! Voici le message d'erreur:
"06-:03b1°¬+:2590:03c0.mp3 ne semble pas exister!"


Il n'y a rien d'étonnant quen acces reseau, linux ne puisse gerede tels
fichiers. Samba a beaucoup de travail pour gerer les particularites des
noms de fichiers, surtout a traves un protocole aussi opaque que celui de
M$.


J'ai essayé de passer mon système linux en japonais en utilisant
localeDrake, mais rien n'y fait.
Je voulais donc savoir si quelqu'un avait la solution à ce problème, car
je suis surpris de ne trouver aucune pleinte sur le net. Suis le seul à
avoir ce rpoblème?

Merci d'avance pour vos réponse.


de rien.
Michel.

Avatar
Michel Tatoute

[Warning : UTF-8 ahead]

Philippe ROGER wrote in message <cbsl7c$1d9$:

Sinon, je ne sais pas trop à quoi correspond cette commande (ls|xxd),
donc je l'ai tapé telle quelle et le résultat est:



Ça permet d'afficher le code des octets écrits par ls, et ça devrait
permettre de se rendre comte s'il y a des caractères bizaroïdes qui ne
passent pas au copier-coller. Mais je me rends compte que ce n'est pas
suffisant : selon la config ls lui-même peut filtrer certains
caractères. C'est ennuyeux, je ne vois que perl à qui faire entièrement
confiance.

perl -e 'for (<*Utau*>) { for (split "", $_) { printf "%2.2x ", ord };
print "n" }'




malheureusement , la forme <*Utau*> que tu utilises passe par le shell...
elle risque donc d'etre affectée de transformations a problemes.

Utilise plutot:

perl -e 'opendir(DIR,".");foreach (readdir(DIR)){print unpack("H*",$_)."n";}'

Michel.



Avatar
no_spam
On Wed, 30 Jun 2004 12:05:33 +0200, Michel Tatoute wrote:


[Warning : UTF-8 ahead]

Philippe ROGER wrote in message <cbsl7c$1d9$:

Sinon, je ne sais pas trop à quoi correspond cette commande (ls|xxd),
donc je l'ai tapé telle quelle et le résultat est:



Ça permet d'afficher le code des octets écrits par ls, et ça devrait
permettre de se rendre comte s'il y a des caractères bizaroïdes qui ne
passent pas au copier-coller. Mais je me rends compte que ce n'est pas
suffisant : selon la config ls lui-même peut filtrer certains
caractères. C'est ennuyeux, je ne vois que perl à qui faire entièrement
confiance.

perl -e 'for (<*Utau*>) { for (split "", $_) { printf "%2.2x ", ord };
print "n" }'




malheureusement , la forme <*Utau*> que tu utilises passe par le shell...
elle risque donc d'etre affectée de transformations a problemes.

Utilise plutot:

perl -e 'opendir(DIR,".");foreach (readdir(DIR)){print unpack("H*",$_)."n";}'

Michel.


Attention, tout de même, d'expérience, perl a quelques problèmes pour
gérer correctement l'UTF-8.
Et il faut sans doute que la NLS du kernel soit utf-8 justement,
pour que ça marche bien.
Si c'est le cas, le shell ne devrait avoir aucun problème (le terminal,
par contre...). Je n'ai pas testé en japonais, mais avec d'autres langues,
si le kernel est bien configuré, l'accès aux fichiers en UTF8 par
le shell marche nickel.




Avatar
Nicolas George
Michel Tatoute wrote in message
:
malheureusement , la forme <*Utau*> que tu utilises passe par le shell...


Ce n'est plus le cas depuis (consultation de perldelta) perl 5.6. Pour
un Linux installé depuis quelques jours, c'est un pari assez peu risqué.

Avatar
Nicolas George
no_spam wrote in message :
Attention, tout de même, d'expérience, perl a quelques problèmes pour
gérer correctement l'UTF-8.


Pas de problème ici non plus si c'est un perl récent, la manière dont
UTF-8 est traité est devenue prévisible.

Et il faut sans doute que la NLS du kernel soit utf-8 justement,
pour que ça marche bien.


Mais justement, ça a tout l'air de ne pas être de l'UTF-8.

Avatar
Nicolas George
Philippe ROGER wrote in message <cbu041$16r$:
voici les resultat:
31 39 39 33 20 2d 20 55 74 61 75 20 4e 69 68 6f 6e 20 53 65 72 69 65 73
20 28 25 3a 32 35 39 30 27 3a 32 35 36 37 22 fa 2d 7b 3a 30 31 39 32 56
3a 30 31 39 32 53 3f 5b 3a 30 31 39 32 59 29


Où on peut constater qu'il n'y a vraiment rien de spécial. Un « ú »
perdu au milieu du reste, mais rien de plus. C'est carrément bizarre
comme encodage, je sèche complétement.

sinon pour l'encodage, ca ne peut-être qu'un encodage japonais.


Oui, bien sûr. Le problème, c'est que des encodages japonais, il y en a
pléthore.

hop un petit copier collé et voici ce que ca donne en japonais:
歌う日本しりず
(en fait le "shiriizu" doit s'ecririre en katakana et pas en hiragana,
mais c'est pas grave)


« 歌う日本シリズ », donc ?

il n'y a ici aucun espace ni ponctuation dans ce texte japonais


Ok. Le tout est bien entre parenthèses, quand même ?

Ce qui me gène le plus c'est de ne pas pouvoir ouvrir (lire) ces mp3 et
de ne pas pouvoir entrer dans ces dossiers. Qu'il ne m'affiche pas les
kanjis, ça je m'en fiche complètement, ce que je voudrais c'est qu'il
traite ces fichiers et dossiers comme n'importe quel autre fichier ou
dossier!


En ligne de commande toujours, que donne :

file *Utau*

 ?

Ne me dite pas que la solution se trouve dans la config du kernel!! (je
veux pas le recompiler please T____T).


Il n'y a pas de danger de ce côté là (mais recompiler n'est pas si
inaccessible que ça, il ne faut pas avoir peur), le noyau traite les
noms de fichiers comme des suites d'octets. En revanche, il est possible
que Samba fasse des histoires, ça je n'en sais rien.

1 2