OVH Cloud OVH Cloud

A propos de UTF-8 et des locales

12 réponses
Avatar
Nicolas Roudninski
Bonjour,

J'ai siuvi avec intérêt le fil sur le passage en UTF-8.
Il y a deux, trois petites choses que je ne comprends pas bien (même
après avoir lu la page wiki citée dans la discussion) :

1/ Comment savoir si un nom de fichier est en UTF-8 ou autre ?

2/ Gnome est bien en UTF-8 n'est-ce pas ? Parce que, chez moi, quand je
fais par exemple : convmv -r -f iso-8859-15 -t utf-8 Téléchargements/
le programme répond :
"mv "./Téléchargements" "./Téléchargements"
No changes to your files done. Use --notest to finally rename the files."
Le dossier Téléchargements/ a pourtant été créé par nautilus... Donc, je
me dis que convmv devrait me répondre "ce fichier est déjà en UTF-8 ou
quelquechose comme ça.

Bref, j'en perd mon latin !

si une âme charitable pouvait m'indiquer une voie...

--
Nicolas Roudninski
nroudninski@wanadoo.fr
----------------------
Toute ressemblance avec des fautes d'orthographe, de grammaire
ou de conjugaison existantes ou ayant existé serait entièrement
fortuite et indépendante de la volonté de l'auteur.


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org

10 réponses

1 2
Avatar
sebastien.barthelemy
Nicolas Roudninski writes:

Bonjour,

J'ai siuvi avec intérêt le fil sur le passage en UTF-8.
Il y a deux, trois petites choses que je ne comprends pas bien (même
après avoir lu la page wiki citée dans la discussion) :

1/ Comment savoir si un nom de fichier est en UTF-8 ou autre ?



que dit la commande locale ?

2/ Gnome est bien en UTF-8 n'est-ce pas ?



à mon avis, pas par défaut.

Parce que, chez moi, quand
je fais par exemple : convmv -r -f iso-8859-15 -t utf-8
Téléchargements/
le programme répond :
"mv "./Téléchargements" "./Téléchargemen ts"
No changes to your files done. Use --notest to finally rename the files."
Le dossier Téléchargements/ a pourtant été cré é par nautilus... Donc,
je me dis que convmv devrait me répondre "ce fichier est déjà   en UTF-8
ou quelquechose comme ça.



je ne pense pas que tu sois en utf8

Bref, j'en perd mon latin !



en l'occurence, on dit "j'en perds mon latin1 !"


--
Sébastien BARTHÉLEMY
Avatar
Nicolas Roudninski
Sébastien BARTHÉLEMY a écrit :
Nicolas Roudninski writes:


Bonjour,

J'ai siuvi avec intérêt le fil sur le passage en UTF-8.
Il y a deux, trois petites choses que je ne comprends pas bien (même
après avoir lu la page wiki citée dans la discussion) :

1/ Comment savoir si un nom de fichier est en UTF-8 ou autre ?




que dit la commande locale ?


LANG=fr_FR.UTF-8
LC_CTYPE="fr_FR.UTF-8"
LC_NUMERIC="fr_FR.UTF-8"
LC_TIME="fr_FR.UTF-8"
LC_COLLATE="fr_FR.UTF-8"
LC_MONETARY="fr_FR.UTF-8"
LC_MESSAGES="fr_FR.UTF-8"
LC_PAPER="fr_FR.UTF-8"
LC_NAME="fr_FR.UTF-8"
LC_ADDRESS="fr_FR.UTF-8"
LC_TELEPHONE="fr_FR.UTF-8"
LC_MEASUREMENT="fr_FR.UTF-8"
LC_IDENTIFICATION="fr_FR.UTF-8"
LC_ALL Don, je suis bien en UTF-8 (j'avais vérifié avant de posté ;-) )


2/ Gnome est bien en UTF-8 n'est-ce pas ?




à mon avis, pas par défaut.


Ah, bon ? Mais alors comment faire pour le passer en UTF-8 ?


Parce que, chez moi, quand
je fais par exemple : convmv -r -f iso-8859-15 -t utf-8
Téléchargements/
le programme répond :
"mv "./Téléchargements" "./Téléchargements"
No changes to your files done. Use --notest to finally rename the files."
Le dossier Téléchargements/ a pourtant été créé par nautilus... Donc,
je me dis que convmv devrait me répondre "ce fichier est déjà en UTF-8
ou quelquechose comme ça.




je ne pense pas que tu sois en utf8


Ben moi non plus, c'est bien ça qui me chagrine !


Bref, j'en perd mon latin !




en l'occurence, on dit "j'en perds mon latin1 !"


Correct !

--
Nicolas Roudninski

----------------------
Toute ressemblance avec des fautes d'orthographe, de grammaire
ou de conjugaison existantes ou ayant existé serait entièrement
fortuite et indépendante de la volonté de l'auteur.


--
Pensez
Avatar
Nicolas Roudninski
Nicolas Roudninski a écrit :
Bonjour,

J'ai siuvi avec intérêt le fil sur le passage en UTF-8.
Il y a deux, trois petites choses que je ne comprends pas bien (même
après avoir lu la page wiki citée dans la discussion) :

1/ Comment savoir si un nom de fichier est en UTF-8 ou autre ?

2/ Gnome est bien en UTF-8 n'est-ce pas ? Parce que, chez moi, quand je
fais par exemple : convmv -r -f iso-8859-15 -t utf-8 Téléchargements/
le programme répond :
"mv "./Téléchargements" "./Téléchargements"
No changes to your files done. Use --notest to finally rename the files."
Le dossier Téléchargements/ a pourtant été créé par nautilus... Donc, je
me dis que convmv devrait me répondre "ce fichier est déjà en UTF-8 ou
quelquechose comme ça.

Bref, j'en perd mon latin !

si une âme charitable pouvait m'indiquer une voie...



Je me réponds à moi-même : pour gnome, t'es vraiment nul !
Il suffisait de choisir Français (UTF-8) fr_FR dans le menu langue de
gdm et hop !
Je paie un apéro à ma femme en guise de repentance...

N'empêche que j'aimerai bien connaître un programme qui me dise dans
quel encodage est tel fichier/répertoire...

--
Nicolas Roudninski

----------------------
Toute ressemblance avec des fautes d'orthographe, de grammaire
ou de conjugaison existantes ou ayant existé serait entièrement
fortuite et indépendante de la volonté de l'auteur.


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Gabriel Paubert
On Wed, Dec 14, 2005 at 06:33:42PM +0100, Nicolas Roudninski wrote:
Nicolas Roudninski a écrit :
>Bonjour,
>
>J'ai siuvi avec intérêt le fil sur le passage en UTF-8.
>Il y a deux, trois petites choses que je ne comprends pas bien (même
>après avoir lu la page wiki citée dans la discussion) :
>
>1/ Comment savoir si un nom de fichier est en UTF-8 ou autre ?
>
>2/ Gnome est bien en UTF-8 n'est-ce pas ? Parce que, chez moi, quand je
>fais par exemple : convmv -r -f iso-8859-15 -t utf-8 Téléchargements/
>le programme répond :
>"mv "./Téléchargements" "./Téléchargements"
>No changes to your files done. Use --notest to finally rename the files."
>Le dossier Téléchargements/ a pourtant été créé par nautilus... Donc, je
>me dis que convmv devrait me répondre "ce fichier est déjà en UTF-8 ou
>quelquechose comme ça.
>
>Bref, j'en perd mon latin !
>
>si une âme charitable pouvait m'indiquer une voie...
>
Je me réponds à moi-même : pour gnome, t'es vraiment nul !
Il suffisait de choisir Français (UTF-8) fr_FR dans le menu langue de
gdm et hop !
Je paie un apéro à ma femme en guise de repentance...

N'empêche que j'aimerai bien connaître un programme qui me dise dans
quel encodage est tel fichier/répertoire...



C'est forcément heuristique et pratiquement impossible. En
particulier entre latin1 et latin15 qui ne diffèrent que par
quelques caractères, et pas les plus courants.

L'encodage latin15 inclut l'e dans l'o pour le français, mais
combien de fois l'as tu tapé sur ton clavier (alors qu'en pratique
ça serait très efficace pour aider à écrire un programme qui
devine l'encodage d'un fichier)?

Gabriel


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Stephane Bortzmeyer
On Wed, Dec 14, 2005 at 05:55:15PM +0100,
Sébastien BARTH�LEMY wrote
a message of 38 lines which said:

> 1/ Comment savoir si un nom de fichier est en UTF-8 ou autre ?

que dit la commande locale ?



Quoi qu'elle dise, cela ne changera rien :

1) se rappeler qu'Unix est multi-utilisateurs et que deux utilisateurs
de la même machine peuvent avoir des locales différentes (c'est bien
le but des locales). Donc, un fichier créé par l'un peut dérouter
l'autre.

2) de toute façon, c'est le noyau qui contient le système de fichiers
et le noyau ignore les locales.


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
RTyler
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Gabriel Paubert a écrit :
On Wed, Dec 14, 2005 at 06:33:42PM +0100, Nicolas Roudninski wrote:

Nicolas Roudninski a écrit :

Bonjour,

J'ai siuvi avec intérêt le fil sur le passage en UTF-8.
Il y a deux, trois petites choses que je ne comprends pas bien (même
après avoir lu la page wiki citée dans la discussion) :

1/ Comment savoir si un nom de fichier est en UTF-8 ou autre ?

2/ Gnome est bien en UTF-8 n'est-ce pas ? Parce que, chez moi, quand je
fais par exemple : convmv -r -f iso-8859-15 -t utf-8 Téléchargements/
le programme répond :
"mv "./Téléchargements" "./Téléchargements"
No changes to your files done. Use --notest to finally rename the files."
Le dossier Téléchargements/ a pourtant été créé par nautilus... Donc, je
me dis que convmv devrait me répondre "ce fichier est déjà en UTF-8 ou
quelquechose comme ça.

Bref, j'en perd mon latin !

si une âme charitable pouvait m'indiquer une voie...




Je me réponds à moi-même : pour gnome, t'es vraiment nul !
Il suffisait de choisir Français (UTF-8) fr_FR dans le menu langue de
gdm et hop !
Je paie un apéro à ma femme en guise de repentance...

N'empêche que j'aimerai bien connaître un programme qui me dise dans
quel encodage est tel fichier/répertoire...




C'est forcément heuristique et pratiquement impossible. En
particulier entre latin1 et latin15 qui ne diffèrent que par
quelques caractères, et pas les plus courants.

L'encodage latin15 inclut l'e dans l'o pour le français, mais
combien de fois l'as tu tapé sur ton clavier (alors qu'en pratique
ça serait très efficace pour aider à écrire un programme qui
devine l'encodage d'un fichier)?



Ceci dit dans latin15 y'a aussi le support de l'euro...


Gabriel



RTyler


- --


- - --

- - -----------------------------------------------------------------------
Ma clé GPG est disponible sur http://www.keyserver.net (0x31ABED79)
- - -----------------------------------------------------------------------
_____________________________________________________
| Protégez votre vie privée: |
|||/ | - Signez/chiffrez vos messages. __|
q o - p | Respectez celle des autres: | /
__mn___^_/_nm__| - Masquez les destinataires de vos mailings |/
|__________________________________________________/
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.2 (GNU/Linux)

iD8DBQFDoJ2OpS7ZTjGr7XkRAmeUAJ9eDKjNItplBt+4DSe98K48yIasGQCeL0Oz
c9+vhumcqbusR8AyAuHsx1s =TY4+
-----END PGP SIGNATURE-----


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Frédéric Bothamy
* Stephane Bortzmeyer [2005-12-14 21:21] :

[...]

2) de toute façon, c'est le noyau qui contient le système de fichiers
et le noyau ignore les locales.



Un article très intéressant sur ce sujet :
http://lwn.net/Articles/71472/


Fred

--
Comment poser les questions de manière intelligente ?
http://www.gnurou.org/Writing/SmartQuestionsFr
Comment signaler efficacement un bug ?
http://www.chiark.greenend.org.uk/~sgtatham/bugs-fr.html


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Gonzalo HIGUERA DÍAZ
2005-12-14 23:32 +0100, RTyler :
Gabriel Paubert a écrit :
> On Wed, Dec 14, 2005 at 06:33:42PM +0100, Nicolas Roudninski wrote:
>
>>Nicolas Roudninski a écrit :
>>
>>>Bonjour,
>>>
>>>J'ai siuvi avec intérêt le fil sur le passage en UTF-8.
>>>Il y a deux, trois petites choses que je ne comprends pas bien (même
>>>après avoir lu la page wiki citée dans la discussion) :
>>>
>>>1/ Comment savoir si un nom de fichier est en UTF-8 ou autre ?
>>>
>>>2/ Gnome est bien en UTF-8 n'est-ce pas ? Parce que, chez moi, quand j e
>>>fais par exemple : convmv -r -f iso-8859-15 -t utf-8 Téléchargemen ts/
>>>le programme répond :
>>>"mv "./Téléchargements" "./TÃ(c)lÃ(c)chargements"
>>>No changes to your files done. Use --notest to finally rename the file s."
>>>Le dossier Téléchargements/ a pourtant été créé par nautil us... Donc, je
>>>me dis que convmv devrait me répondre "ce fichier est déjà en UT F-8 ou
>>>quelquechose comme ça.
>>>
>>>Bref, j'en perd mon latin !
>>>
>>>si une âme charitable pouvait m'indiquer une voie...
>>>
>>
>>Je me réponds à moi-même : pour gnome, t'es vraiment nul !
>>Il suffisait de choisir Français (UTF-8) fr_FR dans le menu langue de
>>gdm et hop !
>>Je paie un apéro à ma femme en guise de repentance...
>>
>>N'empêche que j'aimerai bien connaître un programme qui me dise dan s
>>quel encodage est tel fichier/répertoire...
>
>
> C'est forcément heuristique et pratiquement impossible. En
> particulier entre latin1 et latin15 qui ne diffèrent que par
> quelques caractères, et pas les plus courants.
>
> L'encodage latin15 inclut l'e dans l'o pour le français, mais
> combien de fois l'as tu tapé sur ton clavier (alors qu'en pratique
> ça serait très efficace pour aider à écrire un programme qui
> devine l'encodage d'un fichier)?

Ceci dit dans latin15 y'a aussi le support de l'euro...



- Latin1 = ISO-8859-1
- Latin9 = ISO-8859-15
- Latin15 n'existe pas, je crois.

--
Gonzalo HIGUERA DÍAZ
Avatar
RTyler
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Gonzalo HIGUERA DÍAZ a écrit :
2005-12-14 23:32 +0100, RTyler :





Ceci dit dans latin15 y'a aussi le support de l'euro...




- Latin1 = ISO-8859-1
- Latin9 = ISO-8859-15
- Latin15 n'existe pas, je crois.



Oups oui désolé j'étais fatigué lorsque j'ai écrit cela. Je voulais bien
entendu dire latin 9 (alias ISO-8859-15 merci).


--
Gonzalo HIGUERA DÍAZ



RTyler


- --


- - --

- - -----------------------------------------------------------------------
Ma clé GPG est disponible sur http://www.keyserver.net (0x31ABED79)
- - -----------------------------------------------------------------------
_____________________________________________________
| Protégez votre vie privée: |
|||/ | - Signez/chiffrez vos messages. __|
q o - p | Respectez celle des autres: | /
__mn___^_/_nm__| - Masquez les destinataires de vos mailings |/
|__________________________________________________/
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.2 (GNU/Linux)

iD8DBQFDoQEKpS7ZTjGr7XkRAil6AJ0ViaQy9qgsBNGa3X0U2GZOq7P0FgCfXMil
LaJSa8imJIc7Y9aWIxMS8Ps tG
-----END PGP SIGNATURE-----


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Vincent Lefevre
On 2005-12-14 17:55:15 +0100, Sébastien BARTHÉLEMY wrote:
Nicolas Roudninski writes:
> Il y a deux, trois petites choses que je ne comprends pas bien (même
> après avoir lu la page wiki citée dans la discussion) :
>
> 1/ Comment savoir si un nom de fichier est en UTF-8 ou autre ?

que dit la commande locale ?



Elle n'a rien à voir là-dedans.

> 2/ Gnome est bien en UTF-8 n'est-ce pas ?

à mon avis, pas par défaut.



Je pense que si, mais ça dépend peut-être des applications.

> Parce que, chez moi, quand
> je fais par exemple : convmv -r -f iso-8859-15 -t utf-8
> Téléchargements/
> le programme répond :
> "mv "./Téléchargements" "./Téléchargements"
> No changes to your files done. Use --notest to finally rename the files."
> Le dossier Téléchargements/ a pourtant été créé par nautilus... Donc,
> je me dis que convmv devrait me répondre "ce fichier est déjà en UTF-8
> ou quelquechose comme ça.



Non, le problème est que quand tu as un nom de fichier écrit

54 c3 a9 6c c3 a9 63 68 61 72 67 65 6d 65 6e 74 73

en tant qu'octets 8 bits, convmv ne peut pas deviner que c'est
déjà de l'UTF-8 (il n'est pas intelligent et ne comprend pas
le français). Comme tu as indiqué -f iso-8859-15, il va donc
bêtement supposer que c'était de l'iso-8859-15 et va te le
convertir en utf-8:

54 c3 83 c2 a9 6c c3 83 c2 a9 63 68 61 72 67 65 6d 65 6e 74 73

Le c3 83 est la séquence UTF-8 correspondant au caractère Ã, et
c2 a9 est la séquence UTF-8 correspondant au caractère ©.

Maintenant, je ne sais pas ce qu'il en est dans ton cas, mais
il semble que par défaut, convmv ne change rien (mode test?):
il t'indique seulement les changements à effectuer. Utilise
--notest comme indiqué pour effectuer les changements, mais
attention au problème mentionné ci-dessus, afin d'éviter d'avoir
des programmes doublement encodés en UTF-8.

--
Vincent Lefèvre - Web: <http://www.vinc17.org/>
100% accessible validated (X)HTML - Blog: <http://www.vinc17.org/blog/>
Work: CR INRIA - computer arithmetic / SPACES project at LORIA


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
1 2