outils pour g

Le
S
Bonjour tout le monde,

je suis en train de centraliser et d'archiver beaucoup de fichiers
provenant de cd, dvd, pc windows, disques fat etc

Je rencontre pas mal de problèmes liés à l'encodage des noms de fichiers
et aux contraintes propres aux différents systèmes de fichiers.

Est qu'il existe un outil permettant :
- de deviner l'encodage d'un nom de fichiers
- de convertir les noms de fichiers d'un encodage à un autre
- de vérifier la compatibilité d'une arborescence avec un système de
fichier (vérifier qu'il n'y a pas de ":" dans les noms, que le passage à
un système insensible à la casse ne posera pas de problème, que la
profondeur des dossiers est compatible avec joliet)
- de changer les noms de fichiers (remplacer les éèê par des e en
détectant les collisions..)

Si en plus il détecte les doublons avec un md5sum, c'est chouette !

J'en demande peut-être beaucoup (une classe python de préférence).



Merci !


--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
geoffroy
Le #9749141
Sébastien Barthélemy a écrit :
Bonjour tout le monde,


Salut

Est qu'il existe un outil permettant :
- de deviner l'encodage d'un nom de fichiers


J'utilise la commande file, mais je soupçonne qu'il existe mieux.

- de convertir les noms de fichiers d'un encodage à un autre


http://packages.debian.org/etch/convmv

- de changer les noms de fichiers (remplacer les éèê par des e en
détectant les collisions..)


http://packages.debian.org/etch/unaccent

Il existe un outils de migration vers l'UTF8 si c'est le système que tu
utilises. En python
http://packages.debian.org/lenny/utf8-migration-tool
mais seulement à partir de lenny.

Si en plus il détecte les doublons avec un md5sum, c'est chouette !


http://packages.debian.org/etch/fdupes

geoffroy


--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
S
Le #9749041
Le vendredi 02 novembre 2007 à 08:45 -0800, geoffroy a écrit :
Sébastien Barthélemy a écrit :
> Bonjour tout le monde,
Salut

> Est qu'il existe un outil permettant :
> - de deviner l'encodage d'un nom de fichiers
J'utilise la commande file, mais je soupçonne qu'il existe mieux.



file a l'air de deviner l'encodage du contenu des fichiers mais pas de
leur nom.

j'ai essayé
ls -lR > tmp
file tmp
mais il devine mal.

> - de convertir les noms de fichiers d'un encodage à un autre
http://packages.debian.org/etch/convmv
> - de changer les noms de fichiers (remplacer les éèê par des e en
> détectant les collisions..)
http://packages.debian.org/etch/unaccent

Il existe un outils de migration vers l'UTF8 si c'est le système que tu
utilises. En python
http://packages.debian.org/lenny/utf8-migration-tool
mais seulement à partir de lenny.

> Si en plus il détecte les doublons avec un md5sum, c'est chouette !
http://packages.debian.org/etch/fdupes



parfait merci !


Reste à trouver quelque chose qui valide que mon arborescence est compatible fat/ntfs/joliet.


--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Jacques L'helgoualc'h
Le #9749031
Sébastien Barthélemy a écrit, samedi 3 novembre 2007, à 10:30 :
Le vendredi 02 novembre 2007 à 08:45 -0800, geoffroy a écrit :
> Sébastien Barthélemy a écrit :
> > Bonjour tout le monde,
> Salut



bonjour,

> > Est qu'il existe un outil permettant :
> > - de deviner l'encodage d'un nom de fichiers
> J'utilise la commande file, mais je soupçonne qu'il existe mieux.

file a l'air de deviner l'encodage du contenu des fichiers



Et encore, on ne peut pas vraiment : latin1 et latin9 sont presque
identiques, comment savoir si « ¤ » est un morpion à 4 pattes ou un
Euro ?

mais pas de leur nom.



Un nom de fichier est une suite d'octets non nuls, j'ai le droit de
nommer un fichier « Martine_écrit_en_UTF-8.jpeg » ... en latin1 :)

j'ai essayé
ls -lR > tmp
file tmp
mais il devine mal.



Forcément, il vaudrait mieux essayer un nom à la fois... (et éviter
l'option l (!= 1)).

[...]
Reste à trouver quelque chose qui valide que mon arborescence est
compatible fat/ntfs/joliet.



Pour tester une profondeur maximale,

find image_source/ -mindepth 8

Le reste est laissé en exercice sur find et awk !
--
Jacques L'helgoualc'h


--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Gaëtan PERRIER
Le #9748721
Le Fri, 02 Nov 2007 17:25:40 +0100
Sébastien Barthélemy
Bonjour tout le monde,

je suis en train de centraliser et d'archiver beaucoup de fichiers
provenant de cd, dvd, pc windows, disques fat etc...

Je rencontre pas mal de problèmes liés à l'encodage des noms de fichiers
et aux contraintes propres aux différents systèmes de fichiers.

Est qu'il existe un outil permettant :
- de deviner l'encodage d'un nom de fichiers
- de convertir les noms de fichiers d'un encodage à un autre
- de vérifier la compatibilité d'une arborescence avec un système de
fichier (vérifier qu'il n'y a pas de ":" dans les noms, que le passage à
un système insensible à la casse ne posera pas de problème, que la
profondeur des dossiers est compatible avec joliet...)
- de changer les noms de fichiers (remplacer les éèê par des e en
détectant les collisions..)

Si en plus il détecte les doublons avec un md5sum, c'est chouette !

J'en demande peut-être beaucoup... (une classe python de préférence).



convmv pour l'encodage peut-être?

Gaëtan


--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Francois Mescam
Le #9746271
Gaëtan PERRIER wrote:
Le Fri, 02 Nov 2007 17:25:40 +0100
Sébastien Barthélemy
Bonjour tout le monde,

je suis en train de centraliser et d'archiver beaucoup de fichiers
provenant de cd, dvd, pc windows, disques fat etc...

Je rencontre pas mal de problèmes liés à l'encodage des noms de fichiers
et aux contraintes propres aux différents systèmes de fichiers.

Est qu'il existe un outil permettant :
- de deviner l'encodage d'un nom de fichiers
- de convertir les noms de fichiers d'un encodage à un autre
- de vérifier la compatibilité d'une arborescence avec un système de
fichier (vérifier qu'il n'y a pas de ":" dans les noms, que le passage à
un système insensible à la casse ne posera pas de problème, que la
profondeur des dossiers est compatible avec joliet...)
- de changer les noms de fichiers (remplacer les éèê par des e en
détectant les collisions..)

Si en plus il détecte les doublons avec un md5sum, c'est chouette !

J'en demande peut-être beaucoup... (une classe python de préférence).





Voir peut-être du coté de metamorphose
http://file-folder-ren.sourceforge.net/ qui est un outil pour renommer
des fichiers des répertoires ...


--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Publicité
Poster une réponse
Anonyme