recherche doublons audio

Le
Nicolas Roudninski
--e0cb4efe33e26dd5a604b97cc634
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: quoted-printable

Bonjour,

Je dispose d'un serveur ovh sous debian sur lequel je stocke ma musique.
Cette musique est organisée en dossiers et sous dossier du genre :
/home/audio/artiste/album/
J'ai des doublons du type : fichier_audio.mp3 / fichier_audio.flac
Je voudrais rechercher ces doublons pour effacer les mp3 quand le même
fichier existe en flac.

J'ai du mal à trouver une solution en googleisant

Donc si vous avez une piste, je suis preneur

Cordialement,

PS : j'aime bien Perl ;-)

--
Nicolas
nicoroud@gmail.com

--e0cb4efe33e26dd5a604b97cc634
Content-Type: text/html; charset=UTF-8
Content-Transfer-Encoding: quoted-printable

Bonjour,<div><br></div><div>Je dispose d&#39;un serveur ovh sous debian sur=
lequel je stocke ma musique.</div><div>Cette musique est organisée en=
dossiers et sous dossier du genre :</div><div>/home/audio/artiste/album/</=
div>
<div>J&#39;ai des doublons du type : fichier_audio.mp3 / fichier_audio=
.flac</div><div>Je voudrais rechercher ces doublons pour effacer les mp3 qu=
and le même fichier existe en flac.</div><div><br></div><div>J&#39;ai =
du mal à trouver une solution en googleisant</div>
<div><br></div><div>Donc si vous avez une piste, je suis preneur</div><div>=
<br></div><div>Cordialement,</div><div><br></div><div>PS : j&#39;aime bien =
Perl ;-)<br clear="all"><div><br></div>-- <br>Nicolas<br><a href="mailt=
o:nicoroud@gmail.com" target="_blank">nicoroud@gmail.com</a><br>

</div>

--e0cb4efe33e26dd5a604b97cc634--

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers debian-user-french-REQUEST@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmaster@lists.debian.org
Archive: http://lists.debian.org/CACj=MCJj-c3dNP-hqWfe=ubp5c+NW0h-FdKaZL5wY-T=bPxACQ@mail.gmail.com
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Bernard Schoenacker
Le #24269881
Le Tue, 21 Feb 2012 18:31:02 +0100,
Nicolas Roudninski
Bonjour,

Je dispose d'un serveur ovh sous debian sur lequel je stocke ma
musique. Cette musique est organisée en dossiers et sous dossier du
genre : /home/audio/artiste/album/
J'ai des doublons du type : fichier_audio.mp3 / fichier_audio.flac
Je voudrais rechercher ces doublons pour effacer les mp3 quand le même
fichier existe en flac.

J'ai du mal à trouver une solution en googleisant...

Donc si vous avez une piste, je suis preneur

Cordialement,

PS : j'aime bien Perl ;-)



bonjour,

mêm si pour toi les fichiers sont en double, pour l'ordi c'est
chaque fois un fichier différent suivant extension ...

autrement, fdupes permet de retrouver les doublons


voici quelques liens :

http://elonen.iki.fi/code/misc-notes/remove-duplicate-files/
http://tips4linux.com/find-duplicate-files-in-linux/
http://linux.die.net/man/1/fdupes

bonne consultation

slt
bernard

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Bzzz
Le #24269871
On Tue, 21 Feb 2012 18:31:02 +0100
Nicolas Roudninski
Je dispose d'un seeder ovh sous debian sur lequel je stocke ma musique
non-hadopienne.
Cette musique est organisée en dossiers et sous dossier du genre :
/home/audio/artiste/album/
J'ai des doublons du type : fichier_audio.mp3 / fichier_audio.flac
Je voudrais rechercher ces doublons pour effacer les mp3 quand le mê me
fichier existe en flac.



A part utiliser une I/F vers les servers de reconnaissance du net
j'vois pô - il me semble qu'il existe un pkg python qui fait ça s ous
sid (ptêt pas de pgm, mais au moins une lib); et il-y-a des offres
libres sur le web.

PS : j'aime bien Perl ;-)



Moi pas: pour faire des conneries C était largement suffisant, pas la
peine d'en rajouter une couche.
--
Knights are hardly worth it. I mean, all that shell and so little
meat...

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Bzzz
Le #24270081
On Tue, 21 Feb 2012 19:16:52 +0100
Nicolas Roudninski
>
Eh, c'est ma musique perso que j'ai obtenu légalement hein...
Et que je ne partage qu'avec moi même !



C'est ce qu'ils disent tous... délinquant va:)

> > Cette musique est organisée en dossiers et sous dossier du genre :
> > /home/audio/artiste/album/
> > J'ai des doublons du type : fichier_audio.mp3 / fichier_audio.flac
> > Je voudrais rechercher ces doublons pour effacer les mp3 quand le m ême
> > fichier existe en flac.
>
> A part utiliser une I/F vers les servers de reconnaissance du net
> j'vois pô - il me semble qu'il existe un pkg python qui fait à §a sous
> sid (ptêt pas de pgm, mais au moins une lib); et il-y-a des offres
> libres sur le web.
>
Il faudrait peut-être être plus explicite parce que là je ne comprends
pas...



J'ai vu passer un tel pkg, et il existe des softs open-source non
packagés qui utilisent les même serveurs que les utilitaires
fonctionnant sur tél mobile (tu approches le tél d'une source son ore
et il te renvoie titre, artiste, album, etc).
Avec jack ou en bricolant un chtit peu, il ne doit pas y avoir de PB
pour que ça fonctionne à partir de la redirection d'un lecteur au dio.

> > PS : j'aime bien Perl ;-)
>
> Moi pas: pour faire des conneries C était largement suffisant, pas laments
> peine d'en rajouter une couche.
>
???
Des arguments ?



Comme avec le C, on peut tout faire et n'importe quoi (surtout
n'importe quoi), notamment en matière de notation ou de pgm
illisible.

--
God is love, but get it in writing.
-- Gypsy Rose Lee

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Sylvain L. Sauvage
Le #24270261
Le mardi 21 février 2012 à 18:31:02, Nicolas Roudninski a éc rit
:
Bonjour,



’soir,

Je dispose d'un serveur ovh sous debian sur lequel je stocke
ma musique. Cette musique est organisée en dossiers et sous
dossier du genre : /home/audio/artiste/album/
J'ai des doublons du type : fichier_audio.mp3 /
fichier_audio.flac
Je voudrais rechercher ces doublons pour
effacer les mp3 quand le même fichier existe en flac.

J'ai du mal à trouver une solution en googleisant...

Donc si vous avez une piste, je suis preneur



Tu veux dire qu’ils ont le même nom et sont dans le mêm e
répertoire ?
→ find /home/audio -name "*.flac" |
sed -e 's/.flac$/.mp3/' | xargs rm -f

Sinon, c’est plus dur…

PS : j'aime bien Perl ;-)



Les coups et les douleurs…
--
Sylvain Sauvage

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Nicolas Bercher
Le #24275321
Bernard Schoenacker a écrit :
Le Tue, 21 Feb 2012 18:31:02 +0100,
Nicolas Roudninski
Bonjour,

Je dispose d'un serveur ovh sous debian sur lequel je stocke ma
musique. Cette musique est organisée en dossiers et sous dossier du
genre : /home/audio/artiste/album/
J'ai des doublons du type : fichier_audio.mp3 / fichier_audio.flac
Je voudrais rechercher ces doublons pour effacer les mp3 quand le même
fichier existe en flac.

J'ai du mal à trouver une solution en googleisant...

Donc si vous avez une piste, je suis preneur

Cordialement,

PS : j'aime bien Perl ;-)





Je pense qu'une solution possible en bash serait celle-ci:

1) lister récursivement tous les fichiers potentiellement "doublons"
(les non-flac, si j'ai bien compris), soit les fichiers d'extension
mp3, mp4, m4a, etc. Avec find par exemple, on écrit la liste dans dans
des noms des fichiers sans leur chemins:

cd /home/audio/
find . -iname "*.mp3" -or -iname "*.m4a" | xargs -L 1 basename >
/tmp/allnames.txt

(find à compléter avec les extensions souhaitées)


2) faire la même liste avec les chemins:

cd /home/audio/
find . -iname "*.mp3" -or -iname "*.m4a" > /tmp/allpaths.txt

(find à compléter avec les extensions souhaitées)


3) on les regroupe pour former un index (qui sert aussi de cache) de la
forme: nom_fichier<TAB>chemin_complet

paste /tmp/allnames.txt /tmp/allpaths.txt > /tmp/index.txt


4) pour chaque flac, on recherche si un doublon existe:

find . -iname "*.flac" -exec bash -c _ _rmdup "{}" ;

Avec _rmdup, la fonction bash ci-dessous


5) Au final, on a les deux fonctions suivantes et deux commandes
à placer dans le fichier rmdup:

------------------8<------------------
#!/bin/bash



function _rmdup () {
echo " + searching duplicate of ${1}" 1>&2
pattern="$(basename "${1}" .flac)"
grep "/${pattern}." /tmp/index.txt | cut -d"$(echo -en "t")" -f 2
| xargs -L 1 -i echo "{}"
echo "" 1>&2
}
export -f _rmdup

function _initindex () {
find . -iname "*.mp3" -or -iname "*.m4a" | xargs -L 1 -i basename
"{}" > /tmp/allnames.txt
find . -iname "*.mp3" -or -iname "*.m4a" > /tmp/allpaths.txt
paste /tmp/allnames.txt /tmp/allpaths.txt > /tmp/index.txt
}

_initindex
find . -iname "*.flac" -exec bash -c '_rmdup "${1}"' _ "{}" ;

------------------8<------------------


Exemple sous le shell bash avec une arborescence arbitraire:

$ cd /home/audio
$ find
.
./a
./a/b
./a/b/c
./a/b/c/b.mp3
./a/b/c/1 2.m4a
./a/b/c/1 2.mp3
./a/b/b.flac
./a/b/b.mp3
./a/b/1 2.flac
./a/a.flac
./a/a.mp3
./a/1 2.mp3

$ ./rmdup
+ searching duplicate of ./a/b/b.flac
./a/b/c/b.mp3
./a/b/b.mp3

+ searching duplicate of ./a/b/1 2.flac
./a/b/c/1 2.m4a
./a/b/c/1 2.mp3
./a/1 2.mp3

+ searching duplicate of ./a/a.flac
./a/a.mp3

Si tout est bon, tu remplaces echo "{}" par rm "{}" dans la dernière
ligne de la fonction _rmdup et tu la relances. Comme tu le vois, les
noms fichiers contenant des espaces sont correctement pris en charge.

Par contre, si tes fichiers sont mal nommés ou encore que deux artistes
ont des chansons avec le même titre et leurs fichiers respectifs le même
nommage... ouch! Tu pourrais donc prendre le temps de vérifier la liste
générée avec la version echo "{}" et pourquoi pas faire une copie avec
hardlinks:

$ cd /home
$ cp -rl audio/ save_audio

avant de supprimer les doublons. Que tu pourras supprimer longtemps
après, si tu te rends compte que tout est bon.

Nicolas

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Goldy
Le #24275511
Le 21/02/2012 18:31, Nicolas Roudninski a écrit :
Bonjour,

Je dispose d'un serveur ovh sous debian sur lequel je stocke ma musique.
Cette musique est organisée en dossiers et sous dossier du genre :
/home/audio/artiste/album/
J'ai des doublons du type : fichier_audio.mp3 / fichier_audio.flac
Je voudrais rechercher ces doublons pour effacer les mp3 quand le même
fichier existe en flac.

J'ai du mal à trouver une solution en googleisant...

Donc si vous avez une piste, je suis preneur

Cordialement,

PS : j'aime bien Perl ;-)

--
Nicolas




J'aurais éventuellement une méthode, mais c'est plus un bricolage qu'une
façon de comparer les fichiers sonores.

Tu peux tagguer toute ta musiques avec musicbrainz, bien ranger les
morceaux en utilisant l'outil intégré à musicbrainz qui permet de les
classer par artistes / albums, et ensuite de parcourir les dossier avec
un script qui effacera les fichiers mp3 lorsque un fichier flac
correspondant est disponible.

Sinon, il faudrait regarder du côté de libofa qui permetrait de faire
des empreintes de fichier audio qui peuvent ensuite être comparées.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
nicolas.patrois
Le #24275481
Le 23/02/2012 18:32:54, Nicolas Bercher a écrit :

Je pense qu'une solution possible en bash serait celle-ci:



Et avec un logiciel de gestion de bibliothèque musicale, à condition
que les champs id3 aient été remplis (et existent) ?

nicolas patrois : pts noir asocial
--
RÉALISME

M : Qu'est-ce qu'il nous faudrait pour qu'on nous considère comme des
humains ? Un cerveau plus gros ?
P : Non... Une carte bleue suffirait...

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Publicité
Poster une réponse
Anonyme