Comment supprimer les lignes en double dans un fichier texte ?
10 réponses
Pierre
Bjr,
Soit un fichier texte contenant plus de 200 000 lignes de texte. Ce
fichier est trié par ordre alphabétique. Dans ce fichier il y a pas mal
de lignes en double. Quel outil puis-je utiliser pour supprimer les
lignes en double ?
Jusqu'à présent j'utilisais Excel avec une simple fonction =SI(...)
mais il fallait que mon fichier fasse moi de 65000 lignes. BBedit offre
une fonction grep mais ne permet pas de faire des comparaisons.
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
patpro ~ Patrick Proniewski
In article , Pierre wrote:
Jusqu'à présent j'utilisais Excel avec une simple fonction =SI(...) mais il fallait que mon fichier fasse moi de 65000 lignes. BBedit offre une fonction grep mais ne permet pas de faire des comparaisons.
Quelle solution ?
lire la doc de BBEdit ? :) menu text, item "process duplicate lines"
Sinon dans le terminal : sort -u /ton/fichier > /ton/fichier.new
patpro
In article <traul-96C7E0.08564522022005@news4-e.proxad.net>,
Pierre <traul@freespam.fr> wrote:
Jusqu'à présent j'utilisais Excel avec une simple fonction =SI(...)
mais il fallait que mon fichier fasse moi de 65000 lignes. BBedit offre
une fonction grep mais ne permet pas de faire des comparaisons.
Quelle solution ?
lire la doc de BBEdit ? :)
menu text, item "process duplicate lines"
Sinon dans le terminal :
sort -u /ton/fichier > /ton/fichier.new
Jusqu'à présent j'utilisais Excel avec une simple fonction =SI(...) mais il fallait que mon fichier fasse moi de 65000 lignes. BBedit offre une fonction grep mais ne permet pas de faire des comparaisons.
Quelle solution ?
lire la doc de BBEdit ? :) menu text, item "process duplicate lines"
Sinon dans le terminal : sort -u /ton/fichier > /ton/fichier.new
patpro
Franck
Pierre wrote:
Soit un fichier texte contenant plus de 200 000 lignes de texte. Ce fichier est trié par ordre alphabétique. Dans ce fichier il y a pas mal de lignes en double. Quel outil puis-je utiliser pour supprimer les lignes en double ?
Ouvrir un shell et utiliser la commande 'sort -u'
Pour plus d'infos, 'man sort' :-p
Pierre wrote:
Soit un fichier texte contenant plus de 200 000 lignes de texte. Ce
fichier est trié par ordre alphabétique. Dans ce fichier il y a pas mal
de lignes en double. Quel outil puis-je utiliser pour supprimer les
lignes en double ?
Soit un fichier texte contenant plus de 200 000 lignes de texte. Ce fichier est trié par ordre alphabétique. Dans ce fichier il y a pas mal de lignes en double. Quel outil puis-je utiliser pour supprimer les lignes en double ?
Ouvrir un shell et utiliser la commande 'sort -u'
Pour plus d'infos, 'man sort' :-p
Patrick Stadelmann
In article , Pierre wrote:
Quelle solution ?
TextWrangler (gratuit) permet de le faire, soit via la commande dans le menu "Text" ou via un script perl dans le menu "#!"
http://www.barebones.com/
Patrick -- Patrick Stadelmann
In article <traul-96C7E0.08564522022005@news4-e.proxad.net>,
Pierre <traul@freespam.fr> wrote:
Quelle solution ?
TextWrangler (gratuit) permet de le faire, soit via la commande dans le
menu "Text" ou via un script perl dans le menu "#!"
http://www.barebones.com/
Patrick
--
Patrick Stadelmann <Patrick.Stadelmann@unine.ch>
TextWrangler (gratuit) permet de le faire, soit via la commande dans le menu "Text" ou via un script perl dans le menu "#!"
il a BBEdit :)
Tout le monde ne l'a pas...
Patrick -- Patrick Stadelmann
news77jll
Pierre wrote:
Bjr,
Soit un fichier texte contenant plus de 200 000 lignes de texte. Ce fichier est trié par ordre alphabétique. Dans ce fichier il y a pas mal de lignes en double. Quel outil puis-je utiliser pour supprimer les lignes en double ?
Jusqu'à présent j'utilisais Excel avec une simple fonction =SI(...) mais il fallait que mon fichier fasse moi de 65000 lignes. BBedit offre une fonction grep mais ne permet pas de faire des comparaisons.
Quelle solution ?
Il y a la base de données d'AppleWorks ou carrément FMpro (recherche des doublons immédiate et pas de limitation du nombre de fiches).
-- Cordialement!... A+ JLL (sans les chiffres pour me joindre) iMac G4 -1 GHz - 512 Mo - Mac OS X 10.3.8 - ADSL 512k
Pierre <traul@freespam.fr> wrote:
Bjr,
Soit un fichier texte contenant plus de 200 000 lignes de texte. Ce
fichier est trié par ordre alphabétique. Dans ce fichier il y a pas mal
de lignes en double. Quel outil puis-je utiliser pour supprimer les
lignes en double ?
Jusqu'à présent j'utilisais Excel avec une simple fonction =SI(...)
mais il fallait que mon fichier fasse moi de 65000 lignes. BBedit offre
une fonction grep mais ne permet pas de faire des comparaisons.
Quelle solution ?
Il y a la base de données d'AppleWorks ou carrément FMpro (recherche des
doublons immédiate et pas de limitation du nombre de fiches).
--
Cordialement!... A+
JLL (sans les chiffres pour me joindre)
iMac G4 -1 GHz - 512 Mo - Mac OS X 10.3.8 - ADSL 512k
Soit un fichier texte contenant plus de 200 000 lignes de texte. Ce fichier est trié par ordre alphabétique. Dans ce fichier il y a pas mal de lignes en double. Quel outil puis-je utiliser pour supprimer les lignes en double ?
Jusqu'à présent j'utilisais Excel avec une simple fonction =SI(...) mais il fallait que mon fichier fasse moi de 65000 lignes. BBedit offre une fonction grep mais ne permet pas de faire des comparaisons.
Quelle solution ?
Il y a la base de données d'AppleWorks ou carrément FMpro (recherche des doublons immédiate et pas de limitation du nombre de fiches).
-- Cordialement!... A+ JLL (sans les chiffres pour me joindre) iMac G4 -1 GHz - 512 Mo - Mac OS X 10.3.8 - ADSL 512k
Eric Lévénez
Le 22/02/05 8:56, dans , « Pierre » a écrit :
Soit un fichier texte contenant plus de 200 000 lignes de texte. Ce fichier est trié par ordre alphabétique. Dans ce fichier il y a pas mal de lignes en double. Quel outil puis-je utiliser pour supprimer les lignes en double ?
La commande unix "uniq" est faite exactement pour cela.
-- Éric Lévénez -- <http://www.levenez.com/> Unix is not only an OS, it's a way of life.
Le 22/02/05 8:56, dans <traul-96C7E0.08564522022005@news4-e.proxad.net>,
« Pierre » <traul@freespam.fr> a écrit :
Soit un fichier texte contenant plus de 200 000 lignes de texte. Ce
fichier est trié par ordre alphabétique. Dans ce fichier il y a pas mal
de lignes en double. Quel outil puis-je utiliser pour supprimer les
lignes en double ?
La commande unix "uniq" est faite exactement pour cela.
--
Éric Lévénez -- <http://www.levenez.com/>
Unix is not only an OS, it's a way of life.
Soit un fichier texte contenant plus de 200 000 lignes de texte. Ce fichier est trié par ordre alphabétique. Dans ce fichier il y a pas mal de lignes en double. Quel outil puis-je utiliser pour supprimer les lignes en double ?
La commande unix "uniq" est faite exactement pour cela.
-- Éric Lévénez -- <http://www.levenez.com/> Unix is not only an OS, it's a way of life.
blanc
Eric Lévénez wrote:
La commande unix "uniq" est faite exactement pour cela.
Ca ne marche pas si les doublons ne sont pas consécutifs. Par contre sort -u le fait, mais change l'ordre des lignes Je viens de tester la solution TextWrangler proposée par Patrick, et elle me paraît la bonne solution.
JPaul. -- /==/==- Jean-Paul BLANC / /--/--// quelque-part (somewhere) |/| L | en (in) /|| = ||| FRANCE
Eric Lévénez <news@levenez.com.invalid> wrote:
La commande unix "uniq" est faite exactement pour cela.
Ca ne marche pas si les doublons ne sont pas consécutifs.
Par contre sort -u le fait, mais change l'ordre des lignes
Je viens de tester la solution TextWrangler proposée par Patrick, et
elle me paraît la bonne solution.
JPaul.
--
/==/==\- Jean-Paul BLANC
/ /--/--//\ quelque-part (somewhere)
|/| L |\ en (in)
/|| = |||\ FRANCE
La commande unix "uniq" est faite exactement pour cela.
Ca ne marche pas si les doublons ne sont pas consécutifs. Par contre sort -u le fait, mais change l'ordre des lignes Je viens de tester la solution TextWrangler proposée par Patrick, et elle me paraît la bonne solution.
JPaul. -- /==/==- Jean-Paul BLANC / /--/--// quelque-part (somewhere) |/| L | en (in) /|| = ||| FRANCE
Eric Lévénez
Le 24/02/05 10:13, dans <1gshfrz.11yzmqhsgx4jN%, « JPaul » a écrit :
Eric Lévénez wrote:
La commande unix "uniq" est faite exactement pour cela.
Ca ne marche pas si les doublons ne sont pas consécutifs.
J'ai répondu à l'OP qui indiquait que son fichier était trié. Sinon bien sûr je n'aurais pas fait cette réponse. :->
-- Éric Lévénez -- <http://www.levenez.com/> Unix is not only an OS, it's a way of life.
Le 24/02/05 10:13, dans <1gshfrz.11yzmqhsgx4jN%blanc@empty.org>, « JPaul »
<blanc@empty.org> a écrit :
Eric Lévénez <news@levenez.com.invalid> wrote:
La commande unix "uniq" est faite exactement pour cela.
Ca ne marche pas si les doublons ne sont pas consécutifs.
J'ai répondu à l'OP qui indiquait que son fichier était trié.
Sinon bien sûr je n'aurais pas fait cette réponse. :->
--
Éric Lévénez -- <http://www.levenez.com/>
Unix is not only an OS, it's a way of life.
Le 24/02/05 10:13, dans <1gshfrz.11yzmqhsgx4jN%, « JPaul » a écrit :
Eric Lévénez wrote:
La commande unix "uniq" est faite exactement pour cela.
Ca ne marche pas si les doublons ne sont pas consécutifs.
J'ai répondu à l'OP qui indiquait que son fichier était trié. Sinon bien sûr je n'aurais pas fait cette réponse. :->
-- Éric Lévénez -- <http://www.levenez.com/> Unix is not only an OS, it's a way of life.
dolbeaur
Pierre wrote:
Soit un fichier texte contenant plus de 200 000 lignes de texte. Ce fichier est trié par ordre alphabétique. Dans ce fichier il y a pas mal de lignes en double. Quel outil puis-je utiliser pour supprimer les lignes en double ?
dans un terminal, la commande 'uniq'
par exemple:
uniq < textavecdoublon.txt > textsansdoublon.txt
faire 'man uniq' pour les options (comptages des répétitions, par exemple)
HTH
-- Romain Dolbeau
Pierre <traul@freespam.fr> wrote:
Soit un fichier texte contenant plus de 200 000 lignes de texte. Ce
fichier est trié par ordre alphabétique. Dans ce fichier il y a pas mal
de lignes en double. Quel outil puis-je utiliser pour supprimer les
lignes en double ?
dans un terminal, la commande 'uniq'
par exemple:
uniq < textavecdoublon.txt > textsansdoublon.txt
faire 'man uniq' pour les options (comptages des répétitions, par
exemple)
Soit un fichier texte contenant plus de 200 000 lignes de texte. Ce fichier est trié par ordre alphabétique. Dans ce fichier il y a pas mal de lignes en double. Quel outil puis-je utiliser pour supprimer les lignes en double ?
dans un terminal, la commande 'uniq'
par exemple:
uniq < textavecdoublon.txt > textsansdoublon.txt
faire 'man uniq' pour les options (comptages des répétitions, par exemple)