Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Extraction donn?es ? partir d'un fichier

7 réponses
Avatar
Largo Winzclav
Bonjour,

je suis sous Debian, j'ai un fichier texte contenant .... du texte
formidable non.
Il contient aussi des adresses mails. Bon il y a des softs qui permettent de
faire cela mais je ne souhaite réaliser l'opération qu'une seule fois.

Quelqu'un pourrait-il me renseigner sur un exemple un petit script, autre
... je n'ai pas besoin que cela fasse le café.

@+

Winzclav

PS : pour info j'ai trouvé un soft qui me coute 35 euros (sous Windows) donc
ce n'est pas une question de cout mais comme je le repete j'aimerais le
réaliser sous Linux


--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org

7 réponses

Avatar
JusTiCe8
Bonsoir,

Largo Winzclav wrote:
Bonjour,

je suis sous Debian, j'ai un fichier texte contenant .... du texte
formidable non.
Il contient aussi des adresses mails. Bon il y a des softs qui permettent de
faire cela mais je ne souhaite réaliser l'opération qu'une seule fois.

Quelqu'un pourrait-il me renseigner sur un exemple un petit script, autre
... je n'ai pas besoin que cela fasse le café.




sûr mais trop vague pour pouvoir donner une solution applicable
immédiatement.
Comment se présente le fichier ? les adresses sont disposées comment ?
Qu'y a t'il entre les adresses ?

en Perl, une regexp simple : /s+(S+@S+)s+/ (extrait les adresses
séparées d'autre chose par des espaces)
Après, il s'agit d'un simple parcours de fichier.
@+

Winzclav


[...]

J8.


--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Largo Winzclav
"JusTiCe8" a écrit dans le message de news:

Bonsoir,

Largo Winzclav wrote:
Bonjour,

je suis sous Debian, j'ai un fichier texte contenant .... du texte
formidable non.
Il contient aussi des adresses mails. Bon il y a des softs qui permettent
de
faire cela mais je ne souhaite réaliser l'opération qu'une seule fois.

Quelqu'un pourrait-il me renseigner sur un exemple un petit script, autre
... je n'ai pas besoin que cela fasse le café.




sûr mais trop vague pour pouvoir donner une solution applicable
immédiatement.


Effectivement
Comment se présente le fichier ? les adresses sont disposées comment ?


comme ceci

Qu'y a t'il entre les adresses ?

en Perl, une regexp simple : /s+(S+@S+)s+/ (extrait les adresses



je suis parti effectivement comme cela avec du perl puis une petite couche
de grep qui passe le tous à sort puis awk et voila j'ai mon fichier de
sortie qui est tout joli.
C'est quand même chouette Linux/Unix sous windows cela manque quand meme les
regex et petits utilitaires puissant en ligne de commande.

séparées d'autre chose par des espaces)
Après, il s'agit d'un simple parcours de fichier.
@+

Winzclav


[...]




J8.



Winzclav



--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact





--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Marc Chantreux
le 08/06/2006,
Largo Winzclav nous écrivait :

> en Perl, une regexp simple : /s+(S+@S+)s+/ (extrait les
> adresses)



et pour avoir qqchose de plus complet avec
http://search.cpan.org/~cwest/Regexp-Common-Email-Address-1.01/lib/Regexp /Common/Email/Address.pm

qqchose comme ca devrait marcher :

perl -MEmail::Adress -MRegexp::Common=Email::Address -nle '
for ( /($RE{Email}{Address})/g ) {
print $_->address for Email::Adress->parse($_)
}
'

je suis parti effectivement comme cela avec du perl puis une petite cou che
de grep qui passe le tous à sort puis awk et voila j'ai mon fichier d e
sortie qui est tout joli.



c'est une facon de procéder que je ne comprends pas :
- quand le volume de données a traiter n'est pas important, j'évite
soigneusement d'utiliser perl ( préférant mawk (pas gawk, hein ...) ,
sed , grep ...).
La raison est que le poids de l'interpréteur perl ( la meme pour
python et ruby ) fait que le boulot serait déja fini avec sed et awk
alors que perl ne fait que finir de se charger.
- par contre: si je dois utiliser perl, ce langage a bien plus de
ressources que tous les autres filtre réunis ! je ne vois plus alors
pourquoi passer le résultat a un autre filtre !

C'est quand même chouette Linux/Unix sous windows cela manque quand m eme les
regex et petits utilitaires puissant en ligne de commande.



tcsh win32 port , gnuwin32 , activeperl ?

cordialement,

--
téléphone : 03.90.24.00.19
courriel :
---------------------------------------
Avatar
JF Straeten
Hello,

On Thu, Jun 08, 2006 at 12:29:51PM +0200, Marc Chantreux wrote:

- quand le volume de données a traiter n'est pas important, j'évite
soigneusement d'utiliser perl ( préférant mawk (pas gawk, hein ...) ,
sed , grep ...).
La raison est que le poids de l'interpréteur perl ( la meme pour
python et ruby ) fait que le boulot serait déja fini avec sed et awk
alors que perl ne fait que finir de se charger.



Tiens, et avec du code Perl préalablement compilé, ça changerait la
donne ou pas sensiblement ?

Je découvre Perl et c'est une question que je me suis souvent posée,
mais sans vraiment trouver de réponse...

Merci d'avance,

--

J.-F. STRAETEN

---
Mutt 1.5.6i
Powered by GNU/Linux - SuSE 9.1


--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Marc Chantreux
le 08/06/2006,
JF Straeten nous écrivait :

Hello,

On Thu, Jun 08, 2006 at 12:29:51PM +0200, Marc Chantreux wrote:

> - quand le volume de données a traiter n'est pas important, j'évi te
> soigneusement d'utiliser perl ( préférant mawk (pas gawk, hein ...) ,
> sed , grep ...).
> La raison est que le poids de l'interpréteur perl ( la meme pour
> python et ruby ) fait que le boulot serait déja fini avec sed et awk
> alors que perl ne fait que finir de se charger.

Tiens, et avec du code Perl préalablement compilé, ça changerait la
donne ou pas sensiblement ?



je doute qu'on y gagne grand chose mais :
- je n'ai jamais testé
- n'étant pas un pro en la matière, je ne saurais dire qui du chargem ent
ou de l'interprétation syntaxique prend le plus de temps.

Sinon, pour les différences de perf, j'avais écrit ca :

http://khatar.phear.org/shell/bench.html

ca donne des ordres de grandeur.

cordialement
mc

--
téléphone : 03.90.24.00.19
courriel :
---------------------------------------
Avatar
JusTiCe8
Bonsoir,

Marc Chantreux wrote:

c'est une facon de procéder que je ne comprends pas :
- quand le volume de données a traiter n'est pas important, j'évite
soigneusement d'utiliser perl ( préférant mawk (pas gawk, hein ...) ,
sed , grep ...).
La raison est que le poids de l'interpréteur perl ( la meme pour
python et ruby ) fait que le boulot serait déja fini avec sed et awk
alors que perl ne fait que finir de se charger.



mdr !
ton système est stocker sur filer distant connecté en gprs ??

J8.


--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Marc Chantreux
le 08/06/2006,
JusTiCe8 nous écrivait :
mdr !
ton système est stocker sur filer distant connecté en gprs ??



non ... mon systeme est juste un peu vieux mais me rend bien des
services!

--
téléphone : 03.90.24.00.19
courriel :
---------------------------------------