Lenteur de mon pgm

Paul Gaborit

24/10/2006 à 09:03

À (at) Mon, 23 Oct 2006 22:25:42 +0200,
"Yann Leguen" écrivait (wrote):

Bonjour,
Je fais actuellement un programme qui permet de récupérer dans une liste un
element d'aprés un element de la ligne (...)
[...]

Voila, mon programme marche bien, le seul probleme, c'est qu'il est
trés lent. (En effet, j'écrit beaucoup -Mais l'écriture est la
science de l'ane-) Existe - t'il une solution pour aller plus vite
(fichier temporaire, ...) Merci de votre aide, car là je seche .

Votre programme est lent parce que :
1- vous passez par un fichier temporaire alors qu'il me semble que
c'est inutile.
2- vous ouvrez et refermez vos fichiers à chaque écriture alors qu'il
suffirait de les ouvrir une bonne fois pour toutes au début.
3- vous faites appel à des programmes externes (sed, cut...) alors que
Perl sait faire beaucoup mieux.

Décrivez donc votre besoin réel :
- comment faire pour repérer une ligne intéressante ?
- où est l'information discriminante dans la ligne ?
- dans quel(s) fichier(s) une ligne intéressante doit-elle être écrite ?
et nous pourrons vous donner des pistes pour écrire votre programme
efficacement.

--
Paul Gaborit - <http://perso.enstimac.fr/~gaborit/>
Perl en français - <http://perl.enstimac.fr/>

Yann Leguen

24/10/2006 à 23:28

Merci de la réponse. En partie elle m'aide dans le cas de l'ouverture des
fichiers (...)
En ce qui concerne sed et cut, je n'ai que peu d'alternative . Il y a
"split" mais mon
fichier ne me le permet pas (je penses) .

voici le fichier que j'ai à traiter, l'information qui me permettra
d'extraire la donnée .

le fichier.txt contient les informations suivantes:

AA nom1 1234 5678 9012
AB lenom2 1235 6789 9016
AA nomnumero3 3451 1548 5684
BB nom4 251 5684 66

Je dois extraire le "nom" en fonction du 1er groupe de chiffre. (disons si
le nombre est > à 100)

Etant donné que le nombre d'espace entre "le nom" et le 1er groupe de
chiffre est variable
(Lié à la longueur du nom) j'utilise la commande cut -c24-30 pour ne garder
que le 1er groupe
de chiffre.

Si le groupe est > à 100 (par exemple ;-) alors je récupère "le nom" dans un
fichier X, Si le
1er groupe est < à 100, alors je récupère également "le nom" mais dans un
fichier Y que je traiterai
ultérieurement.

Dans ma logique, j'écris d'abord toute la ligne dans un fichier temporaire
(que j'écrase à chaque nouvelle écriture)
AA nom1 1234 5678 9012
Je récupère le 1er groupe de chiffre (1234)
Il est > à 100 alors je récupère "nom1" dans un fichier.
et je recommence jusqu'à ce que j'ai traité toutes les lignes de mon fichier
(qui en comporte environ 1000)

Voilà, j'espère avoir été clair. Dans tous les cas, le fait (effectivement)
d'ouvrir mes fichiers avant me fait
déjà gagné un peu de temps. Merci pour ce tuyau.

Dans l'attente de vous relire.

Yann

--
"Connaître son ignorance est la meilleure part de la connaissance"
"Paul Gaborit" a écrit dans le message de
news:

À (at) Mon, 23 Oct 2006 22:25:42 +0200,
"Yann Leguen" écrivait (wrote):
Bonjour,
Je fais actuellement un programme qui permet de récupérer dans une liste
un
element d'aprés un element de la ligne (...)
[...]

Voila, mon programme marche bien, le seul probleme, c'est qu'il est
trés lent. (En effet, j'écrit beaucoup -Mais l'écriture est la
science de l'ane-) Existe - t'il une solution pour aller plus vite
(fichier temporaire, ...) Merci de votre aide, car là je seche .

Votre programme est lent parce que :
1- vous passez par un fichier temporaire alors qu'il me semble que
c'est inutile.
2- vous ouvrez et refermez vos fichiers à chaque écriture alors qu'il
suffirait de les ouvrir une bonne fois pour toutes au début.
3- vous faites appel à des programmes externes (sed, cut...) alors que
Perl sait faire beaucoup mieux.

Décrivez donc votre besoin réel :
- comment faire pour repérer une ligne intéressante ?
- où est l'information discriminante dans la ligne ?
- dans quel(s) fichier(s) une ligne intéressante doit-elle être écrite ?
et nous pourrons vous donner des pistes pour écrire votre programme
efficacement.

--
Paul Gaborit - <http://perso.enstimac.fr/~gaborit/>
Perl en français - <http://perl.enstimac.fr/>

Merci de la réponse. En partie elle m'aide dans le cas de l'ouverture des
fichiers (...)
En ce qui concerne sed et cut, je n'ai que peu d'alternative . Il y a
"split" mais mon
fichier ne me le permet pas (je penses) .

voici le fichier que j'ai à traiter, l'information qui me permettra
d'extraire la donnée .

le fichier.txt contient les informations suivantes:

AA nom1 1234 5678 9012
AB lenom2 1235 6789 9016
AA nomnumero3 3451 1548 5684
BB nom4 251 5684 66

Je dois extraire le "nom" en fonction du 1er groupe de chiffre. (disons si
le nombre est > à 100)

Etant donné que le nombre d'espace entre "le nom" et le 1er groupe de
chiffre est variable
(Lié à la longueur du nom) j'utilise la commande cut -c24-30 pour ne garder
que le 1er groupe
de chiffre.

Si le groupe est > à 100 (par exemple ;-) alors je récupère "le nom" dans un
fichier X, Si le
1er groupe est < à 100, alors je récupère également "le nom" mais dans un
fichier Y que je traiterai
ultérieurement.

Dans ma logique, j'écris d'abord toute la ligne dans un fichier temporaire
(que j'écrase à chaque nouvelle écriture)
AA nom1 1234 5678 9012
Je récupère le 1er groupe de chiffre (1234)
Il est > à 100 alors je récupère "nom1" dans un fichier.
et je recommence jusqu'à ce que j'ai traité toutes les lignes de mon fichier
(qui en comporte environ 1000)

Voilà, j'espère avoir été clair. Dans tous les cas, le fait (effectivement)
d'ouvrir mes fichiers avant me fait
déjà gagné un peu de temps. Merci pour ce tuyau.

Dans l'attente de vous relire.

Yann

--
"Connaître son ignorance est la meilleure part de la connaissance"
"Paul Gaborit" <Paul.Gaborit@invalid.invalid> a écrit dans le message de
news: wt9bqo22o0w.fsf@marceau.enstimac.fr...

À (at) Mon, 23 Oct 2006 22:25:42 +0200,
"Yann Leguen" <Yann.Leguen@breizhatao.fr> écrivait (wrote):

Bonjour,
Je fais actuellement un programme qui permet de récupérer dans une liste
un
element d'aprés un element de la ligne (...)
[...]

Voila, mon programme marche bien, le seul probleme, c'est qu'il est
trés lent. (En effet, j'écrit beaucoup -Mais l'écriture est la
science de l'ane-) Existe - t'il une solution pour aller plus vite
(fichier temporaire, ...) Merci de votre aide, car là je seche .

Votre programme est lent parce que :
1- vous passez par un fichier temporaire alors qu'il me semble que
c'est inutile.
2- vous ouvrez et refermez vos fichiers à chaque écriture alors qu'il
suffirait de les ouvrir une bonne fois pour toutes au début.
3- vous faites appel à des programmes externes (sed, cut...) alors que
Perl sait faire beaucoup mieux.

Décrivez donc votre besoin réel :
- comment faire pour repérer une ligne intéressante ?
- où est l'information discriminante dans la ligne ?
- dans quel(s) fichier(s) une ligne intéressante doit-elle être écrite ?
et nous pourrons vous donner des pistes pour écrire votre programme
efficacement.

--
Paul Gaborit - <http://perso.enstimac.fr/~gaborit/>
Perl en français - <http://perl.enstimac.fr/>

Vous avez filtré cet utilisateur ! Consultez son message

Merci de la réponse. En partie elle m'aide dans le cas de l'ouverture des
fichiers (...)
En ce qui concerne sed et cut, je n'ai que peu d'alternative . Il y a
"split" mais mon
fichier ne me le permet pas (je penses) .

voici le fichier que j'ai à traiter, l'information qui me permettra
d'extraire la donnée .

le fichier.txt contient les informations suivantes:

AA nom1 1234 5678 9012
AB lenom2 1235 6789 9016
AA nomnumero3 3451 1548 5684
BB nom4 251 5684 66

Je dois extraire le "nom" en fonction du 1er groupe de chiffre. (disons si
le nombre est > à 100)

Etant donné que le nombre d'espace entre "le nom" et le 1er groupe de
chiffre est variable
(Lié à la longueur du nom) j'utilise la commande cut -c24-30 pour ne garder
que le 1er groupe
de chiffre.

Si le groupe est > à 100 (par exemple ;-) alors je récupère "le nom" dans un
fichier X, Si le
1er groupe est < à 100, alors je récupère également "le nom" mais dans un
fichier Y que je traiterai
ultérieurement.

Dans ma logique, j'écris d'abord toute la ligne dans un fichier temporaire
(que j'écrase à chaque nouvelle écriture)
AA nom1 1234 5678 9012
Je récupère le 1er groupe de chiffre (1234)
Il est > à 100 alors je récupère "nom1" dans un fichier.
et je recommence jusqu'à ce que j'ai traité toutes les lignes de mon fichier
(qui en comporte environ 1000)

Voilà, j'espère avoir été clair. Dans tous les cas, le fait (effectivement)
d'ouvrir mes fichiers avant me fait
déjà gagné un peu de temps. Merci pour ce tuyau.

Dans l'attente de vous relire.

Yann

--
"Connaître son ignorance est la meilleure part de la connaissance"
"Paul Gaborit" a écrit dans le message de
news:

À (at) Mon, 23 Oct 2006 22:25:42 +0200,
"Yann Leguen" écrivait (wrote):
Bonjour,
Je fais actuellement un programme qui permet de récupérer dans une liste
un
element d'aprés un element de la ligne (...)
[...]

Voila, mon programme marche bien, le seul probleme, c'est qu'il est
trés lent. (En effet, j'écrit beaucoup -Mais l'écriture est la
science de l'ane-) Existe - t'il une solution pour aller plus vite
(fichier temporaire, ...) Merci de votre aide, car là je seche .

Votre programme est lent parce que :
1- vous passez par un fichier temporaire alors qu'il me semble que
c'est inutile.
2- vous ouvrez et refermez vos fichiers à chaque écriture alors qu'il
suffirait de les ouvrir une bonne fois pour toutes au début.
3- vous faites appel à des programmes externes (sed, cut...) alors que
Perl sait faire beaucoup mieux.

Décrivez donc votre besoin réel :
- comment faire pour repérer une ligne intéressante ?
- où est l'information discriminante dans la ligne ?
- dans quel(s) fichier(s) une ligne intéressante doit-elle être écrite ?
et nous pourrons vous donner des pistes pour écrire votre programme
efficacement.

--
Paul Gaborit - <http://perso.enstimac.fr/~gaborit/>
Perl en français - <http://perl.enstimac.fr/>

kotori

25/10/2006 à 00:56

Merci de la réponse. En partie elle m'aide dans le cas de l'ouverture des
fichiers (...)
En ce qui concerne sed et cut, je n'ai que peu d'alternative . Il y a
"split" mais mon
fichier ne me le permet pas (je penses) .

voici le fichier que j'ai à traiter, l'information qui me permettra
d'extraire la donnée .

le fichier.txt contient les informations suivantes:

AA nom1 1234 5678 9012
AB lenom2 1235 6789 9016
AA nomnumero3 3451 1548 5684
BB nom4 251 5684 66

Je dois extraire le "nom" en fonction du 1er groupe de chiffre. (disons si
le nombre est > à 100)

Etant donné que le nombre d'espace entre "le nom" et le 1er groupe de
chiffre est variable
(Lié à la longueur du nom) j'utilise la commande cut -c24-30 pour ne garder
que le 1er groupe
de chiffre.

Si le groupe est > à 100 (par exemple ;-) alors je récupère "le nom" dans un
fichier X, Si le
1er groupe est < à 100, alors je récupère également "le nom" mais dans un
fichier Y que je traiterai
ultérieurement.

Dans ma logique, j'écris d'abord toute la ligne dans un fichier temporaire
(que j'écrase à chaque nouvelle écriture)
AA nom1 1234 5678 9012
Je récupère le 1er groupe de chiffre (1234)
Il est > à 100 alors je récupère "nom1" dans un fichier.
et je recommence jusqu'à ce que j'ai traité toutes les lignes de mon fichier
(qui en comporte environ 1000)

Voilà, j'espère avoir été clair. Dans tous les cas, le fait (effectivement)
d'ouvrir mes fichiers avant me fait
déjà gagné un peu de temps. Merci pour ce tuyau.

Dans l'attente de vous relire.

Yann

une simple regex et deux if suffisent :)
/^w+s(D+)s+(d)sdsd/

$monfic="C:mon fichier.txt";
$varP0;
open (FIC,"$monfic") || die "je ne peux ouvrir $monfic";
open (FIC1,">$fic_temp");
open (FIC2,">>C:PerlDEVSUP_A_500.txt");
foreachmy $ligne (<FIC>) {
my ( $nom , $nombre) = /^w+s(D+)s+(d)sdsd/g ;
print FIC1 $nom if ( $nombre > 500 ) ;
print FIC2 $nom if ( $nombre > 500 ) ;
}
close(FIC2);
close(FIC1);
close(FIC);

Merci de la réponse. En partie elle m'aide dans le cas de l'ouverture des
fichiers (...)
En ce qui concerne sed et cut, je n'ai que peu d'alternative . Il y a
"split" mais mon
fichier ne me le permet pas (je penses) .

voici le fichier que j'ai à traiter, l'information qui me permettra
d'extraire la donnée .

le fichier.txt contient les informations suivantes:

AA nom1 1234 5678 9012
AB lenom2 1235 6789 9016
AA nomnumero3 3451 1548 5684
BB nom4 251 5684 66

Je dois extraire le "nom" en fonction du 1er groupe de chiffre. (disons si
le nombre est > à 100)

Etant donné que le nombre d'espace entre "le nom" et le 1er groupe de
chiffre est variable
(Lié à la longueur du nom) j'utilise la commande cut -c24-30 pour ne garder
que le 1er groupe
de chiffre.

Si le groupe est > à 100 (par exemple ;-) alors je récupère "le nom" dans un
fichier X, Si le
1er groupe est < à 100, alors je récupère également "le nom" mais dans un
fichier Y que je traiterai
ultérieurement.

Dans ma logique, j'écris d'abord toute la ligne dans un fichier temporaire
(que j'écrase à chaque nouvelle écriture)
AA nom1 1234 5678 9012
Je récupère le 1er groupe de chiffre (1234)
Il est > à 100 alors je récupère "nom1" dans un fichier.
et je recommence jusqu'à ce que j'ai traité toutes les lignes de mon fichier
(qui en comporte environ 1000)

Voilà, j'espère avoir été clair. Dans tous les cas, le fait (effectivement)
d'ouvrir mes fichiers avant me fait
déjà gagné un peu de temps. Merci pour ce tuyau.

Dans l'attente de vous relire.

Yann

une simple regex et deux if suffisent :)
/^w+s(D+)s+(d)sdsd/

$monfic="C:mon fichier.txt";
$varP0;
open (FIC,"$monfic") || die "je ne peux ouvrir $monfic";
open (FIC1,">$fic_temp");
open (FIC2,">>C:\Perl\DEV\SUP_A_500.txt");
foreachmy $ligne (<FIC>) {
my ( $nom , $nombre) = /^w+s(D+)s+(d)sdsd/g ;
print FIC1 $nom if ( $nombre > 500 ) ;
print FIC2 $nom if ( $nombre > 500 ) ;
}
close(FIC2);
close(FIC1);
close(FIC);

Vous avez filtré cet utilisateur ! Consultez son message

Merci de la réponse. En partie elle m'aide dans le cas de l'ouverture des
fichiers (...)
En ce qui concerne sed et cut, je n'ai que peu d'alternative . Il y a
"split" mais mon
fichier ne me le permet pas (je penses) .

voici le fichier que j'ai à traiter, l'information qui me permettra
d'extraire la donnée .

le fichier.txt contient les informations suivantes:

AA nom1 1234 5678 9012
AB lenom2 1235 6789 9016
AA nomnumero3 3451 1548 5684
BB nom4 251 5684 66

Je dois extraire le "nom" en fonction du 1er groupe de chiffre. (disons si
le nombre est > à 100)

Etant donné que le nombre d'espace entre "le nom" et le 1er groupe de
chiffre est variable
(Lié à la longueur du nom) j'utilise la commande cut -c24-30 pour ne garder
que le 1er groupe
de chiffre.

Si le groupe est > à 100 (par exemple ;-) alors je récupère "le nom" dans un
fichier X, Si le
1er groupe est < à 100, alors je récupère également "le nom" mais dans un
fichier Y que je traiterai
ultérieurement.

Dans ma logique, j'écris d'abord toute la ligne dans un fichier temporaire
(que j'écrase à chaque nouvelle écriture)
AA nom1 1234 5678 9012
Je récupère le 1er groupe de chiffre (1234)
Il est > à 100 alors je récupère "nom1" dans un fichier.
et je recommence jusqu'à ce que j'ai traité toutes les lignes de mon fichier
(qui en comporte environ 1000)

Voilà, j'espère avoir été clair. Dans tous les cas, le fait (effectivement)
d'ouvrir mes fichiers avant me fait
déjà gagné un peu de temps. Merci pour ce tuyau.

Dans l'attente de vous relire.

Yann

une simple regex et deux if suffisent :)
/^w+s(D+)s+(d)sdsd/

$monfic="C:mon fichier.txt";
$varP0;
open (FIC,"$monfic") || die "je ne peux ouvrir $monfic";
open (FIC1,">$fic_temp");
open (FIC2,">>C:PerlDEVSUP_A_500.txt");
foreachmy $ligne (<FIC>) {
my ( $nom , $nombre) = /^w+s(D+)s+(d)sdsd/g ;
print FIC1 $nom if ( $nombre > 500 ) ;
print FIC2 $nom if ( $nombre > 500 ) ;
}
close(FIC2);
close(FIC1);
close(FIC);

Mark Clements

25/10/2006 à 16:19

kotori wrote:

Merci de la réponse. En partie elle m'aide dans le cas de l'ouverture
des fichiers (...)
En ce qui concerne sed et cut, je n'ai que peu d'alternative . Il y a
"split" mais mon
fichier ne me le permet pas (je penses) .

voici le fichier que j'ai à traiter, l'information qui me permettra
d'extraire la donnée .

le fichier.txt contient les informations suivantes:

AA nom1 1234 5678 9012
AB lenom2 1235 6789 9016
AA nomnumero3 3451 1548 5684
BB nom4 251 5684 66

Je dois extraire le "nom" en fonction du 1er groupe de chiffre.
(disons si le nombre est > à 100)

Etant donné que le nombre d'espace entre "le nom" et le 1er groupe de
chiffre est variable
(Lié à la longueur du nom) j'utilise la commande cut -c24-30 pour ne
garder que le 1er groupe
de chiffre.

Si le groupe est > à 100 (par exemple ;-) alors je récupère "le nom"
dans un fichier X, Si le
1er groupe est < à 100, alors je récupère également "le nom" mais dans
un fichier Y que je traiterai
ultérieurement.

Dans ma logique, j'écris d'abord toute la ligne dans un fichier
temporaire (que j'écrase à chaque nouvelle écriture)
AA nom1 1234 5678 9012
Je récupère le 1er groupe de chiffre (1234)
Il est > à 100 alors je récupère "nom1" dans un fichier.
et je recommence jusqu'à ce que j'ai traité toutes les lignes de mon
fichier (qui en comporte environ 1000)

Voilà, j'espère avoir été clair. Dans tous les cas, le fait
(effectivement) d'ouvrir mes fichiers avant me fait
déjà gagné un peu de temps. Merci pour ce tuyau.

Dans l'attente de vous relire.

Yann

une simple regex et deux if suffisent :)
/^w+s(D+)s+(d)sdsd/

(d) n'est pas correct - il va matcher une seule chiffre.

/^w+s(D+)s+(d+)sd+sd+/

Mais: si le format est de champs de largeur fixé, souvent unpack est
mieux. Il marche même s'il y a un champs vide, et il se peut qu'il soit
plus rapide.

eg

my @champs = unpack ("A2 A10 A6 A6", $ligne);

(je divine les nombres ici parce que je ne connais pas le format de
fichier exact).

Mark

kotori wrote:

Merci de la réponse. En partie elle m'aide dans le cas de l'ouverture
des fichiers (...)
En ce qui concerne sed et cut, je n'ai que peu d'alternative . Il y a
"split" mais mon
fichier ne me le permet pas (je penses) .

voici le fichier que j'ai à traiter, l'information qui me permettra
d'extraire la donnée .

le fichier.txt contient les informations suivantes:

AA nom1 1234 5678 9012
AB lenom2 1235 6789 9016
AA nomnumero3 3451 1548 5684
BB nom4 251 5684 66

Je dois extraire le "nom" en fonction du 1er groupe de chiffre.
(disons si le nombre est > à 100)

Etant donné que le nombre d'espace entre "le nom" et le 1er groupe de
chiffre est variable
(Lié à la longueur du nom) j'utilise la commande cut -c24-30 pour ne
garder que le 1er groupe
de chiffre.

Si le groupe est > à 100 (par exemple ;-) alors je récupère "le nom"
dans un fichier X, Si le
1er groupe est < à 100, alors je récupère également "le nom" mais dans
un fichier Y que je traiterai
ultérieurement.

Dans ma logique, j'écris d'abord toute la ligne dans un fichier
temporaire (que j'écrase à chaque nouvelle écriture)
AA nom1 1234 5678 9012
Je récupère le 1er groupe de chiffre (1234)
Il est > à 100 alors je récupère "nom1" dans un fichier.
et je recommence jusqu'à ce que j'ai traité toutes les lignes de mon
fichier (qui en comporte environ 1000)

Voilà, j'espère avoir été clair. Dans tous les cas, le fait
(effectivement) d'ouvrir mes fichiers avant me fait
déjà gagné un peu de temps. Merci pour ce tuyau.

Dans l'attente de vous relire.

Yann

une simple regex et deux if suffisent :)
/^w+s(D+)s+(d)sdsd/

(d) n'est pas correct - il va matcher une seule chiffre.

/^w+s(D+)s+(d+)sd+sd+/

Mais: si le format est de champs de largeur fixé, souvent unpack est
mieux. Il marche même s'il y a un champs vide, et il se peut qu'il soit
plus rapide.

eg

my @champs = unpack ("A2 A10 A6 A6", $ligne);

(je divine les nombres ici parce que je ne connais pas le format de
fichier exact).

Mark

Vous avez filtré cet utilisateur ! Consultez son message

kotori wrote:

Merci de la réponse. En partie elle m'aide dans le cas de l'ouverture
des fichiers (...)
En ce qui concerne sed et cut, je n'ai que peu d'alternative . Il y a
"split" mais mon
fichier ne me le permet pas (je penses) .

voici le fichier que j'ai à traiter, l'information qui me permettra
d'extraire la donnée .

le fichier.txt contient les informations suivantes:

AA nom1 1234 5678 9012
AB lenom2 1235 6789 9016
AA nomnumero3 3451 1548 5684
BB nom4 251 5684 66

Je dois extraire le "nom" en fonction du 1er groupe de chiffre.
(disons si le nombre est > à 100)

Etant donné que le nombre d'espace entre "le nom" et le 1er groupe de
chiffre est variable
(Lié à la longueur du nom) j'utilise la commande cut -c24-30 pour ne
garder que le 1er groupe
de chiffre.

Si le groupe est > à 100 (par exemple ;-) alors je récupère "le nom"
dans un fichier X, Si le
1er groupe est < à 100, alors je récupère également "le nom" mais dans
un fichier Y que je traiterai
ultérieurement.

Dans ma logique, j'écris d'abord toute la ligne dans un fichier
temporaire (que j'écrase à chaque nouvelle écriture)
AA nom1 1234 5678 9012
Je récupère le 1er groupe de chiffre (1234)
Il est > à 100 alors je récupère "nom1" dans un fichier.
et je recommence jusqu'à ce que j'ai traité toutes les lignes de mon
fichier (qui en comporte environ 1000)

Voilà, j'espère avoir été clair. Dans tous les cas, le fait
(effectivement) d'ouvrir mes fichiers avant me fait
déjà gagné un peu de temps. Merci pour ce tuyau.

Dans l'attente de vous relire.

Yann

une simple regex et deux if suffisent :)
/^w+s(D+)s+(d)sdsd/

(d) n'est pas correct - il va matcher une seule chiffre.

/^w+s(D+)s+(d+)sd+sd+/

Mais: si le format est de champs de largeur fixé, souvent unpack est
mieux. Il marche même s'il y a un champs vide, et il se peut qu'il soit
plus rapide.

eg

my @champs = unpack ("A2 A10 A6 A6", $ligne);

(je divine les nombres ici parce que je ne connais pas le format de
fichier exact).

Mark

Yann Leguen

27/10/2006 à 00:27

Merci pour les infos. Je me suis plongé dans les RegEx et effectivement,
j'ai trouvé mon bonheur.
Merci encore.

Yann

--
"Connaître son ignorance est la meilleure part de la connaissance"
"Mark Clements" a écrit dans le message
de news: 453f727b$0$27377$

kotori wrote:
Merci de la réponse. En partie elle m'aide dans le cas de l'ouverture
des fichiers (...)
En ce qui concerne sed et cut, je n'ai que peu d'alternative . Il y a
"split" mais mon
fichier ne me le permet pas (je penses) .

voici le fichier que j'ai à traiter, l'information qui me permettra
d'extraire la donnée .

le fichier.txt contient les informations suivantes:

AA nom1 1234 5678 9012
AB lenom2 1235 6789 9016
AA nomnumero3 3451 1548 5684
BB nom4 251 5684 66

Je dois extraire le "nom" en fonction du 1er groupe de chiffre. (disons
si le nombre est > à 100)

Etant donné que le nombre d'espace entre "le nom" et le 1er groupe de
chiffre est variable
(Lié à la longueur du nom) j'utilise la commande cut -c24-30 pour ne
garder que le 1er groupe
de chiffre.

Si le groupe est > à 100 (par exemple ;-) alors je récupère "le nom"
dans un fichier X, Si le
1er groupe est < à 100, alors je récupère également "le nom" mais dans
un fichier Y que je traiterai
ultérieurement.

Dans ma logique, j'écris d'abord toute la ligne dans un fichier
temporaire (que j'écrase à chaque nouvelle écriture)
AA nom1 1234 5678 9012
Je récupère le 1er groupe de chiffre (1234)
Il est > à 100 alors je récupère "nom1" dans un fichier.
et je recommence jusqu'à ce que j'ai traité toutes les lignes de mon
fichier (qui en comporte environ 1000)

Voilà, j'espère avoir été clair. Dans tous les cas, le fait
(effectivement) d'ouvrir mes fichiers avant me fait
déjà gagné un peu de temps. Merci pour ce tuyau.

Dans l'attente de vous relire.

Yann

une simple regex et deux if suffisent :)
/^w+s(D+)s+(d)sdsd/

(d) n'est pas correct - il va matcher une seule chiffre.

/^w+s(D+)s+(d+)sd+sd+/

Mais: si le format est de champs de largeur fixé, souvent unpack est
mieux. Il marche même s'il y a un champs vide, et il se peut qu'il soit
plus rapide.

eg

my @champs = unpack ("A2 A10 A6 A6", $ligne);

(je divine les nombres ici parce que je ne connais pas le format de
fichier exact).

Mark

Merci pour les infos. Je me suis plongé dans les RegEx et effectivement,
j'ai trouvé mon bonheur.
Merci encore.

Yann

--
"Connaître son ignorance est la meilleure part de la connaissance"
"Mark Clements" <mark.clementsREMOVETHIS@wanadoo.fr> a écrit dans le message
de news: 453f727b$0$27377$ba4acef3@news.orange.fr...

kotori wrote:

Merci de la réponse. En partie elle m'aide dans le cas de l'ouverture
des fichiers (...)
En ce qui concerne sed et cut, je n'ai que peu d'alternative . Il y a
"split" mais mon
fichier ne me le permet pas (je penses) .

voici le fichier que j'ai à traiter, l'information qui me permettra
d'extraire la donnée .

le fichier.txt contient les informations suivantes:

AA nom1 1234 5678 9012
AB lenom2 1235 6789 9016
AA nomnumero3 3451 1548 5684
BB nom4 251 5684 66

Je dois extraire le "nom" en fonction du 1er groupe de chiffre. (disons
si le nombre est > à 100)

Etant donné que le nombre d'espace entre "le nom" et le 1er groupe de
chiffre est variable
(Lié à la longueur du nom) j'utilise la commande cut -c24-30 pour ne
garder que le 1er groupe
de chiffre.

Si le groupe est > à 100 (par exemple ;-) alors je récupère "le nom"
dans un fichier X, Si le
1er groupe est < à 100, alors je récupère également "le nom" mais dans
un fichier Y que je traiterai
ultérieurement.

Dans ma logique, j'écris d'abord toute la ligne dans un fichier
temporaire (que j'écrase à chaque nouvelle écriture)
AA nom1 1234 5678 9012
Je récupère le 1er groupe de chiffre (1234)
Il est > à 100 alors je récupère "nom1" dans un fichier.
et je recommence jusqu'à ce que j'ai traité toutes les lignes de mon
fichier (qui en comporte environ 1000)

Voilà, j'espère avoir été clair. Dans tous les cas, le fait
(effectivement) d'ouvrir mes fichiers avant me fait
déjà gagné un peu de temps. Merci pour ce tuyau.

Dans l'attente de vous relire.

Yann

une simple regex et deux if suffisent :)
/^w+s(D+)s+(d)sdsd/

(d) n'est pas correct - il va matcher une seule chiffre.

/^w+s(D+)s+(d+)sd+sd+/

Mais: si le format est de champs de largeur fixé, souvent unpack est
mieux. Il marche même s'il y a un champs vide, et il se peut qu'il soit
plus rapide.

eg

my @champs = unpack ("A2 A10 A6 A6", $ligne);

(je divine les nombres ici parce que je ne connais pas le format de
fichier exact).

Mark

Vous avez filtré cet utilisateur ! Consultez son message

Merci pour les infos. Je me suis plongé dans les RegEx et effectivement,
j'ai trouvé mon bonheur.
Merci encore.

Yann

--
"Connaître son ignorance est la meilleure part de la connaissance"
"Mark Clements" a écrit dans le message
de news: 453f727b$0$27377$

kotori wrote:
Merci de la réponse. En partie elle m'aide dans le cas de l'ouverture
des fichiers (...)
En ce qui concerne sed et cut, je n'ai que peu d'alternative . Il y a
"split" mais mon
fichier ne me le permet pas (je penses) .

voici le fichier que j'ai à traiter, l'information qui me permettra
d'extraire la donnée .

le fichier.txt contient les informations suivantes:

AA nom1 1234 5678 9012
AB lenom2 1235 6789 9016
AA nomnumero3 3451 1548 5684
BB nom4 251 5684 66

Je dois extraire le "nom" en fonction du 1er groupe de chiffre. (disons
si le nombre est > à 100)

Etant donné que le nombre d'espace entre "le nom" et le 1er groupe de
chiffre est variable
(Lié à la longueur du nom) j'utilise la commande cut -c24-30 pour ne
garder que le 1er groupe
de chiffre.

Si le groupe est > à 100 (par exemple ;-) alors je récupère "le nom"
dans un fichier X, Si le
1er groupe est < à 100, alors je récupère également "le nom" mais dans
un fichier Y que je traiterai
ultérieurement.

Dans ma logique, j'écris d'abord toute la ligne dans un fichier
temporaire (que j'écrase à chaque nouvelle écriture)
AA nom1 1234 5678 9012
Je récupère le 1er groupe de chiffre (1234)
Il est > à 100 alors je récupère "nom1" dans un fichier.
et je recommence jusqu'à ce que j'ai traité toutes les lignes de mon
fichier (qui en comporte environ 1000)

Voilà, j'espère avoir été clair. Dans tous les cas, le fait
(effectivement) d'ouvrir mes fichiers avant me fait
déjà gagné un peu de temps. Merci pour ce tuyau.

Dans l'attente de vous relire.

Yann

une simple regex et deux if suffisent :)
/^w+s(D+)s+(d)sdsd/

(d) n'est pas correct - il va matcher une seule chiffre.

/^w+s(D+)s+(d+)sd+sd+/

Mais: si le format est de champs de largeur fixé, souvent unpack est
mieux. Il marche même s'il y a un champs vide, et il se peut qu'il soit
plus rapide.

eg

my @champs = unpack ("A2 A10 A6 A6", $ligne);

(je divine les nombres ici parce que je ne connais pas le format de
fichier exact).

Mark

Lenteur de mon pgm

5 réponses

Veuillez sélectionner un problème