J'ai créé un petit script pour fusionner et traiter les doublons dans 2
listes distinct. Les 2 listes contiennnent plus de 10000 enregistrement
et le traitement est plutôt long ! Comment je pourrais optimiser mon
script pour un traitement plus rapide ?
Merci
### Voici le script ###
#!/usr/bin/perl
my @item_list;
# Première liste
open (TXTFILE, "list-item1.txt");
while(<TXTFILE>){
chomp;
&check_ok($_);
}
close(TXTFILE);
# Deuxième liste
open (TXTFILE, "list-item2.txt");
while(<TXTFILE>){
chomp;
my $item = (split/\,/,$_)[1];
&check_ok($item);
}
close(TXTFILE);
# Enregistrement des données traitées
open (TXTFILE, ">new_list.txt");
foreach(@item_list){
print TXTFILE $_."\n";
}
close(TXTFILE);
############################## - ??
sub check_ok {
my $item = shift;
my $ok = 0;
for(my $i=0;$i<scalar(@item_list);$i++){
if($item_list[$i] == $item){$ok=1;last;}
}
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
Nicolas George
"ZigZag15551" wrote in message :
J'ai créé un petit script pour fusionner et traiter les doublons dans 2 listes distinct. Les 2 listes contiennnent plus de 10000 enregistrement et le traitement est plutôt long ! Comment je pourrais optimiser mon script pour un traitement plus rapide ?
En utilisant les items comme clefs d'une table de hashage ou comme indices d'un tableau, où stocker n'importe quelle valeur (typiquement 1) pour tester l'existence sans parcourir le tableau.
Si ça ne suffit pas, _The Art of Computer Programming_, volume 2.
"ZigZag15551" wrote in message <mn.7b467d63d7b059a9.42276@hotmail.com>:
J'ai créé un petit script pour fusionner et traiter les doublons dans 2
listes distinct. Les 2 listes contiennnent plus de 10000 enregistrement
et le traitement est plutôt long ! Comment je pourrais optimiser mon
script pour un traitement plus rapide ?
En utilisant les items comme clefs d'une table de hashage ou comme indices
d'un tableau, où stocker n'importe quelle valeur (typiquement 1) pour tester
l'existence sans parcourir le tableau.
Si ça ne suffit pas, _The Art of Computer Programming_, volume 2.
J'ai créé un petit script pour fusionner et traiter les doublons dans 2 listes distinct. Les 2 listes contiennnent plus de 10000 enregistrement et le traitement est plutôt long ! Comment je pourrais optimiser mon script pour un traitement plus rapide ?
En utilisant les items comme clefs d'une table de hashage ou comme indices d'un tableau, où stocker n'importe quelle valeur (typiquement 1) pour tester l'existence sans parcourir le tableau.
Si ça ne suffit pas, _The Art of Computer Programming_, volume 2.