OVH Cloud OVH Cloud

Html & split

61 réponses
Avatar
ptilou
Bonsoir,

J'ai un fichier de 50 Mo, je souhaiterais le d=E9couper =E0 chaque fois
qu'il y a la balise <HTML> en un "fichier fille"
Voila se que j'ai fais et marche pas :
#!/usr/local/bin/perl -wn
BEGIN {
$file =3D "$0";
$/ =3D \<HTML>;
$n =3D 1;
}
unless( $n++ % \<HTML> ) { close F;
open F, "> $file.csv"
or die "Impossible de cr=E9er $file.csv: $!";
$file++;
}
print F;

L'erreur : $ perl -w cut-perl partie00
readline() on unopened filehandle HTML at cut-perl line 4.
Use of uninitialized value in <HANDLE> at cut-perl line 1.
readline() on unopened filehandle HTML at cut-perl line 7.
print() on unopened filehandle F at cut-perl line 12.
Use of uninitialized value in <HANDLE> at cut-perl line 12, <> chunk 1.

Mer=E7i

Ptilou

1 réponse

3 4 5 6 7
Avatar
Stephane Zuckerman
Salut,

Je voudrais cette fois supprimer la présentation de la page de <head>
à </head> et récupérer, le contenue , de la premiére balise <b> et
en faire le titre de la page ainsi que le nom du fichier !
Puis la balise <h5> mais la 5 eme et la metre dans un fichier autre et
qui serait un lien d'ou elle a été extré, etc ...


Je te conseille fortement le Perl Cookbook, qui contient tout un tas de
recettes de cuisine pour Perl (étonnant, non ?).

Il répondra mieux et plus vite à tes interrogations.

Sinon, il y a toujours perlmonks, ainsi que perl.com.

Google est évidemment ton ami aussi. Ainsi que les archives de
fr.comp.lang.perl, et comp.lang.perl.misc .

--
"Je deteste les ordinateurs : ils font toujours ce que je dis, jamais ce
que je veux !"
"The obvious mathematical breakthrough would be development of an easy
way to factor large prime numbers." (Bill Gates, The Road Ahead)

3 4 5 6 7