Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

extraire des element html

1 réponse
Avatar
Alain BarBason
Bonjour,

J'aimerais savoir si quelqu'un a un petit exemple de programme qui
permettrait d'avoir des indications sur des pages html de différents sites.

je boucle sur les sites, et j'aimerais avoir la taille de la home page,
le titre, le poids des images, lesl iens, le charset utilisés, etc...

j'ai été voir sur le cpan, mais je me perds dans ce genre de module
http://search.cpan.org/~ovid/HTML-TokeParser-Simple-3.14/lib/HTML/TokeParser/Simple.pm

rien que pour extraire
<title>Mon titre</title>
dont j'aimrais avoir une instruction du type
extraire_dons_mon_fichier($mon_fichier_html,"title");

(bon je sais je peux faire un regexp, mais la suite sera plus difficle
car je veux aller plus loin)

bien le merci.
--
by AlainBB
http://www.barbason.be

1 réponse

Avatar
Alain BarBason
Bonjour,

J'aimerais savoir si quelqu'un a un petit exemple de programme qui
permettrait d'avoir des indications sur des pages html de différents sites.

je boucle sur les sites, et j'aimerais avoir la taille de la home page,
le titre, le poids des images, lesl iens, le charset utilisés, etc...

j'ai été voir sur le cpan, mais je me perds dans ce genre de module
http://search.cpan.org/~ovid/HTML-TokeParser-Simple-3.14/lib/HTML/TokeParser/Simple.pm


rien que pour extraire
<title>Mon titre</title>
dont j'aimrais avoir une instruction du type
extraire_dons_mon_fichier($mon_fichier_html,"title");

(bon je sais je peux faire un regexp, mais la suite sera plus difficle
car je veux aller plus loin)


ben j'ai trouvé
suffisait de lire
http://search.cpan.org/~gaas/HTML-Parser-3.46/Parser.pm
y a un exemple tout fait

bien le merci.



--
by AlainBB
http://www.barbason.be