OVH Cloud OVH Cloud

HTML::Parser

1 réponse
Avatar
franck
Bonjour,

Est-ce que quelqu'un peut m'expliquer comment utiliser HTML::Parser pour
récupérer du texte compris entre une balise de type font avec des
attributs, exemple:
<font face="Arial" size="2"> texte à extraire </font>


Merci

FRanck

1 réponse

Avatar
Philippe Bricout
"franck" écrivait dans l'article
news::

Est-ce que quelqu'un peut m'expliquer comment utiliser HTML::Parser pour
récupérer du texte compris entre une balise de type font avec des
attributs, exemple:
<font face="Arial" size="2"> texte à extraire </font>


Non :)

En fait HTML::TreeBuilder me parait plus simple ici, même si on peut se
débrouiller avec HTML::Parser.

Ci-dessous un squelette qui fait ce que vous voulez (à peu près).
Pour plus de finesse, vous pouvez utiliser la méthode look_down à la place
de find_by_tag_name (cf. HTML::Element)
Le code ci-dessous ne tient pas compte de possibles imbrications de tags
'font'.
----

use HTML::TreeBuilder;

my $t = HTML::TreeBuilder->new;
$t->parse_file("foo.htm");
my @c_font = $t->find_by_tag_name('font');
print $_->as_text,"n" for @c_font;