Est-ce que quelqu'un peut m'expliquer comment utiliser HTML::Parser pour
récupérer du texte compris entre une balise de type font avec des
attributs, exemple:
<font face="Arial" size="2"> texte à extraire </font>
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
Philippe Bricout
"franck" écrivait dans l'article news::
Est-ce que quelqu'un peut m'expliquer comment utiliser HTML::Parser pour récupérer du texte compris entre une balise de type font avec des attributs, exemple: <font face="Arial" size="2"> texte à extraire </font>
Non :)
En fait HTML::TreeBuilder me parait plus simple ici, même si on peut se débrouiller avec HTML::Parser.
Ci-dessous un squelette qui fait ce que vous voulez (à peu près). Pour plus de finesse, vous pouvez utiliser la méthode look_down à la place de find_by_tag_name (cf. HTML::Element) Le code ci-dessous ne tient pas compte de possibles imbrications de tags 'font'. ----
use HTML::TreeBuilder;
my $t = HTML::TreeBuilder->new; $t->parse_file("foo.htm"); my @c_font = $t->find_by_tag_name('font'); print $_->as_text,"n" for @c_font;
"franck" <f.collineau@voila.fr> écrivait dans l'article
news:pan.2003.07.18.16.22.27.931869@voila.fr:
Est-ce que quelqu'un peut m'expliquer comment utiliser HTML::Parser pour
récupérer du texte compris entre une balise de type font avec des
attributs, exemple:
<font face="Arial" size="2"> texte à extraire </font>
Non :)
En fait HTML::TreeBuilder me parait plus simple ici, même si on peut se
débrouiller avec HTML::Parser.
Ci-dessous un squelette qui fait ce que vous voulez (à peu près).
Pour plus de finesse, vous pouvez utiliser la méthode look_down à la place
de find_by_tag_name (cf. HTML::Element)
Le code ci-dessous ne tient pas compte de possibles imbrications de tags
'font'.
----
use HTML::TreeBuilder;
my $t = HTML::TreeBuilder->new;
$t->parse_file("foo.htm");
my @c_font = $t->find_by_tag_name('font');
print $_->as_text,"n" for @c_font;
Est-ce que quelqu'un peut m'expliquer comment utiliser HTML::Parser pour récupérer du texte compris entre une balise de type font avec des attributs, exemple: <font face="Arial" size="2"> texte à extraire </font>
Non :)
En fait HTML::TreeBuilder me parait plus simple ici, même si on peut se débrouiller avec HTML::Parser.
Ci-dessous un squelette qui fait ce que vous voulez (à peu près). Pour plus de finesse, vous pouvez utiliser la méthode look_down à la place de find_by_tag_name (cf. HTML::Element) Le code ci-dessous ne tient pas compte de possibles imbrications de tags 'font'. ----
use HTML::TreeBuilder;
my $t = HTML::TreeBuilder->new; $t->parse_file("foo.htm"); my @c_font = $t->find_by_tag_name('font'); print $_->as_text,"n" for @c_font;