Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

extraire un noeud html

2 réponses
Avatar
steph
Bonjour,


Existe-t-il une api permettant d'extraire d'un document html une neoud dont on
donnerait le chemin sous la forme

html/body/p[4]/form/input[2]

cad le deuxième champ du formulaire du quatrième paragraphe.

?

J'ai commencé à dévollopper qqch par moi même mais ça n'tes pas rebuste.

Une fois que l'arbre du fichier html est construit, je suis arrivé à extraire un
noeud à partir du chemin.

le plus compliquer pour moi est de construire cet arbre à partir du flux html.
le parseur que j'ai écrit ne marche que sur les fichers en xhtml bien formé ce
qui ne représente pas le millième des pages sur internet.

j'ai regardé du côté de htmlparser sur sourceforge, mais avec cette api, je
n'arrive pas à extraire un noeud.

qqun a une piste ?

merci.

--
stephane
retirez les lettres majuscules et le 666 de l'adresse pour l'utiliser.

2 réponses

Avatar
Fabrice Bonny

Existe-t-il une api permettant d'extraire d'un document html une neoud
dont on donnerait le chemin sous la forme

html/body/p[4]/form/input[2]

cad le deuxième champ du formulaire du quatrième paragraphe.


DOM:
document.getElementsByTagName("p")[3].getElementsByTagName("form")[0].getElementsByTagName("input")[1],
en très gros.

--
Fabrice Bonny

Avatar
Pierre Goiffon
steph wrote:
Existe-t-il une api permettant d'extraire d'un document html une
neoud dont on donnerait le chemin sous la forme

html/body/p[4]/form/input[2]

cad le deuxième champ du formulaire du quatrième paragraphe.


Ca s'appelle le DOM.
Désolé je ne peux poursuivre la discussion, n'étant pas abonné à
fr.comp.lang.java (vous auriez peut être du préciser le suivi positionné
dans mvotre message d'ailleurs). Le mieux pour obtenir des renseignements à
mon sens serait de poster sur fr.comp.infosystemes.www.auteurs ou
fr.comp.lang.javascript (si votre traitement est dans ce langage)...

--
Pour me répondre par mail privé, merci de supprimer _NOSPAM_ de mon
adresse.

Un grand merci à OE Quote Fix pour rendre OE utilisable :)
=> http://home.in.tum.de/~jain/software/quotefix.php