récupérer des données (html)

Le
philippe.doulet
bonjour a tous,
j'ai besoin d'aller recuperer des données dans des pages html ( fournisseur
, adresse, etc..)
je me suis inspiré d'un programme que j'ai trouvé sur internet (wpdowsrc :
recupere les images -visual studio 2005 C#) pour commencer a parcourir
l'arborescence des sites recherchés avec mes mots cles
tout se passe correctement juqu'au moment ou , selon le site visité , je
tombe sur des differences notables :

un site va afficher directement dans un tableau l'ensemble des resultats
voulus
un autre me renvoie sur un <a href = https://www.
un autre affiche dans un tableau une partie seulement des résultats et la
reference suivante:
<a href = index.php?vu=5&lignes&pas=5 class=lien_list><les 5 suivants>/a>
(je n'ai trouvé nulle part dans le html de correspondance pour lien_list)

comment faire pour retrouver ses petits , sachant que je n'ai consulté que 3
sites , et que je voudrais en consulter d'autres
merci de m'aider (je debute sur ce genre de choses)
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Jean BONBEUR
Le #12176671
pas de recette miracle. c'est presque toujours comme ça avec le html. pour
faire simple, on peut faire un modele de recherche par site connu. bien sur,
faudra modifier son modele chaque fois qu'un site va changer sa mise en
forme.
apres, il reste des techniques plus sophistiquées qui consistent à
reconnaitre les sequences qui se repetent, c'est beaucoup d'energie pour
beaucoup de deceptions avant d'avoir quelque chose qui marchotte... de ce
que j'en sais, certains sites offrent un web service pour justement répondre
à votre besoin. mais c'est pas generalisable à tous.

voila voila...
philippe.doulet
Le #12176651
merci de votre reponse, je crois qu'effectivement le modele doit etre la
bonne recette, j'y pensais depuis peu mais etais rebuté
par l'ampleur des manipulations et recherches preliminaires a faire mais
qu'avec" patience et longueur de temps..."
merci encore

"Jean BONBEUR" %23pBxnQB$
pas de recette miracle. c'est presque toujours comme ça avec le html. pour
faire simple, on peut faire un modele de recherche par site connu. bien
sur, faudra modifier son modele chaque fois qu'un site va changer sa mise
en forme.
apres, il reste des techniques plus sophistiquées qui consistent à
reconnaitre les sequences qui se repetent, c'est beaucoup d'energie pour
beaucoup de deceptions avant d'avoir quelque chose qui marchotte... de ce
que j'en sais, certains sites offrent un web service pour justement
répondre à votre besoin. mais c'est pas generalisable à tous.

voila voila...



Publicité
Poster une réponse
Anonyme