Parser les resultats de moteurs de rech erche

Le
Olivier Masson
Bonjour,

pensez-vous qu'il soit réaliste de faire une programme permettant de
donner le classement d'un site pour une requête donnée, tel que le ferai
l'API Google ou l'API Yahoo ?

Le but est d'avoir de vrais résultats : ceux de l'API Google - j'ai une
clé :) - sont connus pour être parfois très différents de ceux du moteur
de recherche et ceux de Yahoo pas parfait non plus. Et cela permettrait
d'étendre le procédé à d'autres moteurs.

J'ai pensé bêtement utiliser fopen ou curl_exec et cherche dans le
contenu un motif qui me permette de trouver les url.
Par exemple Google a toujours
<div class=g>
<!--m-->
<h2 class=r>
avant l'url trouvé.
Si ça change soudainement, on le verra dans les résultats.

Merci.
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Vincent Lascaux
Le #65325
pensez-vous qu'il soit réaliste de faire une programme permettant de
donner le classement d'un site pour une requête donnée, tel que le ferai
l'API Google ou l'API Yahoo ?


Oui, mais je ne pense pas que ce soit légal

--
Vincent

Denis Beauregard
Le #65323
Le 10 Apr 2007 05:20:21 GMT, Vincent Lascaux

pensez-vous qu'il soit réaliste de faire une programme permettant de
donner le classement d'un site pour une requête donnée, tel que le ferai
l'API Google ou l'API Yahoo ?


Oui, mais je ne pense pas que ce soit légal


Pourtant, il me semble que je suis tombé sur un site qui utilisait
l'API de Google pour donner les résultats avec le page rank et un
autre qui donnait le position d'un site parmi les 100 premiers
résultats d'une requête google.

Je n'ai pas noté les adresses de ces sites et ce n'est plus dans
l'historique de mon navigateur mais on devrait les retrouver
facilement.

Avec une recherche rapide:

http://www.seochat.com/seo-tools/pagerank-search/
indique le PR des sites trouvés. Pas de pub google, mais
google l'a trouvé.

http://www.ebiztools.ca/seo-tools/google&yahoo.php
Cette page n'a que l'outil de seochat et des bannières google.

Donc, le procédé me semble légal.


Denis


michel
Le #65320
Pour info, je viens tout juste de voir passer ça:
http://www.phpclasses.org/browse/package/3816.html

michel
Vincent Lascaux
Le #65321
Avec une recherche rapide:

http://www.seochat.com/seo-tools/pagerank-search/
indique le PR des sites trouvés. Pas de pub google, mais
google l'a trouvé.

http://www.ebiztools.ca/seo-tools/google&yahoo.php
Cette page n'a que l'outil de seochat et des bannières google.


C'est pas parceque quelqu'un fait quelque chose que c'est légal

http://www.google.fr/accounts/TOS semble confirmer que c'est illégal :

Google est réservé à un usage personnel

Les Services de recherche Google sont mis à votre disposition
exclusivement pour un usage personnel et non commercial. Vous ne devez
pas utiliser les Services de recherche Google pour vendre des produits
ou des services, ni en vue d'augmenter le trafic de votre site Web
pour des motifs commerciaux (ventes, promotion, publicité, etc.). Vous
ne devez en aucun cas réutiliser les résultats des recherches Google
par reformatage et affichage, ni reproduire la page d'accueil de
Google ou les pages de résultats sur votre site Web. [...]

Les requêtes automatisées sont interdites

Vous ne devez pas transmettre de requêtes automatisées d'aucune sorte
aux systèmes de Google sans autorisation explicite et préalable de
Google. Par « requêtes automatisées », nous entendons également
l'utilisation de tout logiciel qui transmet des requêtes à Google pour
déterminer le « rang » obtenu par un site Web dans les index Google en
fonction de différents termes de recherche.

--
Vincent

Olivier Masson
Le #65036

Oui, mais je ne pense pas que ce soit légal



Ca, c'est un autre problème. Mais avec le peu de requêtes que je compte
faire, aucun risque d'être vu.
C'est un peu à l'image des 15 centimes que Google à rembourser à un de
mes clients pour clics fraduleux dans Adwords : ils se foutent
royalement des petites gens. Donc tout va bien :)

Olivier Masson
Le #65319
Pour info, je viens tout juste de voir passer ça:
http://www.phpclasses.org/browse/package/3816.html

michel


Merci, je vais voir s'il y a une idée géniale dedans.

Publicité
Poster une réponse
Anonyme