Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Parser les resultats de moteurs de rech erche

6 réponses
Avatar
Olivier Masson
Bonjour,

pensez-vous qu'il soit réaliste de faire une programme permettant de
donner le classement d'un site pour une requête donnée, tel que le ferai
l'API Google ou l'API Yahoo ?

Le but est d'avoir de vrais résultats : ceux de l'API Google - j'ai une
clé :) - sont connus pour être parfois très différents de ceux du moteur
de recherche et ceux de Yahoo pas parfait non plus. Et cela permettrait
d'étendre le procédé à d'autres moteurs.

J'ai pensé bêtement utiliser fopen ou curl_exec et cherche dans le
contenu un motif qui me permette de trouver les url.
Par exemple Google a toujours
<div class=g>
<!--m-->
<h2 class=r>
avant l'url trouvé.
Si ça change soudainement, on le verra dans les résultats.

Merci.

6 réponses

Avatar
Vincent Lascaux
pensez-vous qu'il soit réaliste de faire une programme permettant de
donner le classement d'un site pour une requête donnée, tel que le ferai
l'API Google ou l'API Yahoo ?


Oui, mais je ne pense pas que ce soit légal

--
Vincent

Avatar
Denis Beauregard
Le 10 Apr 2007 05:20:21 GMT, Vincent Lascaux
écrivait dans fr.comp.lang.php:

pensez-vous qu'il soit réaliste de faire une programme permettant de
donner le classement d'un site pour une requête donnée, tel que le ferai
l'API Google ou l'API Yahoo ?


Oui, mais je ne pense pas que ce soit légal


Pourtant, il me semble que je suis tombé sur un site qui utilisait
l'API de Google pour donner les résultats avec le page rank et un
autre qui donnait le position d'un site parmi les 100 premiers
résultats d'une requête google.

Je n'ai pas noté les adresses de ces sites et ce n'est plus dans
l'historique de mon navigateur mais on devrait les retrouver
facilement.

Avec une recherche rapide:

http://www.seochat.com/seo-tools/pagerank-search/
indique le PR des sites trouvés. Pas de pub google, mais
google l'a trouvé.

http://www.ebiztools.ca/seo-tools/google&yahoo.php
Cette page n'a que l'outil de seochat et des bannières google.

Donc, le procédé me semble légal.


Denis


Avatar
michel
Pour info, je viens tout juste de voir passer ça:
http://www.phpclasses.org/browse/package/3816.html

michel
Avatar
Vincent Lascaux
Avec une recherche rapide:

http://www.seochat.com/seo-tools/pagerank-search/
indique le PR des sites trouvés. Pas de pub google, mais
google l'a trouvé.

http://www.ebiztools.ca/seo-tools/google&yahoo.php
Cette page n'a que l'outil de seochat et des bannières google.


C'est pas parceque quelqu'un fait quelque chose que c'est légal

http://www.google.fr/accounts/TOS semble confirmer que c'est illégal :

Google est réservé à un usage personnel

Les Services de recherche Google sont mis à votre disposition
exclusivement pour un usage personnel et non commercial. Vous ne devez
pas utiliser les Services de recherche Google pour vendre des produits
ou des services, ni en vue d'augmenter le trafic de votre site Web
pour des motifs commerciaux (ventes, promotion, publicité, etc.). Vous
ne devez en aucun cas réutiliser les résultats des recherches Google
par reformatage et affichage, ni reproduire la page d'accueil de
Google ou les pages de résultats sur votre site Web. [...]

Les requêtes automatisées sont interdites

Vous ne devez pas transmettre de requêtes automatisées d'aucune sorte
aux systèmes de Google sans autorisation explicite et préalable de
Google. Par « requêtes automatisées », nous entendons également
l'utilisation de tout logiciel qui transmet des requêtes à Google pour
déterminer le « rang » obtenu par un site Web dans les index Google en
fonction de différents termes de recherche.

--
Vincent

Avatar
Olivier Masson

Oui, mais je ne pense pas que ce soit légal



Ca, c'est un autre problème. Mais avec le peu de requêtes que je compte
faire, aucun risque d'être vu.
C'est un peu à l'image des 15 centimes que Google à rembourser à un de
mes clients pour clics fraduleux dans Adwords : ils se foutent
royalement des petites gens. Donc tout va bien :)

Avatar
Olivier Masson
Pour info, je viens tout juste de voir passer ça:
http://www.phpclasses.org/browse/package/3816.html

michel


Merci, je vais voir s'il y a une idée géniale dedans.