OVH Cloud OVH Cloud

Réaction étrange du site www.PetitionOnline.com (lu par eCatch)

3 réponses
Avatar
Denis Beauregard
Quelqu'un rapporte des problèmes de lecture du site
www.PetitionOnline.com et plus précisément de la page
www.petitiononline.com/mf051704/petition.html

Il lit des mots-clés générés au hasard, comme certains
messages de spam.

Son impression est que le site réagit différemment à son
navigateur, et celle des autres est qu'il a un virus.

Après quelques discussions (voir news:soc.genealogy.computing),
je lui ai demandé de visiter une certaine page de mon site pour
savoir ce qu'il laissait comme identification. Voici ce que
donne mon log:


[13/Jun/2004:09:58:04 -0700]
"HEAD /steve.hayes.was.here HTTP/1.1"
404
0
"-"
"eCatch/2.1"

Un autre qui a regardé la même URL obtenait ceci:

[13/Jun/2004:08:18:35 -0700]
"GET /steve.hayes.was.here HTTP/1.1"
404
128
"-"
"Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)"


Tout d'abord, il a un HEAD au lieu d'un GET. J'ai noté que
parfois, il y avait cette commande dans mon log de visites,
mais je ne sais pas ce que cela signifie (ou plutôt pourquoi
certains navigateurs l'utilisent).

Ensuite, il a une identification de navigateur assez différente
de la plupart des gens. "eCatch/2.1"

Son navigateur lui permet d'aller chercher des pages et de lire
hors-connexion. Je me demande si c'est la raison du fonctionnement
étrange qu'il obtient (voir les messages de Steve Hayes).

Je suppose que Mozilla permet de changer l'identification (quoique
je ne trouve pas comment faire), mais comment forcer un HEAD au lieu
d'un GET ?

Ou bien, quelqu'un d'autre peut-il reproduire le problème en forçant
HEAD ou l'identification ?


Denis

3 réponses

Avatar
Pleurote du Panicaut
Dans le message ,
Denis Beauregard nous écrivit :
"eCatch/2.1"



C'est plus un aspirateur de site qu'un navigateur, ce truc.

@+
--
Jean-Paul Boussac...Tout savoir sur MyIE2,
HTLM-Kit en français, anti SPAM sous Windows,... :
http://boussac.online.fr/Windows/
Avatar
Denis Beauregard
Le Tue, 15 Jun 2004 08:31:11 +1100, "Pleurote du Panicaut"
écrivait dans fr.comp.infosystemes.www.navigateurs:

Dans le message ,
Denis Beauregard nous écrivit :
"eCatch/2.1"



C'est plus un aspirateur de site qu'un navigateur, ce truc.



Ce qui m'a donné l'idée d'essayer httrack. Celui-ci permet de
changer l'identification du navigateur.

Avec les valeurs par défaut, je peux lire le site de pétitions.

Si je dis que c'est eCatch 2.1, le fichier robot.txt est tout à
coup en binaire et la page demandée contient ceci:

strange Denmark scowl violin steadier forgetting immunities associativity Hanna presently athleticism trickier nether exactness supervisor hobbyist boustrophedonic heard Huntsville Gilead snapshots yesterdays







someday paged

blond decrease someday beatable feverish Kantian comber
Matson pony friendships columns gums comforting
cowered autoincrements usurped establish taverns
correlative banister dinnerware publicizing cutout figuring peculiarity glimmers
lady robed sealed evens raincoats departs
tinily primer scheming value bookkeeper
reconfigured
complied plumage sacred
tufts hugely
loan trembling pathname

redneck rawly substitutability rating leverage Ampex councilmen befriends Glynn



Donc, le site détecte cet aspirateur.


Denis

--
0 Denis Beauregard
// www.francogene.com
| >>Adresse modifiée souvent/email changed frequently<<
/ | Société généalogique canadienne-française
oo oo Mon association a 60 ans en 2003 ! - www.sgcf.com
Avatar
Olivier Miakinen
Le 15/06/2004 06:38, Denis Beauregard a écrit :

Si je dis que c'est eCatch 2.1, le fichier robot.txt est tout à
coup en binaire et la page demandée contient ceci:

[...]



Donc, le site détecte cet aspirateur.



Et il lui donne à manger des adresses de courrier (que je suppose
fausses). Probablement cet aspirateur est-il utilisé par les spammeurs
pour se constituer une base d'adresses.