OVH Cloud OVH Cloud

[SPS 2003 - Recherche]

1 réponse
Avatar
Eric Couture
Bonjour, j'ai de la difficulté avec l'indexation de sites Web. Par exemple,
je possède les sites Web suivants :

http://monserveur/SiteA/SousSite1/
http://monserveur/SiteA/SousSite2/
http://monserveur/SiteB/SousSite3/
http://monserveur/SiteB/SousSite4/
http://monserveur/SiteB/SousSite5/
(Notez que ces sites Web n'utilisent pas Sharepoint)

Je désire indexer le contenu des sites suivants :
http://monserveur/SiteA/SousSite1/
http://monserveur/SiteB/SousSite4/
http://monserveur/SiteB/SousSite5/

J'ai créé l'index de contenu "IndexDeMesSites". J'ai créé 3 sources de
contenu, une pour chacun des sites à indexer. J'ai aussi assigner mes 3
sources de contenu à mon index de contenu "IndexDeMesSites". Finalement, j'ai
créé les règles suivantes pour mon index de contenu :

Inclus http://monserveur/SiteA/SousSite1/*
Inclus http://monserveur/SiteB/SousSite4/*
Inclus http://monserveur/SiteB/SousSite5/*

Malheureusement, le résultat obtenu n'est pas celui que j'aurais espéré car,
je retrouve l'ensemble du contenu de "http://monserveur/SiteA/*" et de
"http://monserveur/SiteB/*" dans mon index de contenu.

Jusqu'à maintenant, je n'ai pas trouvé beaucoup de documentation sur
l'application des règles d'exclusion et d'inclusion pour les index de
contenu. Si vous avez des informations à ce sujet, je suis très intéressé.

Merci de votre aide!

1 réponse

Avatar
AnthonyB
Effectivement, par défaut, l'analyse suit les liens Hypertexte existant dans
les pages et donc si vous avez des liens vers les sites racines, le crawler
va les parcourir puis indexer le contenu du site.

Lors de l'ajout d'une source de contenu, faites une personnalisation de
l'analyse de la configuration en limitant les relais de sites (profondeur) ou
en choisissant uniquement l'indexation d'une page.

En espérant que ces infos vous guideront,

AnthonyB


"Eric Couture" a écrit :

Bonjour, j'ai de la difficulté avec l'indexation de sites Web. Par exemple,
je possède les sites Web suivants :

http://monserveur/SiteA/SousSite1/
http://monserveur/SiteA/SousSite2/
http://monserveur/SiteB/SousSite3/
http://monserveur/SiteB/SousSite4/
http://monserveur/SiteB/SousSite5/
(Notez que ces sites Web n'utilisent pas Sharepoint)

Je désire indexer le contenu des sites suivants :
http://monserveur/SiteA/SousSite1/
http://monserveur/SiteB/SousSite4/
http://monserveur/SiteB/SousSite5/

J'ai créé l'index de contenu "IndexDeMesSites". J'ai créé 3 sources de
contenu, une pour chacun des sites à indexer. J'ai aussi assigner mes 3
sources de contenu à mon index de contenu "IndexDeMesSites". Finalement, j'ai
créé les règles suivantes pour mon index de contenu :

Inclus http://monserveur/SiteA/SousSite1/*
Inclus http://monserveur/SiteB/SousSite4/*
Inclus http://monserveur/SiteB/SousSite5/*

Malheureusement, le résultat obtenu n'est pas celui que j'aurais espéré car,
je retrouve l'ensemble du contenu de "http://monserveur/SiteA/*" et de
"http://monserveur/SiteB/*" dans mon index de contenu.

Jusqu'à maintenant, je n'ai pas trouvé beaucoup de documentation sur
l'application des règles d'exclusion et d'inclusion pour les index de
contenu. Si vous avez des informations à ce sujet, je suis très intéressé.

Merci de votre aide!