OVH Cloud OVH Cloud

[SPS2003]indexation - performance

7 réponses
Avatar
olivier
Bonjour à tous,

Nous avons de gros problemes de performance avec le moteur d'indexation de
notre sps2003, il est terriblement long, pour indexer 2000 document PDF
(image donc pas de texte) il lui faut plus de 24Heures (J'ai installé le
Ifilter 6 de adobe).

La principal activitée de notre moteur d'indexation est d'indexer des
documents PDF (en image seule) avec quelques meta data, les pdf sont
ajoutées au fur et à mesure de journée (30 par demi heure environ) et
l'indexation incrementale à du mal à suivre, j'ai essayé de recreer un index
il à fallut 48Heures pour indexer 4000 doc.

Est ce que ces performances vous paraissent normales ?

Y-a-til des parametres sur lesquels on peut jouer pour améliorer ces
performances ?

J'ai verifié les ressources de la machine tout est ok , peu d'utilisation du
processeur, pas mal de mémoire dispo ...


Je ne sais plus quoi faire !!!

Olivier

7 réponses

Avatar
jerome.vaure
Bonjour,

Quelques petites questions, au cas où :
- où sont situés ces docs PDF par rapport à ton serveur
d'indéxation ? sur le même serveur ? sur un réseau ? quel est le
débit de la ligne ?
- quelqu'un n'aurait pas fixé une vitesse d'indéxation maximale ?
(SharePoint Portal Server Central Administration > Component Config. >
Manage Search Settings > Site Hit Frequency Rules)
- les fichiers sont-ils volumineux ?
- quel est l'intérêt d'indéxer des PDFs qui ne contiennent que des
images ?

Jérôme
Avatar
olivier
Bonjour Jerome,
Les doc pdf sont situés dans une bib de doc d'un site WSS, je travail avec 1
serveur pour sps et un serveur pour sql serveur.
Les deux serveurs sont reliés entre eux par un hub à 100Mb.

Site Hit Frequency Rules : auncune regles

les pdf font environ 50Ko,

Pour chaque document stocké dans ma bib il y a 4 meta data (n° de commande,
type de document ...)

Olivier


a écrit dans le message de
news:
Bonjour,

Quelques petites questions, au cas où :
- où sont situés ces docs PDF par rapport à ton serveur
d'indéxation ? sur le même serveur ? sur un réseau ? quel est le
débit de la ligne ?
- quelqu'un n'aurait pas fixé une vitesse d'indéxation maximale ?
(SharePoint Portal Server Central Administration > Component Config. >
Manage Search Settings > Site Hit Frequency Rules)
- les fichiers sont-ils volumineux ?
- quel est l'intérêt d'indéxer des PDFs qui ne contiennent que des
images ?

Jérôme
Avatar
jvaure
J'avoue ne pas voir d'où cela peut venir. Ces performances sont très
en dessous de ce que tu peux attendre.
Il y a dans mon intranet des centaines de PDFs dont certains
relativement imposants et cela va beaucoup plus vite que ça...
As-tu d'autres indexes qui crawlent en même temps ?
Avatar
olivier
Il arrive effectivement qu'un autre index crawl en même temps cela depends
des schedule.
Par contre hier j'ai fait un test, j'ai remis à zero mon index et j' ai
declenché en crawl full => il a fallut 26 heures pour indexer 6400 document
pdf !!!

Plutot bizarre non, le pire c'est que quand je regarde les proces msdmn (les
deon d'indexation) ils ne font quasiment rien (pas d'activée CPu ) !!

olivier


"jvaure" a écrit dans le message de
news:
J'avoue ne pas voir d'où cela peut venir. Ces performances sont très
en dessous de ce que tu peux attendre.
Il y a dans mon intranet des centaines de PDFs dont certains
relativement imposants et cela va beaucoup plus vite que ça...
As-tu d'autres indexes qui crawlent en même temps ?
Avatar
Jm Sennechael
Bonsoir,

Avez vérifié le journal du rassembleur (erreurs?), l'observateur
d'évènements? Vos fichiers PDF sont en plus relativement petits
(50Ko)...Avez vous fait un test avec des PDFs "normaux" (non image)?


Cordialement,

Jean-Marc Sennechael
Microsoft France - MCS

Ce message est fourni en l'état, sans garantie d'aucune sorte et ne vous
confère aucun droit. Vous assumez tous les risques liés à son utilisation.

"olivier" wrote in message
news:eCFJ6$
Il arrive effectivement qu'un autre index crawl en même temps cela depends
des schedule.
Par contre hier j'ai fait un test, j'ai remis à zero mon index et j' ai
declenché en crawl full => il a fallut 26 heures pour indexer 6400
document
pdf !!!

Plutot bizarre non, le pire c'est que quand je regarde les proces msdmn
(les
deon d'indexation) ils ne font quasiment rien (pas d'activée CPu ) !!

olivier


"jvaure" a écrit dans le message de
news:
J'avoue ne pas voir d'où cela peut venir. Ces performances sont très
en dessous de ce que tu peux attendre.
Il y a dans mon intranet des centaines de PDFs dont certains
relativement imposants et cela va beaucoup plus vite que ça...
As-tu d'autres indexes qui crawlent en même temps ?




Avatar
olivier
Merci à tous pour vos infos,

Apparement il y a un hot fix post SP1 qui est produit par Msoft, ce hot fiw
reglerait des problemes sur les ifilters non Msoft, pour ceux qui voudraient
plus de détails se reporter aux articles :

894079 et 894080

Je viens de recevoir le hotfix, je le mets en place et vous donnerais des
nouvelles quand tout sera ok.
Olivier

"Jm Sennechael" a écrit dans le message de
news:%
Bonsoir,

Avez vérifié le journal du rassembleur (erreurs?), l'observateur
d'évènements? Vos fichiers PDF sont en plus relativement petits
(50Ko)...Avez vous fait un test avec des PDFs "normaux" (non image)?


Cordialement,

Jean-Marc Sennechael
Microsoft France - MCS

Ce message est fourni en l'état, sans garantie d'aucune sorte et ne vous
confère aucun droit. Vous assumez tous les risques liés à son utilisation.

"olivier" wrote in message
news:eCFJ6$
> Il arrive effectivement qu'un autre index crawl en même temps cela


depends
> des schedule.
> Par contre hier j'ai fait un test, j'ai remis à zero mon index et j' ai
> declenché en crawl full => il a fallut 26 heures pour indexer 6400
> document
> pdf !!!
>
> Plutot bizarre non, le pire c'est que quand je regarde les proces msdmn
> (les
> deon d'indexation) ils ne font quasiment rien (pas d'activée CPu ) !!
>
> olivier
>
>
> "jvaure" a écrit dans le message de
> news:
> J'avoue ne pas voir d'où cela peut venir. Ces performances sont très
> en dessous de ce que tu peux attendre.
> Il y a dans mon intranet des centaines de PDFs dont certains
> relativement imposants et cela va beaucoup plus vite que ça...
> As-tu d'autres indexes qui crawlent en même temps ?
>
>




Avatar
olivier
Rebonjour,

Ca y est j'ai fait mes tests, avant ce hotfix il me fallait plusieures
heures pour indexer 3000 doc, apres install du hotFix 3000 documents indexés
en 7 minutes, ça va nous changer la vie !!!!!

olivier


"olivier" a écrit dans le message de
news:
Bonjour à tous,

Nous avons de gros problemes de performance avec le moteur d'indexation de
notre sps2003, il est terriblement long, pour indexer 2000 document PDF
(image donc pas de texte) il lui faut plus de 24Heures (J'ai installé le
Ifilter 6 de adobe).

La principal activitée de notre moteur d'indexation est d'indexer des
documents PDF (en image seule) avec quelques meta data, les pdf sont
ajoutées au fur et à mesure de journée (30 par demi heure environ) et
l'indexation incrementale à du mal à suivre, j'ai essayé de recreer un


index
il à fallut 48Heures pour indexer 4000 doc.

Est ce que ces performances vous paraissent normales ?

Y-a-til des parametres sur lesquels on peut jouer pour améliorer ces
performances ?

J'ai verifié les ressources de la machine tout est ok , peu d'utilisation


du
processeur, pas mal de mémoire dispo ...


Je ne sais plus quoi faire !!!

Olivier