Nous avons de gros problemes de performance avec le moteur d'indexation de
notre sps2003, il est terriblement long, pour indexer 2000 document PDF
(image donc pas de texte) il lui faut plus de 24Heures (J'ai installé le
Ifilter 6 de adobe).
La principal activitée de notre moteur d'indexation est d'indexer des
documents PDF (en image seule) avec quelques meta data, les pdf sont
ajoutées au fur et à mesure de journée (30 par demi heure environ) et
l'indexation incrementale à du mal à suivre, j'ai essayé de recreer un index
il à fallut 48Heures pour indexer 4000 doc.
Est ce que ces performances vous paraissent normales ?
Y-a-til des parametres sur lesquels on peut jouer pour améliorer ces
performances ?
J'ai verifié les ressources de la machine tout est ok , peu d'utilisation du
processeur, pas mal de mémoire dispo ...
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
jerome.vaure
Bonjour,
Quelques petites questions, au cas où : - où sont situés ces docs PDF par rapport à ton serveur d'indéxation ? sur le même serveur ? sur un réseau ? quel est le débit de la ligne ? - quelqu'un n'aurait pas fixé une vitesse d'indéxation maximale ? (SharePoint Portal Server Central Administration > Component Config. > Manage Search Settings > Site Hit Frequency Rules) - les fichiers sont-ils volumineux ? - quel est l'intérêt d'indéxer des PDFs qui ne contiennent que des images ?
Jérôme
Bonjour,
Quelques petites questions, au cas où :
- où sont situés ces docs PDF par rapport à ton serveur
d'indéxation ? sur le même serveur ? sur un réseau ? quel est le
débit de la ligne ?
- quelqu'un n'aurait pas fixé une vitesse d'indéxation maximale ?
(SharePoint Portal Server Central Administration > Component Config. >
Manage Search Settings > Site Hit Frequency Rules)
- les fichiers sont-ils volumineux ?
- quel est l'intérêt d'indéxer des PDFs qui ne contiennent que des
images ?
Quelques petites questions, au cas où : - où sont situés ces docs PDF par rapport à ton serveur d'indéxation ? sur le même serveur ? sur un réseau ? quel est le débit de la ligne ? - quelqu'un n'aurait pas fixé une vitesse d'indéxation maximale ? (SharePoint Portal Server Central Administration > Component Config. > Manage Search Settings > Site Hit Frequency Rules) - les fichiers sont-ils volumineux ? - quel est l'intérêt d'indéxer des PDFs qui ne contiennent que des images ?
Jérôme
olivier
Bonjour Jerome, Les doc pdf sont situés dans une bib de doc d'un site WSS, je travail avec 1 serveur pour sps et un serveur pour sql serveur. Les deux serveurs sont reliés entre eux par un hub à 100Mb.
Site Hit Frequency Rules : auncune regles
les pdf font environ 50Ko,
Pour chaque document stocké dans ma bib il y a 4 meta data (n° de commande, type de document ...)
Olivier
a écrit dans le message de news: Bonjour,
Quelques petites questions, au cas où : - où sont situés ces docs PDF par rapport à ton serveur d'indéxation ? sur le même serveur ? sur un réseau ? quel est le débit de la ligne ? - quelqu'un n'aurait pas fixé une vitesse d'indéxation maximale ? (SharePoint Portal Server Central Administration > Component Config. > Manage Search Settings > Site Hit Frequency Rules) - les fichiers sont-ils volumineux ? - quel est l'intérêt d'indéxer des PDFs qui ne contiennent que des images ?
Jérôme
Bonjour Jerome,
Les doc pdf sont situés dans une bib de doc d'un site WSS, je travail avec 1
serveur pour sps et un serveur pour sql serveur.
Les deux serveurs sont reliés entre eux par un hub à 100Mb.
Site Hit Frequency Rules : auncune regles
les pdf font environ 50Ko,
Pour chaque document stocké dans ma bib il y a 4 meta data (n° de commande,
type de document ...)
Olivier
<jerome.vaure@elyo.fr> a écrit dans le message de
news:1127490003.129687.321730@z14g2000cwz.googlegroups.com...
Bonjour,
Quelques petites questions, au cas où :
- où sont situés ces docs PDF par rapport à ton serveur
d'indéxation ? sur le même serveur ? sur un réseau ? quel est le
débit de la ligne ?
- quelqu'un n'aurait pas fixé une vitesse d'indéxation maximale ?
(SharePoint Portal Server Central Administration > Component Config. >
Manage Search Settings > Site Hit Frequency Rules)
- les fichiers sont-ils volumineux ?
- quel est l'intérêt d'indéxer des PDFs qui ne contiennent que des
images ?
Bonjour Jerome, Les doc pdf sont situés dans une bib de doc d'un site WSS, je travail avec 1 serveur pour sps et un serveur pour sql serveur. Les deux serveurs sont reliés entre eux par un hub à 100Mb.
Site Hit Frequency Rules : auncune regles
les pdf font environ 50Ko,
Pour chaque document stocké dans ma bib il y a 4 meta data (n° de commande, type de document ...)
Olivier
a écrit dans le message de news: Bonjour,
Quelques petites questions, au cas où : - où sont situés ces docs PDF par rapport à ton serveur d'indéxation ? sur le même serveur ? sur un réseau ? quel est le débit de la ligne ? - quelqu'un n'aurait pas fixé une vitesse d'indéxation maximale ? (SharePoint Portal Server Central Administration > Component Config. > Manage Search Settings > Site Hit Frequency Rules) - les fichiers sont-ils volumineux ? - quel est l'intérêt d'indéxer des PDFs qui ne contiennent que des images ?
Jérôme
jvaure
J'avoue ne pas voir d'où cela peut venir. Ces performances sont très en dessous de ce que tu peux attendre. Il y a dans mon intranet des centaines de PDFs dont certains relativement imposants et cela va beaucoup plus vite que ça... As-tu d'autres indexes qui crawlent en même temps ?
J'avoue ne pas voir d'où cela peut venir. Ces performances sont très
en dessous de ce que tu peux attendre.
Il y a dans mon intranet des centaines de PDFs dont certains
relativement imposants et cela va beaucoup plus vite que ça...
As-tu d'autres indexes qui crawlent en même temps ?
J'avoue ne pas voir d'où cela peut venir. Ces performances sont très en dessous de ce que tu peux attendre. Il y a dans mon intranet des centaines de PDFs dont certains relativement imposants et cela va beaucoup plus vite que ça... As-tu d'autres indexes qui crawlent en même temps ?
olivier
Il arrive effectivement qu'un autre index crawl en même temps cela depends des schedule. Par contre hier j'ai fait un test, j'ai remis à zero mon index et j' ai declenché en crawl full => il a fallut 26 heures pour indexer 6400 document pdf !!!
Plutot bizarre non, le pire c'est que quand je regarde les proces msdmn (les deon d'indexation) ils ne font quasiment rien (pas d'activée CPu ) !!
olivier
"jvaure" a écrit dans le message de news: J'avoue ne pas voir d'où cela peut venir. Ces performances sont très en dessous de ce que tu peux attendre. Il y a dans mon intranet des centaines de PDFs dont certains relativement imposants et cela va beaucoup plus vite que ça... As-tu d'autres indexes qui crawlent en même temps ?
Il arrive effectivement qu'un autre index crawl en même temps cela depends
des schedule.
Par contre hier j'ai fait un test, j'ai remis à zero mon index et j' ai
declenché en crawl full => il a fallut 26 heures pour indexer 6400 document
pdf !!!
Plutot bizarre non, le pire c'est que quand je regarde les proces msdmn (les
deon d'indexation) ils ne font quasiment rien (pas d'activée CPu ) !!
olivier
"jvaure" <jerome.vaure@elyo.fr> a écrit dans le message de
news:1127491116.725036.82470@g49g2000cwa.googlegroups.com...
J'avoue ne pas voir d'où cela peut venir. Ces performances sont très
en dessous de ce que tu peux attendre.
Il y a dans mon intranet des centaines de PDFs dont certains
relativement imposants et cela va beaucoup plus vite que ça...
As-tu d'autres indexes qui crawlent en même temps ?
Il arrive effectivement qu'un autre index crawl en même temps cela depends des schedule. Par contre hier j'ai fait un test, j'ai remis à zero mon index et j' ai declenché en crawl full => il a fallut 26 heures pour indexer 6400 document pdf !!!
Plutot bizarre non, le pire c'est que quand je regarde les proces msdmn (les deon d'indexation) ils ne font quasiment rien (pas d'activée CPu ) !!
olivier
"jvaure" a écrit dans le message de news: J'avoue ne pas voir d'où cela peut venir. Ces performances sont très en dessous de ce que tu peux attendre. Il y a dans mon intranet des centaines de PDFs dont certains relativement imposants et cela va beaucoup plus vite que ça... As-tu d'autres indexes qui crawlent en même temps ?
Jm Sennechael
Bonsoir,
Avez vérifié le journal du rassembleur (erreurs?), l'observateur d'évènements? Vos fichiers PDF sont en plus relativement petits (50Ko)...Avez vous fait un test avec des PDFs "normaux" (non image)?
Cordialement,
Jean-Marc Sennechael Microsoft France - MCS
Ce message est fourni en l'état, sans garantie d'aucune sorte et ne vous confère aucun droit. Vous assumez tous les risques liés à son utilisation.
"olivier" wrote in message news:eCFJ6$
Il arrive effectivement qu'un autre index crawl en même temps cela depends des schedule. Par contre hier j'ai fait un test, j'ai remis à zero mon index et j' ai declenché en crawl full => il a fallut 26 heures pour indexer 6400 document pdf !!!
Plutot bizarre non, le pire c'est que quand je regarde les proces msdmn (les deon d'indexation) ils ne font quasiment rien (pas d'activée CPu ) !!
olivier
"jvaure" a écrit dans le message de news: J'avoue ne pas voir d'où cela peut venir. Ces performances sont très en dessous de ce que tu peux attendre. Il y a dans mon intranet des centaines de PDFs dont certains relativement imposants et cela va beaucoup plus vite que ça... As-tu d'autres indexes qui crawlent en même temps ?
Bonsoir,
Avez vérifié le journal du rassembleur (erreurs?), l'observateur
d'évènements? Vos fichiers PDF sont en plus relativement petits
(50Ko)...Avez vous fait un test avec des PDFs "normaux" (non image)?
Cordialement,
Jean-Marc Sennechael
Microsoft France - MCS
Ce message est fourni en l'état, sans garantie d'aucune sorte et ne vous
confère aucun droit. Vous assumez tous les risques liés à son utilisation.
"olivier" <nomailsvp@wanadoo.fr> wrote in message
news:eCFJ6$FwFHA.1168@TK2MSFTNGP10.phx.gbl...
Il arrive effectivement qu'un autre index crawl en même temps cela depends
des schedule.
Par contre hier j'ai fait un test, j'ai remis à zero mon index et j' ai
declenché en crawl full => il a fallut 26 heures pour indexer 6400
document
pdf !!!
Plutot bizarre non, le pire c'est que quand je regarde les proces msdmn
(les
deon d'indexation) ils ne font quasiment rien (pas d'activée CPu ) !!
olivier
"jvaure" <jerome.vaure@elyo.fr> a écrit dans le message de
news:1127491116.725036.82470@g49g2000cwa.googlegroups.com...
J'avoue ne pas voir d'où cela peut venir. Ces performances sont très
en dessous de ce que tu peux attendre.
Il y a dans mon intranet des centaines de PDFs dont certains
relativement imposants et cela va beaucoup plus vite que ça...
As-tu d'autres indexes qui crawlent en même temps ?
Avez vérifié le journal du rassembleur (erreurs?), l'observateur d'évènements? Vos fichiers PDF sont en plus relativement petits (50Ko)...Avez vous fait un test avec des PDFs "normaux" (non image)?
Cordialement,
Jean-Marc Sennechael Microsoft France - MCS
Ce message est fourni en l'état, sans garantie d'aucune sorte et ne vous confère aucun droit. Vous assumez tous les risques liés à son utilisation.
"olivier" wrote in message news:eCFJ6$
Il arrive effectivement qu'un autre index crawl en même temps cela depends des schedule. Par contre hier j'ai fait un test, j'ai remis à zero mon index et j' ai declenché en crawl full => il a fallut 26 heures pour indexer 6400 document pdf !!!
Plutot bizarre non, le pire c'est que quand je regarde les proces msdmn (les deon d'indexation) ils ne font quasiment rien (pas d'activée CPu ) !!
olivier
"jvaure" a écrit dans le message de news: J'avoue ne pas voir d'où cela peut venir. Ces performances sont très en dessous de ce que tu peux attendre. Il y a dans mon intranet des centaines de PDFs dont certains relativement imposants et cela va beaucoup plus vite que ça... As-tu d'autres indexes qui crawlent en même temps ?
olivier
Merci à tous pour vos infos,
Apparement il y a un hot fix post SP1 qui est produit par Msoft, ce hot fiw reglerait des problemes sur les ifilters non Msoft, pour ceux qui voudraient plus de détails se reporter aux articles :
894079 et 894080
Je viens de recevoir le hotfix, je le mets en place et vous donnerais des nouvelles quand tout sera ok. Olivier
"Jm Sennechael" a écrit dans le message de news:%
Bonsoir,
Avez vérifié le journal du rassembleur (erreurs?), l'observateur d'évènements? Vos fichiers PDF sont en plus relativement petits (50Ko)...Avez vous fait un test avec des PDFs "normaux" (non image)?
Cordialement,
Jean-Marc Sennechael Microsoft France - MCS
Ce message est fourni en l'état, sans garantie d'aucune sorte et ne vous confère aucun droit. Vous assumez tous les risques liés à son utilisation.
"olivier" wrote in message news:eCFJ6$ > Il arrive effectivement qu'un autre index crawl en même temps cela
depends
> des schedule. > Par contre hier j'ai fait un test, j'ai remis à zero mon index et j' ai > declenché en crawl full => il a fallut 26 heures pour indexer 6400 > document > pdf !!! > > Plutot bizarre non, le pire c'est que quand je regarde les proces msdmn > (les > deon d'indexation) ils ne font quasiment rien (pas d'activée CPu ) !! > > olivier > > > "jvaure" a écrit dans le message de > news: > J'avoue ne pas voir d'où cela peut venir. Ces performances sont très > en dessous de ce que tu peux attendre. > Il y a dans mon intranet des centaines de PDFs dont certains > relativement imposants et cela va beaucoup plus vite que ça... > As-tu d'autres indexes qui crawlent en même temps ? > >
Merci à tous pour vos infos,
Apparement il y a un hot fix post SP1 qui est produit par Msoft, ce hot fiw
reglerait des problemes sur les ifilters non Msoft, pour ceux qui voudraient
plus de détails se reporter aux articles :
894079 et 894080
Je viens de recevoir le hotfix, je le mets en place et vous donnerais des
nouvelles quand tout sera ok.
Olivier
"Jm Sennechael" <jeanms@online.microsoft.com> a écrit dans le message de
news:%23bkuoatwFHA.3860@TK2MSFTNGP09.phx.gbl...
Bonsoir,
Avez vérifié le journal du rassembleur (erreurs?), l'observateur
d'évènements? Vos fichiers PDF sont en plus relativement petits
(50Ko)...Avez vous fait un test avec des PDFs "normaux" (non image)?
Cordialement,
Jean-Marc Sennechael
Microsoft France - MCS
Ce message est fourni en l'état, sans garantie d'aucune sorte et ne vous
confère aucun droit. Vous assumez tous les risques liés à son utilisation.
"olivier" <nomailsvp@wanadoo.fr> wrote in message
news:eCFJ6$FwFHA.1168@TK2MSFTNGP10.phx.gbl...
> Il arrive effectivement qu'un autre index crawl en même temps cela
depends
> des schedule.
> Par contre hier j'ai fait un test, j'ai remis à zero mon index et j' ai
> declenché en crawl full => il a fallut 26 heures pour indexer 6400
> document
> pdf !!!
>
> Plutot bizarre non, le pire c'est que quand je regarde les proces msdmn
> (les
> deon d'indexation) ils ne font quasiment rien (pas d'activée CPu ) !!
>
> olivier
>
>
> "jvaure" <jerome.vaure@elyo.fr> a écrit dans le message de
> news:1127491116.725036.82470@g49g2000cwa.googlegroups.com...
> J'avoue ne pas voir d'où cela peut venir. Ces performances sont très
> en dessous de ce que tu peux attendre.
> Il y a dans mon intranet des centaines de PDFs dont certains
> relativement imposants et cela va beaucoup plus vite que ça...
> As-tu d'autres indexes qui crawlent en même temps ?
>
>
Apparement il y a un hot fix post SP1 qui est produit par Msoft, ce hot fiw reglerait des problemes sur les ifilters non Msoft, pour ceux qui voudraient plus de détails se reporter aux articles :
894079 et 894080
Je viens de recevoir le hotfix, je le mets en place et vous donnerais des nouvelles quand tout sera ok. Olivier
"Jm Sennechael" a écrit dans le message de news:%
Bonsoir,
Avez vérifié le journal du rassembleur (erreurs?), l'observateur d'évènements? Vos fichiers PDF sont en plus relativement petits (50Ko)...Avez vous fait un test avec des PDFs "normaux" (non image)?
Cordialement,
Jean-Marc Sennechael Microsoft France - MCS
Ce message est fourni en l'état, sans garantie d'aucune sorte et ne vous confère aucun droit. Vous assumez tous les risques liés à son utilisation.
"olivier" wrote in message news:eCFJ6$ > Il arrive effectivement qu'un autre index crawl en même temps cela
depends
> des schedule. > Par contre hier j'ai fait un test, j'ai remis à zero mon index et j' ai > declenché en crawl full => il a fallut 26 heures pour indexer 6400 > document > pdf !!! > > Plutot bizarre non, le pire c'est que quand je regarde les proces msdmn > (les > deon d'indexation) ils ne font quasiment rien (pas d'activée CPu ) !! > > olivier > > > "jvaure" a écrit dans le message de > news: > J'avoue ne pas voir d'où cela peut venir. Ces performances sont très > en dessous de ce que tu peux attendre. > Il y a dans mon intranet des centaines de PDFs dont certains > relativement imposants et cela va beaucoup plus vite que ça... > As-tu d'autres indexes qui crawlent en même temps ? > >
olivier
Rebonjour,
Ca y est j'ai fait mes tests, avant ce hotfix il me fallait plusieures heures pour indexer 3000 doc, apres install du hotFix 3000 documents indexés en 7 minutes, ça va nous changer la vie !!!!!
olivier
"olivier" a écrit dans le message de news:
Bonjour à tous,
Nous avons de gros problemes de performance avec le moteur d'indexation de notre sps2003, il est terriblement long, pour indexer 2000 document PDF (image donc pas de texte) il lui faut plus de 24Heures (J'ai installé le Ifilter 6 de adobe).
La principal activitée de notre moteur d'indexation est d'indexer des documents PDF (en image seule) avec quelques meta data, les pdf sont ajoutées au fur et à mesure de journée (30 par demi heure environ) et l'indexation incrementale à du mal à suivre, j'ai essayé de recreer un
index
il à fallut 48Heures pour indexer 4000 doc.
Est ce que ces performances vous paraissent normales ?
Y-a-til des parametres sur lesquels on peut jouer pour améliorer ces performances ?
J'ai verifié les ressources de la machine tout est ok , peu d'utilisation
du
processeur, pas mal de mémoire dispo ...
Je ne sais plus quoi faire !!!
Olivier
Rebonjour,
Ca y est j'ai fait mes tests, avant ce hotfix il me fallait plusieures
heures pour indexer 3000 doc, apres install du hotFix 3000 documents indexés
en 7 minutes, ça va nous changer la vie !!!!!
olivier
"olivier" <olivier.cordiero@wanadoo.fr> a écrit dans le message de
news:u8O6epDwFHA.708@TK2MSFTNGP10.phx.gbl...
Bonjour à tous,
Nous avons de gros problemes de performance avec le moteur d'indexation de
notre sps2003, il est terriblement long, pour indexer 2000 document PDF
(image donc pas de texte) il lui faut plus de 24Heures (J'ai installé le
Ifilter 6 de adobe).
La principal activitée de notre moteur d'indexation est d'indexer des
documents PDF (en image seule) avec quelques meta data, les pdf sont
ajoutées au fur et à mesure de journée (30 par demi heure environ) et
l'indexation incrementale à du mal à suivre, j'ai essayé de recreer un
index
il à fallut 48Heures pour indexer 4000 doc.
Est ce que ces performances vous paraissent normales ?
Y-a-til des parametres sur lesquels on peut jouer pour améliorer ces
performances ?
J'ai verifié les ressources de la machine tout est ok , peu d'utilisation
Ca y est j'ai fait mes tests, avant ce hotfix il me fallait plusieures heures pour indexer 3000 doc, apres install du hotFix 3000 documents indexés en 7 minutes, ça va nous changer la vie !!!!!
olivier
"olivier" a écrit dans le message de news:
Bonjour à tous,
Nous avons de gros problemes de performance avec le moteur d'indexation de notre sps2003, il est terriblement long, pour indexer 2000 document PDF (image donc pas de texte) il lui faut plus de 24Heures (J'ai installé le Ifilter 6 de adobe).
La principal activitée de notre moteur d'indexation est d'indexer des documents PDF (en image seule) avec quelques meta data, les pdf sont ajoutées au fur et à mesure de journée (30 par demi heure environ) et l'indexation incrementale à du mal à suivre, j'ai essayé de recreer un
index
il à fallut 48Heures pour indexer 4000 doc.
Est ce que ces performances vous paraissent normales ?
Y-a-til des parametres sur lesquels on peut jouer pour améliorer ces performances ?
J'ai verifié les ressources de la machine tout est ok , peu d'utilisation