OVH Cloud OVH Cloud

[SPS2003] Comment obtenir les informations associées à un document et utilisées par le moteur de recherche de SPS

3 réponses
Avatar
Yves Larosa
Bonjour,

J'ai des problèmes sur la recherche plein texte dans des documents PDF issus
d'un traitement OCR réalisé sur un scan.

J'ai bien installé le IFilter ADOBE
J'ai vérifié le filtre avec l'outil filtdmp livré dans le SDK...
Bref j'ai essayé de suivre toute la chaîne d'indexation, en tenant compte de
la limite des 64KB...
(d'ailleurs, si quelqu'un connaît le moyen d'augementer cette limite, je
suis preneur. Car dans le ressource kit (en bas de la page 588), il est
précisé qu'il s'agit d'une limite par défaut, mais on ne précise pas comment
la modifiée.

Je recherche donc un document particulier en précisant un mot qui est bien
dans le document, et je ne le vois pas dans la liste qui est retournée (5
documents, donc pas de pb de limite à ce niveau là).

Aussi, quelqu'un saurait-il comment obtenir, pour un document donné, les
informations stockées par le service d'indexation

Merci par avance pour vos réponses.
Yves LAROSA.

3 réponses

Avatar
Chris
Quand vous faites des essais de recherche, verifiez que vous n'utilisez pas
le compte administrateur car il me semble que ce dernier soit blacklisté par
le moteur de recherche.

"Yves Larosa" wrote:

Bonjour,

J'ai des problèmes sur la recherche plein texte dans des documents PDF issus
d'un traitement OCR réalisé sur un scan.

J'ai bien installé le IFilter ADOBE
J'ai vérifié le filtre avec l'outil filtdmp livré dans le SDK...
Bref j'ai essayé de suivre toute la chaîne d'indexation, en tenant compte de
la limite des 64KB...
(d'ailleurs, si quelqu'un connaît le moyen d'augementer cette limite, je
suis preneur. Car dans le ressource kit (en bas de la page 588), il est
précisé qu'il s'agit d'une limite par défaut, mais on ne précise pas comment
la modifiée.

Je recherche donc un document particulier en précisant un mot qui est bien
dans le document, et je ne le vois pas dans la liste qui est retournée (5
documents, donc pas de pb de limite à ce niveau là).

Aussi, quelqu'un saurait-il comment obtenir, pour un document donné, les
informations stockées par le service d'indexation

Merci par avance pour vos réponses.
Yves LAROSA.





Avatar
Jean-marc Sennechael
Bonjour,

Sur la limite des 64KB, l'article suivant est plus explicite que le Resource
Kit:

http://www.microsoft.com/technet/prodtechnol/office/sps2003/maintain/maxdocsz.mspx

Cordialement,


Jean-Marc Sennechael
Microsoft France - MCS

Ce message est fourni en l'état, sans garantie d'aucune sorte et ne vous
confère aucun droit. Vous assumez tous les risques liés à son utilisation.


"Yves Larosa" wrote in message
news:
Bonjour,

J'ai des problèmes sur la recherche plein texte dans des documents PDF
issus d'un traitement OCR réalisé sur un scan.

J'ai bien installé le IFilter ADOBE
J'ai vérifié le filtre avec l'outil filtdmp livré dans le SDK...
Bref j'ai essayé de suivre toute la chaîne d'indexation, en tenant compte
de la limite des 64KB...
(d'ailleurs, si quelqu'un connaît le moyen d'augementer cette limite, je
suis preneur. Car dans le ressource kit (en bas de la page 588), il est
précisé qu'il s'agit d'une limite par défaut, mais on ne précise pas
comment la modifiée.

Je recherche donc un document particulier en précisant un mot qui est bien
dans le document, et je ne le vois pas dans la liste qui est retournée (5
documents, donc pas de pb de limite à ce niveau là).

Aussi, quelqu'un saurait-il comment obtenir, pour un document donné, les
informations stockées par le service d'indexation

Merci par avance pour vos réponses.
Yves LAROSA.



Avatar
news.microsoft.com
Merci Jean-Marc

Mais il y a un détail que je n'arrive pas à comprendre, Le Resource Kit fixe
la limite à 64 KB, or l'article fait état d'une taille maxi de 64 MB
(MaxDownloadSize x MaxGrowFactor)
S'agit-il d'une erreur unité dans le ResKit ou de deux notions différentes

Cordialement.

Yves LAROSA

"Jean-marc Sennechael" wrote in message
news:
Bonjour,

Sur la limite des 64KB, l'article suivant est plus explicite que le
Resource Kit:

http://www.microsoft.com/technet/prodtechnol/office/sps2003/maintain/maxdocsz.mspx

Cordialement,


Jean-Marc Sennechael
Microsoft France - MCS

Ce message est fourni en l'état, sans garantie d'aucune sorte et ne vous
confère aucun droit. Vous assumez tous les risques liés à son utilisation.


"Yves Larosa" wrote in message
news:
Bonjour,

J'ai des problèmes sur la recherche plein texte dans des documents PDF
issus d'un traitement OCR réalisé sur un scan.

J'ai bien installé le IFilter ADOBE
J'ai vérifié le filtre avec l'outil filtdmp livré dans le SDK...
Bref j'ai essayé de suivre toute la chaîne d'indexation, en tenant compte
de la limite des 64KB...
(d'ailleurs, si quelqu'un connaît le moyen d'augementer cette limite, je
suis preneur. Car dans le ressource kit (en bas de la page 588), il est
précisé qu'il s'agit d'une limite par défaut, mais on ne précise pas
comment la modifiée.

Je recherche donc un document particulier en précisant un mot qui est
bien dans le document, et je ne le vois pas dans la liste qui est
retournée (5 documents, donc pas de pb de limite à ce niveau là).

Aussi, quelqu'un saurait-il comment obtenir, pour un document donné, les
informations stockées par le service d'indexation

Merci par avance pour vos réponses.
Yves LAROSA.