[SPS2003]indexation de dopcument PDF

1 réponse

olivier

20/11/2006 à 15:47

Bonjour à tous,

Petite question concernant l'indexation des documents PDF dans sharepoint :

Mon moteur d'indexation est paramétré de la façon suivante =>
2 index differents - PDF ifilter installé coté sps et coté sql

Le premier index contient les resultats de l'indexation d'un grand nombres
de documents PDF (de type image seulement) donc en fait se sont seulement
les metadatas et le nom des fichiers qui sont indexés.

Le deuxieme index contient le resultat de l'indexation d'un grand nombre de
fichiers en tout genres (bureautique, pdf text+image, ...) dans ce cas c'est
les metadata + le contenu de chaque document qui est indexé.

Je vais ajouter un troiseme index qui va devoir contenir le resultat
d'indexation d'un grand nombre de documents PDF de type text, dans ce cas
c'est les metadata ainsi que le contenu de chaque document pdf qui va être
indexé et en fait cela me pose un probleme car je ne souhaite absoluement
pas indexer le contenu de chaque document vu le nombre de doc, je vais me
retrouver avec un index enorme.
Y a t-il un moyen pour ne pas indexer le contenu mais seulement les
metadatas dans ce cas ?

Merci d'avance

Olivier

1 réponse

Renaud Comte

21/11/2006 à 12:50

Pas à ma connaissance

Si SPS a le IFilter et il peut trouver les fichier, il peut les indexer

Voila voila

Renaud Comte [MVP]
--------------------------------------
http://blogs.developpeur.org/themit/
http://blog.spsclerics.com/

Mon moteur d'indexation est paramétré de la façon suivante => 2 index
differents - PDF ifilter installé coté sps et coté sql

Le premier index contient les resultats de l'indexation d'un grand
nombres de documents PDF (de type image seulement) donc en fait se
sont seulement les metadatas et le nom des fichiers qui sont indexés.

Le deuxieme index contient le resultat de l'indexation d'un grand
nombre de fichiers en tout genres (bureautique, pdf text+image, ...)
dans ce cas c'est les metadata + le contenu de chaque document qui est
indexé.

Je vais ajouter un troiseme index qui va devoir contenir le resultat

d'indexation d'un grand nombre de documents PDF de type text, dans ce
cas

c'est les metadata ainsi que le contenu de chaque document pdf qui va
être

indexé et en fait cela me pose un probleme car je ne souhaite
absoluement

pas indexer le contenu de chaque document vu le nombre de doc, je vais
me

retrouver avec un index enorme.

Y a t-il un moyen pour ne pas indexer le contenu mais seulement les

metadatas dans ce cas ?

Merci d'avance

[SPS2003]indexation de dopcument PDF

1 réponse

Veuillez sélectionner un problème