Petite question concernant l'indexation des documents PDF dans sharepoint :
Mon moteur d'indexation est paramétré de la façon suivante =>
2 index differents - PDF ifilter installé coté sps et coté sql
Le premier index contient les resultats de l'indexation d'un grand nombres
de documents PDF (de type image seulement) donc en fait se sont seulement
les metadatas et le nom des fichiers qui sont indexés.
Le deuxieme index contient le resultat de l'indexation d'un grand nombre de
fichiers en tout genres (bureautique, pdf text+image, ...) dans ce cas c'est
les metadata + le contenu de chaque document qui est indexé.
Je vais ajouter un troiseme index qui va devoir contenir le resultat
d'indexation d'un grand nombre de documents PDF de type text, dans ce cas
c'est les metadata ainsi que le contenu de chaque document pdf qui va être
indexé et en fait cela me pose un probleme car je ne souhaite absoluement
pas indexer le contenu de chaque document vu le nombre de doc, je vais me
retrouver avec un index enorme.
Y a t-il un moyen pour ne pas indexer le contenu mais seulement les
metadatas dans ce cas ?
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
Renaud Comte
Pas à ma connaissance
Si SPS a le IFilter et il peut trouver les fichier, il peut les indexer
Voila voila
Renaud Comte [MVP] -------------------------------------- http://blogs.developpeur.org/themit/ http://blog.spsclerics.com/
Mon moteur d'indexation est paramétré de la façon suivante => 2 index differents - PDF ifilter installé coté sps et coté sql
Le premier index contient les resultats de l'indexation d'un grand nombres de documents PDF (de type image seulement) donc en fait se sont seulement les metadatas et le nom des fichiers qui sont indexés.
Le deuxieme index contient le resultat de l'indexation d'un grand nombre de fichiers en tout genres (bureautique, pdf text+image, ...) dans ce cas c'est les metadata + le contenu de chaque document qui est indexé.
Je vais ajouter un troiseme index qui va devoir contenir le resultat
d'indexation d'un grand nombre de documents PDF de type text, dans ce cas
c'est les metadata ainsi que le contenu de chaque document pdf qui va être
indexé et en fait cela me pose un probleme car je ne souhaite absoluement
pas indexer le contenu de chaque document vu le nombre de doc, je vais me
retrouver avec un index enorme.
Y a t-il un moyen pour ne pas indexer le contenu mais seulement les
metadatas dans ce cas ?
Merci d'avance
Pas à ma connaissance
Si SPS a le IFilter et il peut trouver les fichier, il peut les indexer
Voila voila
Renaud Comte [MVP]
--------------------------------------
http://blogs.developpeur.org/themit/
http://blog.spsclerics.com/
Mon moteur d'indexation est paramétré de la façon suivante => 2 index
differents - PDF ifilter installé coté sps et coté sql
Le premier index contient les resultats de l'indexation d'un grand
nombres de documents PDF (de type image seulement) donc en fait se
sont seulement les metadatas et le nom des fichiers qui sont indexés.
Le deuxieme index contient le resultat de l'indexation d'un grand
nombre de fichiers en tout genres (bureautique, pdf text+image, ...)
dans ce cas c'est les metadata + le contenu de chaque document qui est
indexé.
Je vais ajouter un troiseme index qui va devoir contenir le resultat
d'indexation d'un grand nombre de documents PDF de type text, dans ce
cas
c'est les metadata ainsi que le contenu de chaque document pdf qui va
être
indexé et en fait cela me pose un probleme car je ne souhaite
absoluement
pas indexer le contenu de chaque document vu le nombre de doc, je vais
me
retrouver avec un index enorme.
Y a t-il un moyen pour ne pas indexer le contenu mais seulement les
Si SPS a le IFilter et il peut trouver les fichier, il peut les indexer
Voila voila
Renaud Comte [MVP] -------------------------------------- http://blogs.developpeur.org/themit/ http://blog.spsclerics.com/
Mon moteur d'indexation est paramétré de la façon suivante => 2 index differents - PDF ifilter installé coté sps et coté sql
Le premier index contient les resultats de l'indexation d'un grand nombres de documents PDF (de type image seulement) donc en fait se sont seulement les metadatas et le nom des fichiers qui sont indexés.
Le deuxieme index contient le resultat de l'indexation d'un grand nombre de fichiers en tout genres (bureautique, pdf text+image, ...) dans ce cas c'est les metadata + le contenu de chaque document qui est indexé.
Je vais ajouter un troiseme index qui va devoir contenir le resultat
d'indexation d'un grand nombre de documents PDF de type text, dans ce cas
c'est les metadata ainsi que le contenu de chaque document pdf qui va être
indexé et en fait cela me pose un probleme car je ne souhaite absoluement
pas indexer le contenu de chaque document vu le nombre de doc, je vais me
retrouver avec un index enorme.
Y a t-il un moyen pour ne pas indexer le contenu mais seulement les