OVH Cloud OVH Cloud

[sps2003 + PDF Ifilter v5] OCR sur fichier pdf

4 réponses
Avatar
Cyrille
Bonjour
L'article suivant
http://support.microsoft.com/default.aspx?scid=kb;en-us;837847
indique comment modifier une clé de registre pour que SPS réalise de l'OCR
sur les fichier .tif.
SPS peut-il faire de même sur les fichiers pdf image (moyennant une
modification du registre) ?
A+

4 réponses

Avatar
EROL MVP SPS
Bonjour Cyrille,

Je ne comprends pas bien votre question, le PDF fonctionne parfaitement avec
un IFilter.

Vous activez le fait de lire les extensions PDF et installez le IFilter et
cela fonctionne.

IFilter Adobe PDF IFilter v6.0

http://www.adobe.com/support/downloads/detail.jsp?ftpID&11

P.S. Ne pas oublier de faire un UnInstall de la version 5 au pralable. De
plus, il faut arrter les services utilisant le IFilter 5 avant de le
dsinstaller, sinon, il refuse de se supprimer.

Cdlt
--
EROL MVP SharePoint. www.mysps.info
http://aspnet2.com/mvp.ashx?ErolGiraudy

"Cyrille" a écrit dans le message de
news:
Bonjour
L'article suivant
http://support.microsoft.com/default.aspx?scid=kb;en-us;837847
indique comment modifier une clé de registre pour que SPS réalise de l'OCR
sur les fichier .tif.
SPS peut-il faire de même sur les fichiers pdf image (moyennant une
modification du registre) ?
A+


Avatar
Cyrille
Hello
Avec le pdf ifilter, lorsque vous stoquez un fichier .pdf image (issu d'un
scanner), seul les propriétés du document sont inclus dans l'index pas le
contenu. Lorsque vous stoquez un fichier .pdf texte, les propriétés et le
contenu sont indexés.
Dans le cas d'un fichier .tif, SPS peut en faire de l'OCR. Quand est-il pour
un fichier .pdf image ?

"EROL MVP SPS" a écrit :

Bonjour Cyrille,

Je ne comprends pas bien votre question, le PDF fonctionne parfaitement avec
un IFilter.

Vous activez le fait de lire les extensions PDF et installez le IFilter et
cela fonctionne.

IFilter Adobe PDF IFilter v6.0

http://www.adobe.com/support/downloads/detail.jsp?ftpID&11

P.S. Ne pas oublier de faire un UnInstall de la version 5 au pralable. De
plus, il faut arrter les services utilisant le IFilter 5 avant de le
dsinstaller, sinon, il refuse de se supprimer.

Cdlt
--
EROL MVP SharePoint. www.mysps.info
http://aspnet2.com/mvp.ashx?ErolGiraudy

"Cyrille" a écrit dans le message de
news:
> Bonjour
> L'article suivant
> http://support.microsoft.com/default.aspx?scid=kb;en-us;837847
> indique comment modifier une clé de registre pour que SPS réalise de l'OCR
> sur les fichier .tif.
> SPS peut-il faire de même sur les fichiers pdf image (moyennant une
> modification du registre) ?
> A+






Avatar
Eric Donneger
A ma connaissance, rien de tel n'existe pour PDF.
Pour cela, il faudrait déjà que le iFilter PDF puisse exposer les-dites
images dans un format exploitable par un OCR.

--
Eric Donneger
http://blogs.developpeur.org/FatEric
http://www.clubsps.org


"Cyrille" a écrit :

Hello
Avec le pdf ifilter, lorsque vous stoquez un fichier .pdf image (issu d'un
scanner), seul les propriétés du document sont inclus dans l'index pas le
contenu. Lorsque vous stoquez un fichier .pdf texte, les propriétés et le
contenu sont indexés.
Dans le cas d'un fichier .tif, SPS peut en faire de l'OCR. Quand est-il pour
un fichier .pdf image ?

"EROL MVP SPS" a écrit :

> Bonjour Cyrille,
>
> Je ne comprends pas bien votre question, le PDF fonctionne parfaitement avec
> un IFilter.
>
> Vous activez le fait de lire les extensions PDF et installez le IFilter et
> cela fonctionne.
>
> IFilter Adobe PDF IFilter v6.0
>
> http://www.adobe.com/support/downloads/detail.jsp?ftpID&11
>
> P.S. Ne pas oublier de faire un UnInstall de la version 5 au pralable. De
> plus, il faut arrter les services utilisant le IFilter 5 avant de le
> dsinstaller, sinon, il refuse de se supprimer.
>
> Cdlt
> --
> EROL MVP SharePoint. www.mysps.info
> http://aspnet2.com/mvp.ashx?ErolGiraudy
>
> "Cyrille" a écrit dans le message de
> news:
> > Bonjour
> > L'article suivant
> > http://support.microsoft.com/default.aspx?scid=kb;en-us;837847
> > indique comment modifier une clé de registre pour que SPS réalise de l'OCR
> > sur les fichier .tif.
> > SPS peut-il faire de même sur les fichiers pdf image (moyennant une
> > modification du registre) ?
> > A+
>
>
>
>


Avatar
EROL MVP SPS
Bonsoir,

Je commence à comprendre.

Effectivement je n'ai pas connaissance de ce genre de chose (comme l'indique
ERIC).

Le PDF est exploité comme tel. Ou, si c'est une image, je ne connais pas
les solutions de traduction.

Il faudrait aller voir sur le site ADOBE les solutions qu'ils proposent.
optical character recognition (OCR)
http://www.adobe.com/products/acrcapture/fullfeature.html#q7

des solutions de dév. existent sdk:
http://partners.adobe.com/public/developer/downloads/index.html


Cdlt.
--
EROL MVP SharePoint. www.mysps.info
http://aspnet2.com/mvp.ashx?ErolGiraudy

"Eric Donneger" a écrit dans le
message de news:
A ma connaissance, rien de tel n'existe pour PDF.
Pour cela, il faudrait déjà que le iFilter PDF puisse exposer les-dites
images dans un format exploitable par un OCR.

--
Eric Donneger
http://blogs.developpeur.org/FatEric
http://www.clubsps.org


"Cyrille" a écrit :

Hello
Avec le pdf ifilter, lorsque vous stoquez un fichier .pdf image (issu
d'un
scanner), seul les propriétés du document sont inclus dans l'index pas le
contenu. Lorsque vous stoquez un fichier .pdf texte, les propriétés et le
contenu sont indexés.
Dans le cas d'un fichier .tif, SPS peut en faire de l'OCR. Quand est-il
pour
un fichier .pdf image ?

"EROL MVP SPS" a écrit :

> Bonjour Cyrille,
>
> Je ne comprends pas bien votre question, le PDF fonctionne parfaitement
> avec
> un IFilter.
>
> Vous activez le fait de lire les extensions PDF et installez le IFilter
> et
> cela fonctionne.
>
> IFilter Adobe PDF IFilter v6.0
>
> http://www.adobe.com/support/downloads/detail.jsp?ftpID&11
>
> P.S. Ne pas oublier de faire un UnInstall de la version 5 au pralable.
> De
> plus, il faut arrter les services utilisant le IFilter 5 avant de le
> dsinstaller, sinon, il refuse de se supprimer.
>
> Cdlt
> --
> EROL MVP SharePoint. www.mysps.info
> http://aspnet2.com/mvp.ashx?ErolGiraudy
>
> "Cyrille" a écrit dans le message
> de
> news:
> > Bonjour
> > L'article suivant
> > http://support.microsoft.com/default.aspx?scid=kb;en-us;837847
> > indique comment modifier une clé de registre pour que SPS réalise de
> > l'OCR
> > sur les fichier .tif.
> > SPS peut-il faire de même sur les fichiers pdf image (moyennant une
> > modification du registre) ?
> > A+
>
>
>
>