Convertir un index de fichiers PDF en base SQL. Possible ?

Le
Daniel
Bonjour,
Quand je je lance le moteur de recherche d'Acrobat pour indexer un ensemble
de fichiers PDF, Acrobat génère un fichier d'index IDX. Existe-t-il un moyen
simple de convertir ce fichier en une base SQL ?
Merci.

Daniel
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
SQLpro
Le #21925011
Daniel a écrit :
Bonjour,
Quand je je lance le moteur de recherche d'Acrobat pour indexer un ensemble
de fichiers PDF, Acrobat génère un fichier d'index IDX. Existe-t-il un moyen
simple de convertir ce fichier en une base SQL ?
Merci.

Daniel




Ce serait plutôt l'inverse qu'il faudrait faire :
Utiliser un SGBDR qui permet de faire une indexation textuelle de
données SQL ou fichier électronique. Par exemple pour SQL Server 2008 et
son moteur IFTS vous pouvez stocker des pdf en table et les indexer
textuellement à l'aide d'un filtre d'indexation textuelle spécifique à PDF.
En plus, les prédicats de recherche comme CONTAINS font partie de la
norme SQL, alors que les index Adobe sont des fichiers spécifiques, ce
qui pose le problème de la pérennité de la chose !

A +

--
Frédéric BROUARD, MVP SQL Server, expert bases de données et langage SQL
Le site sur le langage SQL et les SGBDR : http://sqlpro.developpez.com
Audit, conseil, expertise, formation, modélisation, tuning, optimisation
Enseignant aux Arts & Métiers PACA et à L'ISEN Toulon - Var Technologies
*********************** http://www.sqlspot.com *************************
helios
Le #21925001
SQLpro a écrit :
Daniel a écrit :
Bonjour,
Quand je je lance le moteur de recherche d'Acrobat pour indexer un
ensemble de fichiers PDF, Acrobat génère un fichier d'index IDX.
Existe-t-il un moyen simple de convertir ce fichier en une base SQL ?
Merci.

Daniel



Ce serait plutôt l'inverse qu'il faudrait faire :




sacré Fred fait tout a l'envers même les SGBD


Utiliser un SGBDR qui permet de faire une indexation textuelle de
données SQL ou fichier électronique. Par exemple pour SQL Server 2008 et
son moteur IFTS vous pouvez stocker des pdf en table et les indexer
textuellement à l'aide d'un filtre d'indexation textuelle spécifique à PDF.
En plus, les prédicats de recherche comme CONTAINS font partie de la
norme SQL, alors que les index Adobe sont des fichiers spécifiques, ce
qui pose le problème de la pérennité de la chose !

A +





l'homosexualité n'est pas une maladie d'après l'OMS
mais que penser de quelqu'un qui essais de brancher des prise de même sexe ?


PS vas y Fred attaque en diffamation
Daniel
Le #21924971
Effectivement, ça me paraît être la meilleure solution. Le filtre
d'indexation dont vous parlez, spécifique au PDF, est inclus dans le moteur
IFTS ? Est-il capable d'indexer tout PDF ? Les miens sont générés par
FineReader (logiciel d'OCR).
Merci.

Daniel


"SQLpro" 4b50fd2c$0$24199$
Daniel a écrit :
Bonjour,
Quand je je lance le moteur de recherche d'Acrobat pour indexer un
ensemble de fichiers PDF, Acrobat génère un fichier d'index IDX.
Existe-t-il un moyen simple de convertir ce fichier en une base SQL ?
Merci.

Daniel


Ce serait plutôt l'inverse qu'il faudrait faire :
Utiliser un SGBDR qui permet de faire une indexation textuelle de données
SQL ou fichier électronique. Par exemple pour SQL Server 2008 et son
moteur IFTS vous pouvez stocker des pdf en table et les indexer
textuellement à l'aide d'un filtre d'indexation textuelle spécifique à
PDF.
En plus, les prédicats de recherche comme CONTAINS font partie de la norme
SQL, alors que les index Adobe sont des fichiers spécifiques, ce qui pose
le problème de la pérennité de la chose !

A +

--
Frédéric BROUARD, MVP SQL Server, expert bases de données et langage SQL
Le site sur le langage SQL et les SGBDR : http://sqlpro.developpez.com
Audit, conseil, expertise, formation, modélisation, tuning, optimisation
Enseignant aux Arts & Métiers PACA et à L'ISEN Toulon - Var Technologies
*********************** http://www.sqlspot.com *************************

Publicité
Poster une réponse
Anonyme