Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Convertir un index de fichiers PDF en base SQL. Possible ?

3 réponses
Avatar
Daniel
Bonjour,
Quand je je lance le moteur de recherche d'Acrobat pour indexer un ensemble
de fichiers PDF, Acrobat génère un fichier d'index IDX. Existe-t-il un moyen
simple de convertir ce fichier en une base SQL ?
Merci.

Daniel

3 réponses

Avatar
SQLpro
Daniel a écrit :
Bonjour,
Quand je je lance le moteur de recherche d'Acrobat pour indexer un ensemble
de fichiers PDF, Acrobat génère un fichier d'index IDX. Existe-t-il un moyen
simple de convertir ce fichier en une base SQL ?
Merci.

Daniel




Ce serait plutôt l'inverse qu'il faudrait faire :
Utiliser un SGBDR qui permet de faire une indexation textuelle de
données SQL ou fichier électronique. Par exemple pour SQL Server 2008 et
son moteur IFTS vous pouvez stocker des pdf en table et les indexer
textuellement à l'aide d'un filtre d'indexation textuelle spécifique à PDF.
En plus, les prédicats de recherche comme CONTAINS font partie de la
norme SQL, alors que les index Adobe sont des fichiers spécifiques, ce
qui pose le problème de la pérennité de la chose !

A +

--
Frédéric BROUARD, MVP SQL Server, expert bases de données et langage SQL
Le site sur le langage SQL et les SGBDR : http://sqlpro.developpez.com
Audit, conseil, expertise, formation, modélisation, tuning, optimisation
Enseignant aux Arts & Métiers PACA et à L'ISEN Toulon - Var Technologies
*********************** http://www.sqlspot.com *************************
Avatar
helios
SQLpro a écrit :
Daniel a écrit :
Bonjour,
Quand je je lance le moteur de recherche d'Acrobat pour indexer un
ensemble de fichiers PDF, Acrobat génère un fichier d'index IDX.
Existe-t-il un moyen simple de convertir ce fichier en une base SQL ?
Merci.

Daniel



Ce serait plutôt l'inverse qu'il faudrait faire :




sacré Fred fait tout a l'envers même les SGBD


Utiliser un SGBDR qui permet de faire une indexation textuelle de
données SQL ou fichier électronique. Par exemple pour SQL Server 2008 et
son moteur IFTS vous pouvez stocker des pdf en table et les indexer
textuellement à l'aide d'un filtre d'indexation textuelle spécifique à PDF.
En plus, les prédicats de recherche comme CONTAINS font partie de la
norme SQL, alors que les index Adobe sont des fichiers spécifiques, ce
qui pose le problème de la pérennité de la chose !

A +





l'homosexualité n'est pas une maladie d'après l'OMS
mais que penser de quelqu'un qui essais de brancher des prise de même sexe ?


PS vas y Fred attaque en diffamation
Avatar
Daniel
Effectivement, ça me paraît être la meilleure solution. Le filtre
d'indexation dont vous parlez, spécifique au PDF, est inclus dans le moteur
IFTS ? Est-il capable d'indexer tout PDF ? Les miens sont générés par
FineReader (logiciel d'OCR).
Merci.

Daniel


"SQLpro" a écrit dans le message de news:
4b50fd2c$0$24199$
Daniel a écrit :
Bonjour,
Quand je je lance le moteur de recherche d'Acrobat pour indexer un
ensemble de fichiers PDF, Acrobat génère un fichier d'index IDX.
Existe-t-il un moyen simple de convertir ce fichier en une base SQL ?
Merci.

Daniel


Ce serait plutôt l'inverse qu'il faudrait faire :
Utiliser un SGBDR qui permet de faire une indexation textuelle de données
SQL ou fichier électronique. Par exemple pour SQL Server 2008 et son
moteur IFTS vous pouvez stocker des pdf en table et les indexer
textuellement à l'aide d'un filtre d'indexation textuelle spécifique à
PDF.
En plus, les prédicats de recherche comme CONTAINS font partie de la norme
SQL, alors que les index Adobe sont des fichiers spécifiques, ce qui pose
le problème de la pérennité de la chose !

A +

--
Frédéric BROUARD, MVP SQL Server, expert bases de données et langage SQL
Le site sur le langage SQL et les SGBDR : http://sqlpro.developpez.com
Audit, conseil, expertise, formation, modélisation, tuning, optimisation
Enseignant aux Arts & Métiers PACA et à L'ISEN Toulon - Var Technologies
*********************** http://www.sqlspot.com *************************