Convertir un index de fichiers PDF en base SQL. Possible ?

Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Entraide Applications Applications SGBD Convertir un index de fichiers PDF en base SQL. Possible ?

3 réponses

Daniel

14/01/2010 à 20:15

Bonjour,
Quand je je lance le moteur de recherche d'Acrobat pour indexer un ensemble
de fichiers PDF, Acrobat génère un fichier d'index IDX. Existe-t-il un moyen
simple de convertir ce fichier en une base SQL ?
Merci.

Daniel

3 réponses

SQLpro

16/01/2010 à 00:41

Daniel a écrit :

Bonjour,
Quand je je lance le moteur de recherche d'Acrobat pour indexer un ensemble
de fichiers PDF, Acrobat génère un fichier d'index IDX. Existe-t-il un moyen
simple de convertir ce fichier en une base SQL ?
Merci.

Daniel

Ce serait plutôt l'inverse qu'il faudrait faire :
Utiliser un SGBDR qui permet de faire une indexation textuelle de
données SQL ou fichier électronique. Par exemple pour SQL Server 2008 et
son moteur IFTS vous pouvez stocker des pdf en table et les indexer
textuellement à l'aide d'un filtre d'indexation textuelle spécifique à PDF.
En plus, les prédicats de recherche comme CONTAINS font partie de la
norme SQL, alors que les index Adobe sont des fichiers spécifiques, ce
qui pose le problème de la pérennité de la chose !

A +

--
Frédéric BROUARD, MVP SQL Server, expert bases de données et langage SQL
Le site sur le langage SQL et les SGBDR : http://sqlpro.developpez.com
Audit, conseil, expertise, formation, modélisation, tuning, optimisation
Enseignant aux Arts & Métiers PACA et à L'ISEN Toulon - Var Technologies
*********************** http://www.sqlspot.com *************************

helios

16/01/2010 à 07:34

SQLpro a écrit :

Daniel a écrit :
Bonjour,
Quand je je lance le moteur de recherche d'Acrobat pour indexer un
ensemble de fichiers PDF, Acrobat génère un fichier d'index IDX.
Existe-t-il un moyen simple de convertir ce fichier en une base SQL ?
Merci.

Daniel

Ce serait plutôt l'inverse qu'il faudrait faire :

sacré Fred fait tout a l'envers même les SGBD

Utiliser un SGBDR qui permet de faire une indexation textuelle de
données SQL ou fichier électronique. Par exemple pour SQL Server 2008 et
son moteur IFTS vous pouvez stocker des pdf en table et les indexer
textuellement à l'aide d'un filtre d'indexation textuelle spécifique à PDF.
En plus, les prédicats de recherche comme CONTAINS font partie de la
norme SQL, alors que les index Adobe sont des fichiers spécifiques, ce
qui pose le problème de la pérennité de la chose !

A +

l'homosexualité n'est pas une maladie d'après l'OMS
mais que penser de quelqu'un qui essais de brancher des prise de même sexe ?

PS vas y Fred attaque en diffamation

Daniel

20/01/2010 à 19:32

Effectivement, ça me paraît être la meilleure solution. Le filtre
d'indexation dont vous parlez, spécifique au PDF, est inclus dans le moteur
IFTS ? Est-il capable d'indexer tout PDF ? Les miens sont générés par
FineReader (logiciel d'OCR).
Merci.

Daniel

"SQLpro" a écrit dans le message de news:
4b50fd2c$0$24199$

Daniel a écrit :
Bonjour,
Quand je je lance le moteur de recherche d'Acrobat pour indexer un
ensemble de fichiers PDF, Acrobat génère un fichier d'index IDX.
Existe-t-il un moyen simple de convertir ce fichier en une base SQL ?
Merci.

Daniel

Ce serait plutôt l'inverse qu'il faudrait faire :
Utiliser un SGBDR qui permet de faire une indexation textuelle de données
SQL ou fichier électronique. Par exemple pour SQL Server 2008 et son
moteur IFTS vous pouvez stocker des pdf en table et les indexer
textuellement à l'aide d'un filtre d'indexation textuelle spécifique à
PDF.
En plus, les prédicats de recherche comme CONTAINS font partie de la norme
SQL, alors que les index Adobe sont des fichiers spécifiques, ce qui pose
le problème de la pérennité de la chose !

A +

--
Frédéric BROUARD, MVP SQL Server, expert bases de données et langage SQL
Le site sur le langage SQL et les SGBDR : http://sqlpro.developpez.com
Audit, conseil, expertise, formation, modélisation, tuning, optimisation
Enseignant aux Arts & Métiers PACA et à L'ISEN Toulon - Var Technologies
*********************** http://www.sqlspot.com *************************

Convertir un index de fichiers PDF en base SQL. Possible ?

3 réponses

Veuillez sélectionner un problème