Convertir un index de fichiers PDF en base SQL. Possible ?
3 réponses
Daniel
Bonjour,
Quand je je lance le moteur de recherche d'Acrobat pour indexer un ensemble
de fichiers PDF, Acrobat génère un fichier d'index IDX. Existe-t-il un moyen
simple de convertir ce fichier en une base SQL ?
Merci.
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
SQLpro
Daniel a écrit :
Bonjour, Quand je je lance le moteur de recherche d'Acrobat pour indexer un ensemble de fichiers PDF, Acrobat génère un fichier d'index IDX. Existe-t-il un moyen simple de convertir ce fichier en une base SQL ? Merci.
Daniel
Ce serait plutôt l'inverse qu'il faudrait faire : Utiliser un SGBDR qui permet de faire une indexation textuelle de données SQL ou fichier électronique. Par exemple pour SQL Server 2008 et son moteur IFTS vous pouvez stocker des pdf en table et les indexer textuellement à l'aide d'un filtre d'indexation textuelle spécifique à PDF. En plus, les prédicats de recherche comme CONTAINS font partie de la norme SQL, alors que les index Adobe sont des fichiers spécifiques, ce qui pose le problème de la pérennité de la chose !
A +
-- Frédéric BROUARD, MVP SQL Server, expert bases de données et langage SQL Le site sur le langage SQL et les SGBDR : http://sqlpro.developpez.com Audit, conseil, expertise, formation, modélisation, tuning, optimisation Enseignant aux Arts & Métiers PACA et à L'ISEN Toulon - Var Technologies *********************** http://www.sqlspot.com *************************
Daniel a écrit :
Bonjour,
Quand je je lance le moteur de recherche d'Acrobat pour indexer un ensemble
de fichiers PDF, Acrobat génère un fichier d'index IDX. Existe-t-il un moyen
simple de convertir ce fichier en une base SQL ?
Merci.
Daniel
Ce serait plutôt l'inverse qu'il faudrait faire :
Utiliser un SGBDR qui permet de faire une indexation textuelle de
données SQL ou fichier électronique. Par exemple pour SQL Server 2008 et
son moteur IFTS vous pouvez stocker des pdf en table et les indexer
textuellement à l'aide d'un filtre d'indexation textuelle spécifique à PDF.
En plus, les prédicats de recherche comme CONTAINS font partie de la
norme SQL, alors que les index Adobe sont des fichiers spécifiques, ce
qui pose le problème de la pérennité de la chose !
A +
--
Frédéric BROUARD, MVP SQL Server, expert bases de données et langage SQL
Le site sur le langage SQL et les SGBDR : http://sqlpro.developpez.com
Audit, conseil, expertise, formation, modélisation, tuning, optimisation
Enseignant aux Arts & Métiers PACA et à L'ISEN Toulon - Var Technologies
*********************** http://www.sqlspot.com *************************
Bonjour, Quand je je lance le moteur de recherche d'Acrobat pour indexer un ensemble de fichiers PDF, Acrobat génère un fichier d'index IDX. Existe-t-il un moyen simple de convertir ce fichier en une base SQL ? Merci.
Daniel
Ce serait plutôt l'inverse qu'il faudrait faire : Utiliser un SGBDR qui permet de faire une indexation textuelle de données SQL ou fichier électronique. Par exemple pour SQL Server 2008 et son moteur IFTS vous pouvez stocker des pdf en table et les indexer textuellement à l'aide d'un filtre d'indexation textuelle spécifique à PDF. En plus, les prédicats de recherche comme CONTAINS font partie de la norme SQL, alors que les index Adobe sont des fichiers spécifiques, ce qui pose le problème de la pérennité de la chose !
A +
-- Frédéric BROUARD, MVP SQL Server, expert bases de données et langage SQL Le site sur le langage SQL et les SGBDR : http://sqlpro.developpez.com Audit, conseil, expertise, formation, modélisation, tuning, optimisation Enseignant aux Arts & Métiers PACA et à L'ISEN Toulon - Var Technologies *********************** http://www.sqlspot.com *************************
helios
SQLpro a écrit :
Daniel a écrit :
Bonjour, Quand je je lance le moteur de recherche d'Acrobat pour indexer un ensemble de fichiers PDF, Acrobat génère un fichier d'index IDX. Existe-t-il un moyen simple de convertir ce fichier en une base SQL ? Merci.
Daniel
Ce serait plutôt l'inverse qu'il faudrait faire :
sacré Fred fait tout a l'envers même les SGBD
Utiliser un SGBDR qui permet de faire une indexation textuelle de données SQL ou fichier électronique. Par exemple pour SQL Server 2008 et son moteur IFTS vous pouvez stocker des pdf en table et les indexer textuellement à l'aide d'un filtre d'indexation textuelle spécifique à PDF. En plus, les prédicats de recherche comme CONTAINS font partie de la norme SQL, alors que les index Adobe sont des fichiers spécifiques, ce qui pose le problème de la pérennité de la chose !
A +
l'homosexualité n'est pas une maladie d'après l'OMS mais que penser de quelqu'un qui essais de brancher des prise de même sexe ?
PS vas y Fred attaque en diffamation
SQLpro a écrit :
Daniel a écrit :
Bonjour,
Quand je je lance le moteur de recherche d'Acrobat pour indexer un
ensemble de fichiers PDF, Acrobat génère un fichier d'index IDX.
Existe-t-il un moyen simple de convertir ce fichier en une base SQL ?
Merci.
Daniel
Ce serait plutôt l'inverse qu'il faudrait faire :
sacré Fred fait tout a l'envers même les SGBD
Utiliser un SGBDR qui permet de faire une indexation textuelle de
données SQL ou fichier électronique. Par exemple pour SQL Server 2008 et
son moteur IFTS vous pouvez stocker des pdf en table et les indexer
textuellement à l'aide d'un filtre d'indexation textuelle spécifique à PDF.
En plus, les prédicats de recherche comme CONTAINS font partie de la
norme SQL, alors que les index Adobe sont des fichiers spécifiques, ce
qui pose le problème de la pérennité de la chose !
A +
l'homosexualité n'est pas une maladie d'après l'OMS
mais que penser de quelqu'un qui essais de brancher des prise de même sexe ?
Bonjour, Quand je je lance le moteur de recherche d'Acrobat pour indexer un ensemble de fichiers PDF, Acrobat génère un fichier d'index IDX. Existe-t-il un moyen simple de convertir ce fichier en une base SQL ? Merci.
Daniel
Ce serait plutôt l'inverse qu'il faudrait faire :
sacré Fred fait tout a l'envers même les SGBD
Utiliser un SGBDR qui permet de faire une indexation textuelle de données SQL ou fichier électronique. Par exemple pour SQL Server 2008 et son moteur IFTS vous pouvez stocker des pdf en table et les indexer textuellement à l'aide d'un filtre d'indexation textuelle spécifique à PDF. En plus, les prédicats de recherche comme CONTAINS font partie de la norme SQL, alors que les index Adobe sont des fichiers spécifiques, ce qui pose le problème de la pérennité de la chose !
A +
l'homosexualité n'est pas une maladie d'après l'OMS mais que penser de quelqu'un qui essais de brancher des prise de même sexe ?
PS vas y Fred attaque en diffamation
Daniel
Effectivement, ça me paraît être la meilleure solution. Le filtre d'indexation dont vous parlez, spécifique au PDF, est inclus dans le moteur IFTS ? Est-il capable d'indexer tout PDF ? Les miens sont générés par FineReader (logiciel d'OCR). Merci.
Daniel
"SQLpro" a écrit dans le message de news: 4b50fd2c$0$24199$
Daniel a écrit :
Bonjour, Quand je je lance le moteur de recherche d'Acrobat pour indexer un ensemble de fichiers PDF, Acrobat génère un fichier d'index IDX. Existe-t-il un moyen simple de convertir ce fichier en une base SQL ? Merci.
Daniel
Ce serait plutôt l'inverse qu'il faudrait faire : Utiliser un SGBDR qui permet de faire une indexation textuelle de données SQL ou fichier électronique. Par exemple pour SQL Server 2008 et son moteur IFTS vous pouvez stocker des pdf en table et les indexer textuellement à l'aide d'un filtre d'indexation textuelle spécifique à PDF. En plus, les prédicats de recherche comme CONTAINS font partie de la norme SQL, alors que les index Adobe sont des fichiers spécifiques, ce qui pose le problème de la pérennité de la chose !
A +
-- Frédéric BROUARD, MVP SQL Server, expert bases de données et langage SQL Le site sur le langage SQL et les SGBDR : http://sqlpro.developpez.com Audit, conseil, expertise, formation, modélisation, tuning, optimisation Enseignant aux Arts & Métiers PACA et à L'ISEN Toulon - Var Technologies *********************** http://www.sqlspot.com *************************
Effectivement, ça me paraît être la meilleure solution. Le filtre
d'indexation dont vous parlez, spécifique au PDF, est inclus dans le moteur
IFTS ? Est-il capable d'indexer tout PDF ? Les miens sont générés par
FineReader (logiciel d'OCR).
Merci.
Daniel
"SQLpro" <brouardf@club-internet.fr> a écrit dans le message de news:
4b50fd2c$0$24199$426a74cc@news.free.fr...
Daniel a écrit :
Bonjour,
Quand je je lance le moteur de recherche d'Acrobat pour indexer un
ensemble de fichiers PDF, Acrobat génère un fichier d'index IDX.
Existe-t-il un moyen simple de convertir ce fichier en une base SQL ?
Merci.
Daniel
Ce serait plutôt l'inverse qu'il faudrait faire :
Utiliser un SGBDR qui permet de faire une indexation textuelle de données
SQL ou fichier électronique. Par exemple pour SQL Server 2008 et son
moteur IFTS vous pouvez stocker des pdf en table et les indexer
textuellement à l'aide d'un filtre d'indexation textuelle spécifique à
PDF.
En plus, les prédicats de recherche comme CONTAINS font partie de la norme
SQL, alors que les index Adobe sont des fichiers spécifiques, ce qui pose
le problème de la pérennité de la chose !
A +
--
Frédéric BROUARD, MVP SQL Server, expert bases de données et langage SQL
Le site sur le langage SQL et les SGBDR : http://sqlpro.developpez.com
Audit, conseil, expertise, formation, modélisation, tuning, optimisation
Enseignant aux Arts & Métiers PACA et à L'ISEN Toulon - Var Technologies
*********************** http://www.sqlspot.com *************************
Effectivement, ça me paraît être la meilleure solution. Le filtre d'indexation dont vous parlez, spécifique au PDF, est inclus dans le moteur IFTS ? Est-il capable d'indexer tout PDF ? Les miens sont générés par FineReader (logiciel d'OCR). Merci.
Daniel
"SQLpro" a écrit dans le message de news: 4b50fd2c$0$24199$
Daniel a écrit :
Bonjour, Quand je je lance le moteur de recherche d'Acrobat pour indexer un ensemble de fichiers PDF, Acrobat génère un fichier d'index IDX. Existe-t-il un moyen simple de convertir ce fichier en une base SQL ? Merci.
Daniel
Ce serait plutôt l'inverse qu'il faudrait faire : Utiliser un SGBDR qui permet de faire une indexation textuelle de données SQL ou fichier électronique. Par exemple pour SQL Server 2008 et son moteur IFTS vous pouvez stocker des pdf en table et les indexer textuellement à l'aide d'un filtre d'indexation textuelle spécifique à PDF. En plus, les prédicats de recherche comme CONTAINS font partie de la norme SQL, alors que les index Adobe sont des fichiers spécifiques, ce qui pose le problème de la pérennité de la chose !
A +
-- Frédéric BROUARD, MVP SQL Server, expert bases de données et langage SQL Le site sur le langage SQL et les SGBDR : http://sqlpro.developpez.com Audit, conseil, expertise, formation, modélisation, tuning, optimisation Enseignant aux Arts & Métiers PACA et à L'ISEN Toulon - Var Technologies *********************** http://www.sqlspot.com *************************