Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Recherche dans des fichiers pdf par contenu.

12 réponses
Avatar
kaliderus
Bonjour,
Existe-t-il une commande ou un outil pour recherche des fichiers .pdf
par contenu (par une chaine de caractère) et dans une arborescence donnée ?
Merci.

--
J'ai des choses à dire
http://kaliderus.blogspot.com

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/DebFrFrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org

10 réponses

1 2
Avatar
Kevin Hinault
Le 22 octobre 2008 11:14, Jean-Claude a écrit :
Peut-être n'ai-je pas bien compris la question :

find /repertoire/ -name "*.pdf"

Cherche dans repertoire et sa sous arborescence les fichiers pdf.
tu peux adapter l'expressions rationnelle si tu cherches quelques chose d e
précis.



Sa demande ne portait pas sur le nom de fichier mais sur le contenu du
fichier. Donc l'exemple n'est bon que si elle le couple avec la
commande grep :) ... sauf que je ne sais pas si le contenu du pdf est
binaire ou texte.

--
Vous aimez la bretagne ?
Breizh da viken : www.pointbzh.com

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/DebFrFrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Pierre Allken-Bernard
Kevin Hinault a écrit :
Sa demande ne portait pas sur le nom de fichier mais sur le contenu du
fichier. Donc l'exemple n'est bon que si elle le couple avec la
commande grep :) ... sauf que je ne sais pas si le contenu du pdf est
binaire ou texte.



Bonjour,
Dans le cas particulier où l'on utilise xpdf (par exemple) pour voir le
pdf, il y a un bouton avec une paire de jumelles dessus, il suffit de
cliquer... mais ça ne fonctionne pas si on cherche des accents (ou alors
il y a quelque chose à faire avant), je viens
d'essayer.

Pierre

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/DebFrFrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Edi Stojicevic
* kaliderus [2008-10-22 13:10:18 +0200] wrote :

Bonjour,
Existe-t-il une commande ou un outil pour recherche des fichiers .pdf
par contenu (par une chaine de caractère) et dans une arborescence do nnée
?
Merci.



Salut,

Si tu connais un peu Perl tu as des modules pour cela comme PDF::API2.

@+

--
. ''`. (___/) E d i S T O J I C E V I C
: :' : (='.'=) http://www.debianworld.org
`. `~' (")_(") GPG: 0x1237B032
`-

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/DebFrFrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Christophe Maquaire
Le mercredi 22 octobre 2008 à 11:25 +0200, Kevin Hinault a écrit :

Sa demande ne portait pas sur le nom de fichier mais sur le contenu du
fichier. Donc l'exemple n'est bon que si elle le couple avec la
commande grep :) ... sauf que je ne sais pas si le contenu du pdf est
binaire ou texte.



Avec en plus pdftotext il devrait arriver à ses fins.

Christophe

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/DebFrFrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
kaliderus
Christophe Maquaire a écrit :
Le mercredi 22 octobre 2008 à 11:25 +0200, Kevin Hinault a écrit :


Sa demande ne portait pas sur le nom de fichier mais sur le contenu du
fichier. Donc l'exemple n'est bon que si elle le couple avec la
commande grep :) ... sauf que je ne sais pas si le contenu du pdf est
binaire ou texte.




Avec en plus pdftotext il devrait arriver à ses fins.

Christophe




Un cat sur un fichier .pdf renvoie des signes bizarres, je vais voir si
du côté de pdftotext il n'y a pas quelque chose à faire, mais me semble
un peut compliqué comme solution ...
C'est quand même étrange, tous les moteurs de recherche sont capables de
regarder des contenus pdf mais il n'y aurait rien dans la debian ?!...
snif ...
k.


--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/DebFrFrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Charles Plessy
Le Wed, Oct 22, 2008 at 02:35:47PM +0200, kaliderus a écrit :
C'est quand même étrange, tous les moteurs de recherche sont capables de
regarder des contenus pdf mais il n'y aurait rien dans la debian ?!...



Bonjour,

du côté des gestionnaires de bureau avancés comme KDE, il y a des outils
d'indexation qui sont capable de faire ce genre de recherche (comme
Beagle). Attention, ce sont aussi de grands laboureurs de disque durs.

Sinon, un gestionnaire de collection comme Tellico le fait aussi.

Amicalement,

--
Charles Plessy
Tsurumi, Kanagawa, Japon

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/DebFrFrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
kaliderus
Pierre Allken-Bernard a écrit :
Kevin Hinault a écrit :

Sa demande ne portait pas sur le nom de fichier mais sur le contenu du
fichier. Donc l'exemple n'est bon que si elle le couple avec la
commande grep :) ... sauf que je ne sais pas si le contenu du pdf est
binaire ou texte.




Bonjour,
Dans le cas particulier où l'on utilise xpdf (par exemple) pour voir le
pdf, il y a un bouton avec une paire de jumelles dessus, il suffit de
cliquer... mais ça ne fonctionne pas si on cherche des accents (ou alors
il y a quelque chose à faire avant), je viens
d'essayer.

Pierre




Mon objectif est de rechercher dans une arborescence par contenu
(environ 200 .pdf un peu n'importe ou), les lecteurs pdf intègrent bien
tous une fonction de recherche, mais je n'en connais pas qui
fonctionnent en ligne de commande.
Merci.
k.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/DebFrFrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
kaliderus
Edi Stojicevic a écrit :
* kaliderus [2008-10-22 13:10:18 +0200] wrote :


Bonjour,
Existe-t-il une commande ou un outil pour recherche des fichiers .pdf
par contenu (par une chaine de caractère) et dans une arborescence donnée
?
Merci.




Salut,

Si tu connais un peu Perl tu as des modules pour cela comme PDF::API2.

@+




Pas du tout mais cette idée me plait et je vois là l'occasion
d'apprendre :-)
Merci.
k.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/DebFrFrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Dominique Asselineau
Pierre Allken-Bernard wrote on Wed, Oct 22, 2008 at 11:34:01AM +0200
Kevin Hinault a écrit :
> Sa demande ne portait pas sur le nom de fichier mais sur le contenu du
> fichier. Donc l'exemple n'est bon que si elle le couple avec la
> commande grep :) ... sauf que je ne sais pas si le contenu du pdf est
> binaire ou texte.

Bonjour,
Dans le cas particulier où l'on utilise xpdf (par exemple) pour voir le
pdf, il y a un bouton avec une paire de jumelles dessus, il suffit de
cliquer... mais ça ne fonctionne pas si on cherche des accents (ou alors
il y a quelque chose à faire avant), je viens
d'essayer.



On peut utiliser pdftotext (paquet xpdf) et faire des grep dans le
résultat. À combiner avec find par ex.

Dominique

--

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/DebFrFrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
kaliderus
Charles Plessy a écrit :
Le Wed, Oct 22, 2008 at 02:35:47PM +0200, kaliderus a écrit :

C'est quand même étrange, tous les moteurs de recherche sont capables de
regarder des contenus pdf mais il n'y aurait rien dans la debian ?!...




Bonjour,

du côté des gestionnaires de bureau avancés comme KDE, il y a des outils
d'indexation qui sont capable de faire ce genre de recherche (comme
Beagle). Attention, ce sont aussi de grands laboureurs de disque durs.

Sinon, un gestionnaire de collection comme Tellico le fait aussi.

Amicalement,





D'accord merci, c'est sans doute surdimensionné pour mon besoin. Je vais
regarder de plus près.
k.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/DebFrFrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
1 2