Extraire les images d'un document pdf

Le
Geo Cherchetout
Bonjour,

Soit un document pdf embarquant des images jpeg. Existe-t-il une visionneuse
qui permette de sélectionner une de ces images et de l'enregistrer dans un
fichier identique octet pour octet à l'original ? Cette opération n'est pas
un exploit technique puisqu'on peut la réaliser soi-même « à la main » à
l'aide d'un simple éditeur hexadécimal, mais Acrobat-Reader-DC et
Foxit-Reader m'en paraissent incapables.
Merci d'avance pour vos propositions n'impliquant pas l'usage de la ligne de
commande ou l'installation d'un logiciel payant.
Vos réponses Page 1 / 4
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Ascadix
Le #26540316
Geo Cherchetout a écrit dans
Bonjour,
Soit un document pdf embarquant des images jpeg. Existe-t-il une visionneuse
qui permette de sélectionner une de ces images et de l'enregistrer dans un
fichier identique octet pour octet à l'original ? Cette opération n'est pas
un exploit technique puisqu'on peut la réaliser soi-même « à la main » à
l'aide d'un simple éditeur hexadécimal, mais Acrobat-Reader-DC et
Foxit-Reader m'en paraissent incapables.
Merci d'avance pour vos propositions n'impliquant pas l'usage de la ligne de
commande ou l'installation d'un logiciel payant.

PDFXplorer
https://www.o2sol.com/pdfxplorer/overview.htm
C'est pas une visionneuse, mais tu as accés aux divers "objets"
incorporés et la possibiltié d'export bit-à-bit
--
@+
Ascadix
adresse @mail valide, mais ajoutez "sesame" dans l'objet pour que ça
arrive.
Geo Cherchetout
Le #26540324
Le 16/03/2020 20:37, *Ascadix* a écrit :
PDFXplorer
https://www.o2sol.com/pdfxplorer/overview.htm
C'est pas une visionneuse, mais tu as accés aux divers "objets"
incorporés et la possibiltié d'export bit-à-bit

Merci pour le tuyau, ce programme semble bien sympathique mais, si je
comprends bien ce qui est écrit sur le site de l'éditeur, il nécessite
l'installation préalable d'un « .NET Framework » sans lequel il ne peut
fonctionner, ni même peut-être s'installer. J'ai l'impression que ce
programme n'est autre que PDF4NET du même éditeur, facturé $499. Je voudrais
me tromper...
DuboisP
Le #26540325
Le 17/03/2020 à 10:21, Geo Cherchetout a écrit :
Le 16/03/2020 20:37, *Ascadix* a écrit :
PDFXplorer
https://www.o2sol.com/pdfxplorer/overview.htm
C'est pas une visionneuse, mais tu as accés aux divers "objets"
incorporés et la possibiltié d'export bit-à-bit

Merci pour le tuyau, ce programme semble bien sympathique mais, si je
comprends bien ce qui est écrit sur le site de l'éditeur, il nécessite
l'installation préalable d'un « .NET Framework » sans lequel il ne peut
fonctionner, ni même peut-être s'installer. J'ai l'impression que ce
programme n'est autre que PDF4NET du même éditeur, facturé $499. Je
voudrais me tromper...

sous Windows, .net framework est généralement installé
beaucoup de choses ne fonctionnent pas sans lui
Marc M.
Le #26540329
Le 16/03/2020 à 17:40, Geo Cherchetout a écrit :
Bonjour,
Soit un document pdf embarquant des images jpeg. Existe-t-il une
visionneuse qui permette de sélectionner une de ces images et de
l'enregistrer dans un fichier identique octet pour octet à l'original ?
Cette opération n'est pas un exploit technique puisqu'on peut la
réaliser soi-même « à la main » à l'aide d'un simple éditeur
hexadécimal, mais Acrobat-Reader-DC et Foxit-Reader m'en paraissent
incapables.
Merci d'avance pour vos propositions n'impliquant pas l'usage de la
ligne de commande ou l'installation d'un logiciel payant.

Libreoffice peut ouvrir des pdf, il doit y avoir moyen de faire un
copier coller de l'image.
Sergio
Le #26540332
Le 16/03/2020 à 17:40, Geo Cherchetout a écrit :
Bonjour,
Soit un document pdf embarquant des images jpeg. Existe-t-il une visionneuse qui permette de sélectionner une de ces images et de l'enregistrer dans un fichier identique octet pour octet à l'original
? Cette opération n'est pas un exploit technique puisqu'on peut la réaliser soi-même « à la main » à l'aide d'un simple éditeur hexadécimal, mais Acrobat-Reader-DC et Foxit-Reader m'en paraissent
incapables.
Merci d'avance pour vos propositions n'impliquant pas l'usage de la ligne de commande ou l'installation d'un logiciel payant.

Doit bien y avoir une option dans Imagemagick (libre et gratuit) pour faire ça... Sauf que c'est de la ligne de commande.
--
Serge http://cahierdesergio.free.fr/
Soutenez le libre: http://www.framasoft.org
Geo Cherchetout
Le #26540337
Le 17/03/2020 10:55, *DuboisP* a écrit :
sous Windows, .net framework est généralement installé
beaucoup de choses ne fonctionnent pas sans lui

Merci pour cette utile information. En effet, une fois PDFXplorer installé,
Windows m'a spontanément proposé d'installer .NET Framework, ce que j'ai
accepté. J'ai même ensuite désinstallé et réinstallé PDFXplorer pour être
sûr d'avoir tout fait dans le bon ordre. C'était certainement superflu car
le comportement du programme n'en a pas été changé. Il m'ouvre bien un pdf
et en affiche la structure arborescente mais pas le code des objets images,
à l'exception des vignettes. C'est sans doute moi qui n'ai pas encore
compris quelque chose. Si j'y parviens, je ne manquerai pas de revenir le
signaler.
Geo Cherchetout
Le #26540341
Le 17/03/2020 13:14, *Sergio* a écrit :
Doit bien y avoir une option dans Imagemagick (libre et gratuit) pour
faire ça... Sauf que c'est de la ligne de commande.

Merci pour l'idée mais j'ai un gros doute parce que Imagemagick a une forte
tendance à rastériser les images qu'on lui donne en pâture avant d'appliquer
le traitement demandé, puis de les re-compresser, même si le dit traitement
ne fait rien du tout.
Tant qu'à utiliser la ligne de commande, je dois dire que la commande
pdfimages (du paquet poppler) me donne toute satisfaction sous Linux mais la
plupart de mes correspondants sont sous Windows et boudent la ligne de
commande...
Geo Cherchetout
Le #26540340
Le 17/03/2020 12:08, *Marc M.* a écrit :
Libreoffice peut ouvrir des pdf, il doit y avoir moyen de faire un
copier coller de l'image.

Je viens de faire l'essai sous linux. Libreoffice Draw me donne bien le
choix de l'image à copier ou enregistrer mais me demande ensuite à choisir
le niveau de qualité voulu, ce qui signifie qu'il va appliquer sa propre
compression jpeg à partir de l'image rastérisée. (Ce que j'ai vérifié.)
DV
Le #26540344
Geo Cherchetout a écrit ceci :
Je viens de faire l'essai sous linux. Libreoffice Draw me donne bien le
choix de l'image à copier ou enregistrer mais me demande ensuite à choisir
le niveau de qualité voulu, ce qui signifie qu'il va appliquer sa propre
compression jpeg à partir de l'image rastérisée. (Ce que j'ai vérifié.)

Si tu veux éviter les pertes, tu peux choisir le format TIFF lors de
l'enregistrement.
--
Denis
Sergio
Le #26540349
Le 17/03/2020 à 15:33, Geo Cherchetout a écrit :
Le 17/03/2020 13:14, *Sergio* a écrit :
Doit bien y avoir une option dans Imagemagick (libre et gratuit) pour
faire ça... Sauf que c'est de la ligne de commande.

Merci pour l'idée mais j'ai un gros doute parce que Imagemagick a une forte tendance à rastériser les images qu'on lui donne en pâture avant d'appliquer le traitement demandé, puis de les
re-compresser, même si le dit traitement ne fait rien du tout.
Tant qu'à utiliser la ligne de commande, je dois dire que la commande pdfimages (du paquet poppler) me donne toute satisfaction sous Linux mais la plupart de mes correspondants sont sous Windows et
boudent la ligne de commande...

Voir : https://www.commentcamarche.net/faq/2207-extraire-les-images-d-un-pdf
--
Serge http://cahierdesergio.free.fr/
Soutenez le libre: http://www.framasoft.org
Publicité
Poster une réponse
Anonyme