J'ai plusieurs PDF qui proviennent à l'origine d'un scan de document à
partir d'une multifonction. Ces documents ne sont donc pas en pdf avec le
texte considéré comme du texte mais avec du texte considéré en simples
images.
Auriez vous une idée de la façon dont je pourrais procéder pour transformer
ces PDF en PDF moins lourds ? Ou dans un autre format plus compressé ?
J'ai plusieurs PDF qui proviennent à l'origine d'un scan de document à
partir d'une multifonction. Ces documents ne sont donc pas en pdf avec le
texte considéré comme du texte mais avec du texte considéré en simples
images.
Auriez vous une idée de la façon dont je pourrais procéder pour transformer
ces PDF en PDF moins lourds ? Ou dans un autre format plus compressé ?
J'ai plusieurs PDF qui proviennent à l'origine d'un scan de document à
partir d'une multifonction. Ces documents ne sont donc pas en pdf avec le
texte considéré comme du texte mais avec du texte considéré en simples
images.
Auriez vous une idée de la façon dont je pourrais procéder pour transformer
ces PDF en PDF moins lourds ? Ou dans un autre format plus compressé ?
> Je viens de copier un fichier PDF comportant du texte et des images, de
104 kO en PDF, il devient 91 kO en JPG, mais la qualité est altérée.
Le JPG est très compressé, descendre plus bas encore donnerait de mauvais
résultats.
A part passer tes fichiers dans un logiciel de reconnaissance de
caractères, je ne vois pas.
> Je viens de copier un fichier PDF comportant du texte et des images, de
104 kO en PDF, il devient 91 kO en JPG, mais la qualité est altérée.
Le JPG est très compressé, descendre plus bas encore donnerait de mauvais
résultats.
A part passer tes fichiers dans un logiciel de reconnaissance de
caractères, je ne vois pas.
> Je viens de copier un fichier PDF comportant du texte et des images, de
104 kO en PDF, il devient 91 kO en JPG, mais la qualité est altérée.
Le JPG est très compressé, descendre plus bas encore donnerait de mauvais
résultats.
A part passer tes fichiers dans un logiciel de reconnaissance de
caractères, je ne vois pas.
Je viens de copier un fichier PDF comportant du texte et des images, de
104 kO en PDF, il devient 91 kO en JPG, mais la qualité est altérée.
Le JPG est très compressé, descendre plus bas encore donnerait de mauvais
résultats.
J'ai, par exemple, un PDF de 55 pages qui fait... 58Mo. Le PDF est un
format compressé mais... est-il possible de modifier certains réglages
quitte à perdre du détails pour gagner en place. Le PDF en question est
déja en noir & blanc.A part passer tes fichiers dans un logiciel de reconnaissance de
caractères, je ne vois pas.
Et je n'ai qu'une confiance limité en l'OCR... Il y'a toujours un
pourcentage d'erreur et il faut retravailler la mise en page. Mais l'idée
est intéressante... l'on peut passer les PDF directement à l'OCR ?
Je viens de copier un fichier PDF comportant du texte et des images, de
104 kO en PDF, il devient 91 kO en JPG, mais la qualité est altérée.
Le JPG est très compressé, descendre plus bas encore donnerait de mauvais
résultats.
J'ai, par exemple, un PDF de 55 pages qui fait... 58Mo. Le PDF est un
format compressé mais... est-il possible de modifier certains réglages
quitte à perdre du détails pour gagner en place. Le PDF en question est
déja en noir & blanc.
A part passer tes fichiers dans un logiciel de reconnaissance de
caractères, je ne vois pas.
Et je n'ai qu'une confiance limité en l'OCR... Il y'a toujours un
pourcentage d'erreur et il faut retravailler la mise en page. Mais l'idée
est intéressante... l'on peut passer les PDF directement à l'OCR ?
Je viens de copier un fichier PDF comportant du texte et des images, de
104 kO en PDF, il devient 91 kO en JPG, mais la qualité est altérée.
Le JPG est très compressé, descendre plus bas encore donnerait de mauvais
résultats.
J'ai, par exemple, un PDF de 55 pages qui fait... 58Mo. Le PDF est un
format compressé mais... est-il possible de modifier certains réglages
quitte à perdre du détails pour gagner en place. Le PDF en question est
déja en noir & blanc.A part passer tes fichiers dans un logiciel de reconnaissance de
caractères, je ne vois pas.
Et je n'ai qu'une confiance limité en l'OCR... Il y'a toujours un
pourcentage d'erreur et il faut retravailler la mise en page. Mais l'idée
est intéressante... l'on peut passer les PDF directement à l'OCR ?
"HD" a écrit dans le message de
J'ai, par exemple, un PDF de 55 pages qui fait... 58Mo. Le PDF est un
format compressé mais... est-il possible de modifier certains réglages
quitte à perdre du détails pour gagner en place. Le PDF en question
est déja en noir & blanc.
A part passer tes fichiers dans un logiciel de reconnaissance de
caractères, je ne vois pas.
Et je n'ai qu'une confiance limité en l'OCR... Il y'a toujours un
pourcentage d'erreur et il faut retravailler la mise en page. Mais
l'idée est intéressante... l'on peut passer les PDF directement à l'OCR ?
Oui, bien sûr !
C'est le cas avec "OmniPage", que je considère comme étant le meilleur
des outils d'OCR.
Le pourcentage d'erreurs est très faible, et la correction manuelle est
facile à effectuer
Il sait reconnaitre le texte y compris dans des documents multi
colonnes, et le fichier PDF généré au final dans ce cas est forcément
très réduit.
Son seul problème est son prix (la version 16 PRO coûte officiellement
479 €, la version 16 non pro coûte 99€)
"HD" <hd@anti.spam.fr> a écrit dans le message de
J'ai, par exemple, un PDF de 55 pages qui fait... 58Mo. Le PDF est un
format compressé mais... est-il possible de modifier certains réglages
quitte à perdre du détails pour gagner en place. Le PDF en question
est déja en noir & blanc.
A part passer tes fichiers dans un logiciel de reconnaissance de
caractères, je ne vois pas.
Et je n'ai qu'une confiance limité en l'OCR... Il y'a toujours un
pourcentage d'erreur et il faut retravailler la mise en page. Mais
l'idée est intéressante... l'on peut passer les PDF directement à l'OCR ?
Oui, bien sûr !
C'est le cas avec "OmniPage", que je considère comme étant le meilleur
des outils d'OCR.
Le pourcentage d'erreurs est très faible, et la correction manuelle est
facile à effectuer
Il sait reconnaitre le texte y compris dans des documents multi
colonnes, et le fichier PDF généré au final dans ce cas est forcément
très réduit.
Son seul problème est son prix (la version 16 PRO coûte officiellement
479 €, la version 16 non pro coûte 99€)
"HD" a écrit dans le message de
J'ai, par exemple, un PDF de 55 pages qui fait... 58Mo. Le PDF est un
format compressé mais... est-il possible de modifier certains réglages
quitte à perdre du détails pour gagner en place. Le PDF en question
est déja en noir & blanc.
A part passer tes fichiers dans un logiciel de reconnaissance de
caractères, je ne vois pas.
Et je n'ai qu'une confiance limité en l'OCR... Il y'a toujours un
pourcentage d'erreur et il faut retravailler la mise en page. Mais
l'idée est intéressante... l'on peut passer les PDF directement à l'OCR ?
Oui, bien sûr !
C'est le cas avec "OmniPage", que je considère comme étant le meilleur
des outils d'OCR.
Le pourcentage d'erreurs est très faible, et la correction manuelle est
facile à effectuer
Il sait reconnaitre le texte y compris dans des documents multi
colonnes, et le fichier PDF généré au final dans ce cas est forcément
très réduit.
Son seul problème est son prix (la version 16 PRO coûte officiellement
479 €, la version 16 non pro coûte 99€)
J'ai, par exemple, un PDF de 55 pages qui fait... 58Mo. Le PDF est un
format compressé mais... est-il possible de modifier certains réglages
quitte à perdre du détails pour gagner en place. Le PDF en question est
déja en noir & blanc.
Je ne le crois pas, c'est un fichier vectoriel qui donne des résultats
homothétiques quel que soit l'agrandissement.
J'ai, par exemple, un PDF de 55 pages qui fait... 58Mo. Le PDF est un
format compressé mais... est-il possible de modifier certains réglages
quitte à perdre du détails pour gagner en place. Le PDF en question est
déja en noir & blanc.
Je ne le crois pas, c'est un fichier vectoriel qui donne des résultats
homothétiques quel que soit l'agrandissement.
J'ai, par exemple, un PDF de 55 pages qui fait... 58Mo. Le PDF est un
format compressé mais... est-il possible de modifier certains réglages
quitte à perdre du détails pour gagner en place. Le PDF en question est
déja en noir & blanc.
Je ne le crois pas, c'est un fichier vectoriel qui donne des résultats
homothétiques quel que soit l'agrandissement.
Le PDF est déjà très compressé puisque c'est un format vectoriel et non
bitmap.
Le PDF est déjà très compressé puisque c'est un format vectoriel et non
bitmap.
Le PDF est déjà très compressé puisque c'est un format vectoriel et non
bitmap.
On Fri, 31 Oct 2008 10:30:03 +0100, Ghost Rider <"Ghost
Rider"@compuserve.com> wrote:Le PDF est déjà très compressé puisque c'est un format vectoriel et non
bitmap.
Pas du tout.
Je te recommande la lecture du PDF REFERENCE MANUAL
http://www.adobe.com/devnet/pdf/pdf_reference.html
La bible pour tout ceux qui programment des aplications générant des
résultats en PDF
Un fichier PDF est un langage de description de page qui contient les
fontes, la position, taille, couleur, objets et images.
Seuls les objets (ligne, cadre, et quelques autres sont vectoriels)
Une image dans un PDF reste une image (JPG, PNG etc)
Elle est affichée simplement à l'endroit du document.
Elle n'a pas nécessairement la taille qui est réprésentée sur la page.
(Exactement comme une image dans un fichier word peut être beaucoup
plus grande que la taille affichée)
Pour réduire sensiblement un PDF (si le "zippage" ne donne rien) il
faut donc le "démonter" s'il n'est pas protégé et changer la taille
des images (augmenter la compression (et perdre en qualité) ou
diminuer la taille des images)
Il est courant de voir des gens scanner à 600 dpi ou plus un document
destiné à aller dans un PDF alors que:
- 72 dpi suffisent à lire sur l'écran
- 150 dpi suffisent tà lire des caractères d'1 mm sur une page A4
On Fri, 31 Oct 2008 10:30:03 +0100, Ghost Rider <"Ghost
Rider"@compuserve.com> wrote:
Le PDF est déjà très compressé puisque c'est un format vectoriel et non
bitmap.
Pas du tout.
Je te recommande la lecture du PDF REFERENCE MANUAL
http://www.adobe.com/devnet/pdf/pdf_reference.html
La bible pour tout ceux qui programment des aplications générant des
résultats en PDF
Un fichier PDF est un langage de description de page qui contient les
fontes, la position, taille, couleur, objets et images.
Seuls les objets (ligne, cadre, et quelques autres sont vectoriels)
Une image dans un PDF reste une image (JPG, PNG etc)
Elle est affichée simplement à l'endroit du document.
Elle n'a pas nécessairement la taille qui est réprésentée sur la page.
(Exactement comme une image dans un fichier word peut être beaucoup
plus grande que la taille affichée)
Pour réduire sensiblement un PDF (si le "zippage" ne donne rien) il
faut donc le "démonter" s'il n'est pas protégé et changer la taille
des images (augmenter la compression (et perdre en qualité) ou
diminuer la taille des images)
Il est courant de voir des gens scanner à 600 dpi ou plus un document
destiné à aller dans un PDF alors que:
- 72 dpi suffisent à lire sur l'écran
- 150 dpi suffisent tà lire des caractères d'1 mm sur une page A4
On Fri, 31 Oct 2008 10:30:03 +0100, Ghost Rider <"Ghost
Rider"@compuserve.com> wrote:Le PDF est déjà très compressé puisque c'est un format vectoriel et non
bitmap.
Pas du tout.
Je te recommande la lecture du PDF REFERENCE MANUAL
http://www.adobe.com/devnet/pdf/pdf_reference.html
La bible pour tout ceux qui programment des aplications générant des
résultats en PDF
Un fichier PDF est un langage de description de page qui contient les
fontes, la position, taille, couleur, objets et images.
Seuls les objets (ligne, cadre, et quelques autres sont vectoriels)
Une image dans un PDF reste une image (JPG, PNG etc)
Elle est affichée simplement à l'endroit du document.
Elle n'a pas nécessairement la taille qui est réprésentée sur la page.
(Exactement comme une image dans un fichier word peut être beaucoup
plus grande que la taille affichée)
Pour réduire sensiblement un PDF (si le "zippage" ne donne rien) il
faut donc le "démonter" s'il n'est pas protégé et changer la taille
des images (augmenter la compression (et perdre en qualité) ou
diminuer la taille des images)
Il est courant de voir des gens scanner à 600 dpi ou plus un document
destiné à aller dans un PDF alors que:
- 72 dpi suffisent à lire sur l'écran
- 150 dpi suffisent tà lire des caractères d'1 mm sur une page A4
Bonjour ou bonsoir à Ghost Rider qui dans son message précédent a écrit :
Je ne le crois pas, c'est un fichier vectoriel qui donne des résultats
homothétiques quel que soit l'agrandissement.
Dans le cas présent, c'est pas un PDF créé avec du texte encrypté, mais
tous simplement une numérisation enregistrée au format PDF. Donc toute
diminution de taille de fichier risque d'être destructive !
Pour HD, quand tu dis le PDF est déjà en noir et blanc, c'est pas plutôt
du niveau de gris (ou du noir encodé en RVB) vu la taille pour 55 pages?
Sinon pour réduire la taille de fichier PDF il faut posséder la version
complète d'Acrobat et ses outils internes ou des plugins du style "Quite
A Box of Tricks" que l'on peut tester ici :
http://www.quartet.fr/solutions_pdf/solutions_pdf.html
Bonjour ou bonsoir à Ghost Rider qui dans son message précédent a écrit :
Je ne le crois pas, c'est un fichier vectoriel qui donne des résultats
homothétiques quel que soit l'agrandissement.
Dans le cas présent, c'est pas un PDF créé avec du texte encrypté, mais
tous simplement une numérisation enregistrée au format PDF. Donc toute
diminution de taille de fichier risque d'être destructive !
Pour HD, quand tu dis le PDF est déjà en noir et blanc, c'est pas plutôt
du niveau de gris (ou du noir encodé en RVB) vu la taille pour 55 pages?
Sinon pour réduire la taille de fichier PDF il faut posséder la version
complète d'Acrobat et ses outils internes ou des plugins du style "Quite
A Box of Tricks" que l'on peut tester ici :
http://www.quartet.fr/solutions_pdf/solutions_pdf.html
Bonjour ou bonsoir à Ghost Rider qui dans son message précédent a écrit :
Je ne le crois pas, c'est un fichier vectoriel qui donne des résultats
homothétiques quel que soit l'agrandissement.
Dans le cas présent, c'est pas un PDF créé avec du texte encrypté, mais
tous simplement une numérisation enregistrée au format PDF. Donc toute
diminution de taille de fichier risque d'être destructive !
Pour HD, quand tu dis le PDF est déjà en noir et blanc, c'est pas plutôt
du niveau de gris (ou du noir encodé en RVB) vu la taille pour 55 pages?
Sinon pour réduire la taille de fichier PDF il faut posséder la version
complète d'Acrobat et ses outils internes ou des plugins du style "Quite
A Box of Tricks" que l'on peut tester ici :
http://www.quartet.fr/solutions_pdf/solutions_pdf.html
On Fri, 31 Oct 2008 10:30:03 +0100, Ghost Rider <"Ghost
Rider"@compuserve.com> wrote:Le PDF est déjà très compressé puisque c'est un format vectoriel et non
bitmap.
Pas du tout.
Je te recommande la lecture du PDF REFERENCE MANUAL
http://www.adobe.com/devnet/pdf/pdf_reference.html
La bible pour tout ceux qui programment des aplications générant des
résultats en PDF
Un fichier PDF est un langage de description de page qui contient les
fontes, la position, taille, couleur, objets et images.
Seuls les objets (ligne, cadre, et quelques autres sont vectoriels)
Une image dans un PDF reste une image (JPG, PNG etc)
Elle est affichée simplement à l'endroit du document.
Elle n'a pas nécessairement la taille qui est réprésentée sur la page.
(Exactement comme une image dans un fichier word peut être beaucoup
plus grande que la taille affichée)
Pour réduire sensiblement un PDF (si le "zippage" ne donne rien)
il faut donc le "démonter" s'il n'est pas protégé et changer la taille
des images (augmenter la compression (et perdre en qualité) ou
diminuer la taille des images)
On Fri, 31 Oct 2008 10:30:03 +0100, Ghost Rider <"Ghost
Rider"@compuserve.com> wrote:
Le PDF est déjà très compressé puisque c'est un format vectoriel et non
bitmap.
Pas du tout.
Je te recommande la lecture du PDF REFERENCE MANUAL
http://www.adobe.com/devnet/pdf/pdf_reference.html
La bible pour tout ceux qui programment des aplications générant des
résultats en PDF
Un fichier PDF est un langage de description de page qui contient les
fontes, la position, taille, couleur, objets et images.
Seuls les objets (ligne, cadre, et quelques autres sont vectoriels)
Une image dans un PDF reste une image (JPG, PNG etc)
Elle est affichée simplement à l'endroit du document.
Elle n'a pas nécessairement la taille qui est réprésentée sur la page.
(Exactement comme une image dans un fichier word peut être beaucoup
plus grande que la taille affichée)
Pour réduire sensiblement un PDF (si le "zippage" ne donne rien)
il faut donc le "démonter" s'il n'est pas protégé et changer la taille
des images (augmenter la compression (et perdre en qualité) ou
diminuer la taille des images)
On Fri, 31 Oct 2008 10:30:03 +0100, Ghost Rider <"Ghost
Rider"@compuserve.com> wrote:Le PDF est déjà très compressé puisque c'est un format vectoriel et non
bitmap.
Pas du tout.
Je te recommande la lecture du PDF REFERENCE MANUAL
http://www.adobe.com/devnet/pdf/pdf_reference.html
La bible pour tout ceux qui programment des aplications générant des
résultats en PDF
Un fichier PDF est un langage de description de page qui contient les
fontes, la position, taille, couleur, objets et images.
Seuls les objets (ligne, cadre, et quelques autres sont vectoriels)
Une image dans un PDF reste une image (JPG, PNG etc)
Elle est affichée simplement à l'endroit du document.
Elle n'a pas nécessairement la taille qui est réprésentée sur la page.
(Exactement comme une image dans un fichier word peut être beaucoup
plus grande que la taille affichée)
Pour réduire sensiblement un PDF (si le "zippage" ne donne rien)
il faut donc le "démonter" s'il n'est pas protégé et changer la taille
des images (augmenter la compression (et perdre en qualité) ou
diminuer la taille des images)
> Dans le cas présent, c'est pas un PDF créé avec du texte encrypté, mais
tous simplement une numérisation enregistrée au format PDF.
Donc toute diminution de taille de fichier risque d'être destructive !
Pour HD, quand tu dis le PDF est déjà en noir et blanc, c'est pas plutôt
du niveau de gris (ou du noir encodé en RVB) vu la taille pour 55 pages?
> Dans le cas présent, c'est pas un PDF créé avec du texte encrypté, mais
tous simplement une numérisation enregistrée au format PDF.
Donc toute diminution de taille de fichier risque d'être destructive !
Pour HD, quand tu dis le PDF est déjà en noir et blanc, c'est pas plutôt
du niveau de gris (ou du noir encodé en RVB) vu la taille pour 55 pages?
> Dans le cas présent, c'est pas un PDF créé avec du texte encrypté, mais
tous simplement une numérisation enregistrée au format PDF.
Donc toute diminution de taille de fichier risque d'être destructive !
Pour HD, quand tu dis le PDF est déjà en noir et blanc, c'est pas plutôt
du niveau de gris (ou du noir encodé en RVB) vu la taille pour 55 pages?