[PDF et sélection]

Le
philippe
Bonsoir,

Quand je rentre dans un pdf (téléchargé sur le net, ou en impression pdf
depuis la boîte de dialogue d'impression par exemple) avec Acrobat pro,
je peux avec l'outil sélection sélectionner des lignes de texte. le
curseur est alors en forme de barre verticale. Ca marche bien entendu
aussi avec le Reader.
Mais pourquoi je n'y parviens pas avec un document scanné au format pdf
??? Dans ce cas, le curseur est une croix et je ne peux que sélectionner
un carré, un bloc, mais pas une ligneet bien sûr ce carré ,
copié-collé dans un traitement de textec'est comme une image, je ne
peux pas le modifier.
Ya t-il PDF et PDF, est-le fait de scanner qui me donne des pdf ou la
sélection est impossible ??? Comprends pas
Philippe.
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
patrick.1200RTcazaux
Le #16452421
Philippe
c'est comme une image, je ne
peux pas le modifier.



Bien entendu ! Le pdf ne fait pas référence à la nature du contenu.
C'est une sorte d'emballage, capable de contenir aussi bien des images
que du texte. Lorsque tu scannes une page de texte, ça devient une image
composée de pixels. Que tu l'enregistres en pdf ne change rien à sa
nature, et tu ne pourras jamais réutiliser le texte, car il n'y a pas de
texte, seulement des pixels organisés de telle façon que toi, humain, tu
arrives à y lire quelque chose. Mais l'ordinateur n'y voit que des
pixels, rien d'autre.

--
Tardigradus
francois.jacquemin
Le #16453521
Tardigradus
Bien entendu ! Le pdf ne fait pas référence à la nature du contenu.
C'est une sorte d'emballage, capable de contenir aussi bien des images
que du texte. Lorsque tu scannes une page de texte, ça devient une image
composée de pixels. Que tu l'enregistres en pdf ne change rien à sa
nature, et tu ne pourras jamais réutiliser le texte, car il n'y a pas de
texte, seulement des pixels organisés de telle façon que toi, humain, tu
arrives à y lire quelque chose. Mais l'ordinateur n'y voit que des
pixels, rien d'autre.



Sauf, évidemment, si ensuite intervient une autre étape : celle du
logciciel d'OCR, qui transforme en texte l'image obtenue et fait
d'ailleurs dégonfler sa taille, se faisant.
--
F. J.
patrick.1200RTcazaux
Le #16453541
François Jacquemin
Sauf, évidemment, si ensuite intervient une autre étape : celle du
logciciel d'OCR, qui transforme en texte l'image obtenue et fait
d'ailleurs dégonfler sa taille, se faisant.



Certes, mais ça n'apparaissait pas dans le message initial, aussi
l'ai-je laissé de côté.

--
Tardigradus
philippe
Le #16453931
Tardigradus
Philippe
> c'est comme une image, je ne
> peux pas le modifier.

Bien entendu ! Le pdf ne fait pas référence à la nature du contenu.
C'est une sorte d'emballage, capable de contenir aussi bien des images
que du texte. Lorsque tu scannes une page de texte, ça devient une image
composée de pixels. Que tu l'enregistres en pdf ne change rien à sa
nature, et tu ne pourras jamais réutiliser le texte, car il n'y a pas de
texte, seulement des pixels organisés de telle façon que toi, humain, tu
arrives à y lire quelque chose. Mais l'ordinateur n'y voit que des
pixels, rien d'autre.



OK, bien compris. Mais je ne comprends pas pourquoi, par exemple, une
impression d'une page web via le Mac, en choisissant l'impression PDF
qu'offre le système, débouche sur un pdf sur lerquel je peux
parfaitement entrer, en sélectionnant des lignes de texte. Il y aurait
donc PDF et PDF... ?
Erwan David
Le #16454021
(Philippe ) écrivait :

Tardigradus
Philippe
> c'est comme une image, je ne
> peux pas le modifier.

Bien entendu ! Le pdf ne fait pas référence à la nature du contenu.
C'est une sorte d'emballage, capable de contenir aussi bien des images
que du texte. Lorsque tu scannes une page de texte, ça devient une image
composée de pixels. Que tu l'enregistres en pdf ne change rien à sa
nature, et tu ne pourras jamais réutiliser le texte, car il n'y a pas de
texte, seulement des pixels organisés de telle façon que toi, humain, tu
arrives à y lire quelque chose. Mais l'ordinateur n'y voit que des
pixels, rien d'autre.



OK, bien compris. Mais je ne comprends pas pourquoi, par exemple, une
impression d'une page web via le Mac, en choisissant l'impression PDF
qu'offre le système, débouche sur un pdf sur lerquel je peux
parfaitement entrer, en sélectionnant des lignes de texte. Il y aurait
donc PDF et PDF... ?



Oui. Quand tu imprimes une page web, ton browser sait que c'est du
texte, dans le pdf est donc stocker du texte (c'ets à dire des codes
indiquant d'une part la fonte utilisée et d'autres part les
caractères). Tu peux donc sélectionner du texte puisque dans le pdf
c'ets une suite de caractères.

Quand tu scannes, le système ne voit qu'un ensemble de points. Dans le
pdf tu auras donc aussi un ensemble de points, et tu ne peux pas
sélectionner un ensemble de points pour en faire du texte.

--
Le travail n'est pas une bonne chose. Si ça l'était,
les riches l'auraient accaparé
pdorange
Le #16454011
Philippe
> Bien entendu ! Le pdf ne fait pas référence à la nature du contenu.
> C'est une sorte d'emballage, capable de contenir aussi bien des images
> que du texte. Lorsque tu scannes une page de texte, ça devient une image
> composée de pixels. Que tu l'enregistres en pdf ne change rien à sa
> nature, et tu ne pourras jamais réutiliser le texte, car il n'y a pas de
> texte, seulement des pixels organisés de telle façon que toi, humain, tu
> arrives à y lire quelque chose. Mais l'ordinateur n'y voit que des
> pixels, rien d'autre.

OK, bien compris. Mais je ne comprends pas pourquoi, par exemple, une
impression d'une page web via le Mac, en choisissant l'impression PDF
qu'offre le système, débouche sur un pdf sur lerquel je peux
parfaitement entrer, en sélectionnant des lignes de texte. Il y aurait
donc PDF et PDF... ?



Un PDF peut contenir entre autre :
* du texte
* des images
* des dessins vectoriels (traits, cercle...)

Pour un affichage à l'écran d'un texte si la source est du texte et bien
ça reste du texte dans le PDF (donc sélectionnable), si par contre la
source est une image (scan), cela reste une image : donc non
sélectionnable sous forme de texte.

--
Pierre-Alain Dorange

Ce message est sous licence Creative Commons "by-nc-sa-2.0"
philippe
Le #16454781
Pierre-Alain Dorange
Philippe
> > Bien entendu ! Le pdf ne fait pas référence à la nature du contenu.
> > C'est une sorte d'emballage, capable de contenir aussi bien des images
> > que du texte. Lorsque tu scannes une page de texte, ça devient une image
> > composée de pixels. Que tu l'enregistres en pdf ne change rien à sa
> > nature, et tu ne pourras jamais réutiliser le texte, car il n'y a pas de
> > texte, seulement des pixels organisés de telle façon que toi, humain, tu
> > arrives à y lire quelque chose. Mais l'ordinateur n'y voit que des
> > pixels, rien d'autre.
>
> OK, bien compris. Mais je ne comprends pas pourquoi, par exemple, une
> impression d'une page web via le Mac, en choisissant l'impression PDF
> qu'offre le système, débouche sur un pdf sur lerquel je peux
> parfaitement entrer, en sélectionnant des lignes de texte. Il y aurait
> donc PDF et PDF... ?

Un PDF peut contenir entre autre :
* du texte
* des images
* des dessins vectoriels (traits, cercle...)

Pour un affichage à l'écran d'un texte si la source est du texte et bien
ça reste du texte dans le PDF (donc sélectionnable), si par contre la
source est une image (scan), cela reste une image : donc non
sélectionnable sous forme de texte.



Erwan, Pierre-Alain, merci pour vos explications, jai tout compris ;-)
Merci à tous,
Philippe.
Publicité
Poster une réponse
Anonyme