Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

[PDF et sélection]

7 réponses
Avatar
philippe
Bonsoir,

Quand je rentre dans un pdf (téléchargé sur le net, ou en impression pdf
depuis la boîte de dialogue d'impression par exemple) avec Acrobat pro,
je peux avec l'outil sélection... sélectionner des lignes de texte. le
curseur est alors en forme de barre verticale. Ca marche bien entendu
aussi avec le Reader.
Mais pourquoi je n'y parviens pas avec un document scanné au format pdf
??? Dans ce cas, le curseur est une croix et je ne peux que sélectionner
un carré, un bloc, mais pas une ligne...et bien sûr ce carré ,
copié-collé dans un traitement de texte...c'est comme une image, je ne
peux pas le modifier.
Ya t-il PDF et PDF, est-le fait de scanner qui me donne des pdf ou la
sélection est impossible ??? Comprends pas...
Philippe.

7 réponses

Avatar
patrick.1200RTcazaux
Philippe wrote:

c'est comme une image, je ne
peux pas le modifier.



Bien entendu ! Le pdf ne fait pas référence à la nature du contenu.
C'est une sorte d'emballage, capable de contenir aussi bien des images
que du texte. Lorsque tu scannes une page de texte, ça devient une image
composée de pixels. Que tu l'enregistres en pdf ne change rien à sa
nature, et tu ne pourras jamais réutiliser le texte, car il n'y a pas de
texte, seulement des pixels organisés de telle façon que toi, humain, tu
arrives à y lire quelque chose. Mais l'ordinateur n'y voit que des
pixels, rien d'autre.

--
Tardigradus
Avatar
francois.jacquemin
Tardigradus wrote:

Bien entendu ! Le pdf ne fait pas référence à la nature du contenu.
C'est une sorte d'emballage, capable de contenir aussi bien des images
que du texte. Lorsque tu scannes une page de texte, ça devient une image
composée de pixels. Que tu l'enregistres en pdf ne change rien à sa
nature, et tu ne pourras jamais réutiliser le texte, car il n'y a pas de
texte, seulement des pixels organisés de telle façon que toi, humain, tu
arrives à y lire quelque chose. Mais l'ordinateur n'y voit que des
pixels, rien d'autre.



Sauf, évidemment, si ensuite intervient une autre étape : celle du
logciciel d'OCR, qui transforme en texte l'image obtenue et fait
d'ailleurs dégonfler sa taille, se faisant.
--
F. J.
Avatar
patrick.1200RTcazaux
François Jacquemin wrote:

Sauf, évidemment, si ensuite intervient une autre étape : celle du
logciciel d'OCR, qui transforme en texte l'image obtenue et fait
d'ailleurs dégonfler sa taille, se faisant.



Certes, mais ça n'apparaissait pas dans le message initial, aussi
l'ai-je laissé de côté.

--
Tardigradus
Avatar
philippe
Tardigradus wrote:

Philippe wrote:

> c'est comme une image, je ne
> peux pas le modifier.

Bien entendu ! Le pdf ne fait pas référence à la nature du contenu.
C'est une sorte d'emballage, capable de contenir aussi bien des images
que du texte. Lorsque tu scannes une page de texte, ça devient une image
composée de pixels. Que tu l'enregistres en pdf ne change rien à sa
nature, et tu ne pourras jamais réutiliser le texte, car il n'y a pas de
texte, seulement des pixels organisés de telle façon que toi, humain, tu
arrives à y lire quelque chose. Mais l'ordinateur n'y voit que des
pixels, rien d'autre.



OK, bien compris. Mais je ne comprends pas pourquoi, par exemple, une
impression d'une page web via le Mac, en choisissant l'impression PDF
qu'offre le système, débouche sur un pdf sur lerquel je peux
parfaitement entrer, en sélectionnant des lignes de texte. Il y aurait
donc PDF et PDF... ?
Avatar
Erwan David
(Philippe ) écrivait :

Tardigradus wrote:

Philippe wrote:

> c'est comme une image, je ne
> peux pas le modifier.

Bien entendu ! Le pdf ne fait pas référence à la nature du contenu.
C'est une sorte d'emballage, capable de contenir aussi bien des images
que du texte. Lorsque tu scannes une page de texte, ça devient une image
composée de pixels. Que tu l'enregistres en pdf ne change rien à sa
nature, et tu ne pourras jamais réutiliser le texte, car il n'y a pas de
texte, seulement des pixels organisés de telle façon que toi, humain, tu
arrives à y lire quelque chose. Mais l'ordinateur n'y voit que des
pixels, rien d'autre.



OK, bien compris. Mais je ne comprends pas pourquoi, par exemple, une
impression d'une page web via le Mac, en choisissant l'impression PDF
qu'offre le système, débouche sur un pdf sur lerquel je peux
parfaitement entrer, en sélectionnant des lignes de texte. Il y aurait
donc PDF et PDF... ?



Oui. Quand tu imprimes une page web, ton browser sait que c'est du
texte, dans le pdf est donc stocker du texte (c'ets à dire des codes
indiquant d'une part la fonte utilisée et d'autres part les
caractères). Tu peux donc sélectionner du texte puisque dans le pdf
c'ets une suite de caractères.

Quand tu scannes, le système ne voit qu'un ensemble de points. Dans le
pdf tu auras donc aussi un ensemble de points, et tu ne peux pas
sélectionner un ensemble de points pour en faire du texte.

--
Le travail n'est pas une bonne chose. Si ça l'était,
les riches l'auraient accaparé
Avatar
pdorange
Philippe wrote:

> Bien entendu ! Le pdf ne fait pas référence à la nature du contenu.
> C'est une sorte d'emballage, capable de contenir aussi bien des images
> que du texte. Lorsque tu scannes une page de texte, ça devient une image
> composée de pixels. Que tu l'enregistres en pdf ne change rien à sa
> nature, et tu ne pourras jamais réutiliser le texte, car il n'y a pas de
> texte, seulement des pixels organisés de telle façon que toi, humain, tu
> arrives à y lire quelque chose. Mais l'ordinateur n'y voit que des
> pixels, rien d'autre.

OK, bien compris. Mais je ne comprends pas pourquoi, par exemple, une
impression d'une page web via le Mac, en choisissant l'impression PDF
qu'offre le système, débouche sur un pdf sur lerquel je peux
parfaitement entrer, en sélectionnant des lignes de texte. Il y aurait
donc PDF et PDF... ?



Un PDF peut contenir entre autre :
* du texte
* des images
* des dessins vectoriels (traits, cercle...)

Pour un affichage à l'écran d'un texte si la source est du texte et bien
ça reste du texte dans le PDF (donc sélectionnable), si par contre la
source est une image (scan), cela reste une image : donc non
sélectionnable sous forme de texte.

--
Pierre-Alain Dorange

Ce message est sous licence Creative Commons "by-nc-sa-2.0"
<http://creativecommons.org/licenses/by-nc-sa/2.0/fr/>
Avatar
philippe
Pierre-Alain Dorange wrote:

Philippe wrote:

> > Bien entendu ! Le pdf ne fait pas référence à la nature du contenu.
> > C'est une sorte d'emballage, capable de contenir aussi bien des images
> > que du texte. Lorsque tu scannes une page de texte, ça devient une image
> > composée de pixels. Que tu l'enregistres en pdf ne change rien à sa
> > nature, et tu ne pourras jamais réutiliser le texte, car il n'y a pas de
> > texte, seulement des pixels organisés de telle façon que toi, humain, tu
> > arrives à y lire quelque chose. Mais l'ordinateur n'y voit que des
> > pixels, rien d'autre.
>
> OK, bien compris. Mais je ne comprends pas pourquoi, par exemple, une
> impression d'une page web via le Mac, en choisissant l'impression PDF
> qu'offre le système, débouche sur un pdf sur lerquel je peux
> parfaitement entrer, en sélectionnant des lignes de texte. Il y aurait
> donc PDF et PDF... ?

Un PDF peut contenir entre autre :
* du texte
* des images
* des dessins vectoriels (traits, cercle...)

Pour un affichage à l'écran d'un texte si la source est du texte et bien
ça reste du texte dans le PDF (donc sélectionnable), si par contre la
source est une image (scan), cela reste une image : donc non
sélectionnable sous forme de texte.



Erwan, Pierre-Alain, merci pour vos explications, jai tout compris ;-)
Merci à tous,
Philippe.