[PDF et sélection]

7 réponses

philippe

31/07/2008 à 20:53

Bonsoir,

Quand je rentre dans un pdf (téléchargé sur le net, ou en impression pdf
depuis la boîte de dialogue d'impression par exemple) avec Acrobat pro,
je peux avec l'outil sélection... sélectionner des lignes de texte. le
curseur est alors en forme de barre verticale. Ca marche bien entendu
aussi avec le Reader.
Mais pourquoi je n'y parviens pas avec un document scanné au format pdf
??? Dans ce cas, le curseur est une croix et je ne peux que sélectionner
un carré, un bloc, mais pas une ligne...et bien sûr ce carré ,
copié-collé dans un traitement de texte...c'est comme une image, je ne
peux pas le modifier.
Ya t-il PDF et PDF, est-le fait de scanner qui me donne des pdf ou la
sélection est impossible ??? Comprends pas...
Philippe.

7 réponses

patrick.1200RTcazaux

31/07/2008 à 21:56

Philippe wrote:

c'est comme une image, je ne
peux pas le modifier.

Bien entendu ! Le pdf ne fait pas référence à la nature du contenu.
C'est une sorte d'emballage, capable de contenir aussi bien des images
que du texte. Lorsque tu scannes une page de texte, ça devient une image
composée de pixels. Que tu l'enregistres en pdf ne change rien à sa
nature, et tu ne pourras jamais réutiliser le texte, car il n'y a pas de
texte, seulement des pixels organisés de telle façon que toi, humain, tu
arrives à y lire quelque chose. Mais l'ordinateur n'y voit que des
pixels, rien d'autre.

--
Tardigradus

francois.jacquemin

01/08/2008 à 03:43

Tardigradus wrote:

Bien entendu ! Le pdf ne fait pas référence à la nature du contenu.
C'est une sorte d'emballage, capable de contenir aussi bien des images
que du texte. Lorsque tu scannes une page de texte, ça devient une image
composée de pixels. Que tu l'enregistres en pdf ne change rien à sa
nature, et tu ne pourras jamais réutiliser le texte, car il n'y a pas de
texte, seulement des pixels organisés de telle façon que toi, humain, tu
arrives à y lire quelque chose. Mais l'ordinateur n'y voit que des
pixels, rien d'autre.

Sauf, évidemment, si ensuite intervient une autre étape : celle du
logciciel d'OCR, qui transforme en texte l'image obtenue et fait
d'ailleurs dégonfler sa taille, se faisant.
--
F. J.

patrick.1200RTcazaux

01/08/2008 à 05:16

François Jacquemin wrote:

Sauf, évidemment, si ensuite intervient une autre étape : celle du
logciciel d'OCR, qui transforme en texte l'image obtenue et fait
d'ailleurs dégonfler sa taille, se faisant.

Certes, mais ça n'apparaissait pas dans le message initial, aussi
l'ai-je laissé de côté.

--
Tardigradus

philippe

01/08/2008 à 08:40

Tardigradus wrote:

Philippe wrote:

> c'est comme une image, je ne
> peux pas le modifier.

Bien entendu ! Le pdf ne fait pas référence à la nature du contenu.
C'est une sorte d'emballage, capable de contenir aussi bien des images
que du texte. Lorsque tu scannes une page de texte, ça devient une image
composée de pixels. Que tu l'enregistres en pdf ne change rien à sa
nature, et tu ne pourras jamais réutiliser le texte, car il n'y a pas de
texte, seulement des pixels organisés de telle façon que toi, humain, tu
arrives à y lire quelque chose. Mais l'ordinateur n'y voit que des
pixels, rien d'autre.

OK, bien compris. Mais je ne comprends pas pourquoi, par exemple, une
impression d'une page web via le Mac, en choisissant l'impression PDF
qu'offre le système, débouche sur un pdf sur lerquel je peux
parfaitement entrer, en sélectionnant des lignes de texte. Il y aurait
donc PDF et PDF... ?

Erwan David

01/08/2008 à 08:56

(Philippe ) écrivait :

Tardigradus wrote:

Philippe wrote:

> c'est comme une image, je ne
> peux pas le modifier.

Bien entendu ! Le pdf ne fait pas référence à la nature du contenu.
C'est une sorte d'emballage, capable de contenir aussi bien des images
que du texte. Lorsque tu scannes une page de texte, ça devient une image
composée de pixels. Que tu l'enregistres en pdf ne change rien à sa
nature, et tu ne pourras jamais réutiliser le texte, car il n'y a pas de
texte, seulement des pixels organisés de telle façon que toi, humain, tu
arrives à y lire quelque chose. Mais l'ordinateur n'y voit que des
pixels, rien d'autre.

OK, bien compris. Mais je ne comprends pas pourquoi, par exemple, une
impression d'une page web via le Mac, en choisissant l'impression PDF
qu'offre le système, débouche sur un pdf sur lerquel je peux
parfaitement entrer, en sélectionnant des lignes de texte. Il y aurait
donc PDF et PDF... ?

Oui. Quand tu imprimes une page web, ton browser sait que c'est du
texte, dans le pdf est donc stocker du texte (c'ets à dire des codes
indiquant d'une part la fonte utilisée et d'autres part les
caractères). Tu peux donc sélectionner du texte puisque dans le pdf
c'ets une suite de caractères.

Quand tu scannes, le système ne voit qu'un ensemble de points. Dans le
pdf tu auras donc aussi un ensemble de points, et tu ne peux pas
sélectionner un ensemble de points pour en faire du texte.

--
Le travail n'est pas une bonne chose. Si ça l'était,
les riches l'auraient accaparé

pdorange

01/08/2008 à 09:00

Philippe wrote:

> Bien entendu ! Le pdf ne fait pas référence à la nature du contenu.
> C'est une sorte d'emballage, capable de contenir aussi bien des images
> que du texte. Lorsque tu scannes une page de texte, ça devient une image
> composée de pixels. Que tu l'enregistres en pdf ne change rien à sa
> nature, et tu ne pourras jamais réutiliser le texte, car il n'y a pas de
> texte, seulement des pixels organisés de telle façon que toi, humain, tu
> arrives à y lire quelque chose. Mais l'ordinateur n'y voit que des
> pixels, rien d'autre.

OK, bien compris. Mais je ne comprends pas pourquoi, par exemple, une
impression d'une page web via le Mac, en choisissant l'impression PDF
qu'offre le système, débouche sur un pdf sur lerquel je peux
parfaitement entrer, en sélectionnant des lignes de texte. Il y aurait
donc PDF et PDF... ?

Un PDF peut contenir entre autre :
* du texte
* des images
* des dessins vectoriels (traits, cercle...)

Pour un affichage à l'écran d'un texte si la source est du texte et bien
ça reste du texte dans le PDF (donc sélectionnable), si par contre la
source est une image (scan), cela reste une image : donc non
sélectionnable sous forme de texte.

--
Pierre-Alain Dorange

Ce message est sous licence Creative Commons "by-nc-sa-2.0"
<http://creativecommons.org/licenses/by-nc-sa/2.0/fr/>

philippe

01/08/2008 à 10:42

Pierre-Alain Dorange wrote:

Philippe wrote:

> > Bien entendu ! Le pdf ne fait pas référence à la nature du contenu.
> > C'est une sorte d'emballage, capable de contenir aussi bien des images
> > que du texte. Lorsque tu scannes une page de texte, ça devient une image
> > composée de pixels. Que tu l'enregistres en pdf ne change rien à sa
> > nature, et tu ne pourras jamais réutiliser le texte, car il n'y a pas de
> > texte, seulement des pixels organisés de telle façon que toi, humain, tu
> > arrives à y lire quelque chose. Mais l'ordinateur n'y voit que des
> > pixels, rien d'autre.
>
> OK, bien compris. Mais je ne comprends pas pourquoi, par exemple, une
> impression d'une page web via le Mac, en choisissant l'impression PDF
> qu'offre le système, débouche sur un pdf sur lerquel je peux
> parfaitement entrer, en sélectionnant des lignes de texte. Il y aurait
> donc PDF et PDF... ?

Un PDF peut contenir entre autre :
* du texte
* des images
* des dessins vectoriels (traits, cercle...)

Pour un affichage à l'écran d'un texte si la source est du texte et bien
ça reste du texte dans le PDF (donc sélectionnable), si par contre la
source est une image (scan), cela reste une image : donc non
sélectionnable sous forme de texte.

Erwan, Pierre-Alain, merci pour vos explications, jai tout compris ;-)
Merci à tous,
Philippe.

[PDF et sélection]

7 réponses

Veuillez sélectionner un problème