OVH Cloud OVH Cloud

spotlight ne lit pas tous les pdf

5 réponses
Avatar
Donald Smith
spotlight, sous le dernier X, ne lit pas, ne trouve pas des mots dans
tous mes documents pdf, certains, si, d'autres, non, j'ai pourtant
enregistré les dits documents avec adobe, une solution ?

5 réponses

Avatar
Edouard KLEIN
spotlight, sous le dernier X, ne lit pas, ne trouve pas des mots dans
tous mes documents pdf, certains, si, d'autres, non, j'ai pourtant
enregistré les dits documents avec adobe, une solution ?


Les mots en question sont-ils bizarre ? Du style au milieu d'une formule
de math ou de physique ?

Avatar
Donald Smith
En/na Edouard KLEIN ha escrit:
spotlight, sous le dernier X, ne lit pas, ne trouve pas des mots dans
tous mes documents pdf, certains, si, d'autres, non, j'ai pourtant
enregistré les dits documents avec adobe, une solution ?


Les mots en question sont-ils bizarre ? Du style au milieu d'une formule
de math ou de physique ?

il s'agit d'un document que j 'ai scanné, liste des arbres des Pyrénées,

les caractères sont dans une police genre Lucinda handwriting (imitation
écriture), la langue est le catalan, le doc était d'abord un .jpg,
Spotlight ne le lisait pas, je l'ai sauvegardé en pdf avec Adobe,
Spotlight ne le lit toujours pas, la langue n'est pas un problème,
p-être les caractères ? je pourrais essayer de changer la police, mais
je ne crois pas que cela soit possible (jpg devenu pdf)
des suggestions ?

merci d'avance


Avatar
Eric Levenez
Le 4/05/06 20:00, dans <445a4152$0$21279$, « Donald
Smith » a écrit :

il s'agit d'un document que j 'ai scanné, liste des arbres des Pyrénées,
les caractères sont dans une police genre Lucinda handwriting (imitation
écriture), la langue est le catalan, le doc était d'abord un .jpg,
Spotlight ne le lisait pas,


Spotlight n'intègre pas de module de reconnaissance des caractères ou de
l'écriture.

je l'ai sauvegardé en pdf avec Adobe,


Si c'est juste intégrée l'image graphique dans un PDF, c'est normal que cela
ne marche pas. Tu aurais le même résultat en intégrant le jpeg dans un
fichier Microsoft Word.

Spotlight ne le lit toujours pas,


Il faut passer un module de reconnaissance des caractères et convertir ainsi
l'image bitmap en fichier texte.

la langue n'est pas un problème,
p-être les caractères ?


Non, aucun rapport si le texte est sous forme d'image.

je pourrais essayer de changer la police, mais
je ne crois pas que cela soit possible (jpg devenu pdf)
des suggestions ?


Le mot clé : OCR.

--
Éric Lévénez -- <http://www.levenez.com/>
Unix is not only an OS, it's a way of life.

Avatar
h.sainct
Donald Smith wrote:

il s'agit d'un document que j 'ai scanné, (...)


L'impression que tu me donnes, c'est que tes documents scannés de départ
sont donc des images. Quoi que tu en fasses ensuite, et quel que soit le
format, ils le restent. Quand tu transformes les images en pdf, tu
obtiens un document pdf qui contient une série d'images.
Pas du texte.

Pour retrouver le texte il te faudrait employer un logiciel spécifique
de reconnaissance de caractères (OCR). Certains logiciels de scan
proposent cette option, mais si tu ne l'as pas vue passer au moment du
scan, et si tu n'a pas utilisé d'OCR ensuite, je crains fort que tu ne
sois dans le premier cas.

H.


--
Frédérique & Hervé Sainct, [fr,es,en,it]
Frédérique's initial is missing in front of the above address
l'initiale de Frédérique manque devant l'adresse email ci-dessus

Avatar
langmc
Donald Smith wrote:

En/na Edouard KLEIN ha escrit:
spotlight, sous le dernier X, ne lit pas, ne trouve pas des mots dans
tous mes documents pdf, certains, si, d'autres, non, j'ai pourtant
enregistré les dits documents avec adobe, une solution ?


Les mots en question sont-ils bizarre ? Du style au milieu d'une formule
de math ou de physique ?

il s'agit d'un document que j 'ai scanné, liste des arbres des Pyrénées,

les caractères sont dans une police genre Lucinda handwriting (imitation
écriture), la langue est le catalan, le doc était d'abord un .jpg,
Spotlight ne le lisait pas, je l'ai sauvegardé en pdf avec Adobe,
Spotlight ne le lit toujours pas, la langue n'est pas un problème,
p-être les caractères ? je pourrais essayer de changer la police, mais
je ne crois pas que cela soit possible (jpg devenu pdf)
des suggestions ?

merci d'avance


Même si ton fichier est devenu un PDF, c'est toujours une image comme le
jpg, pour qu'il soit lisible comme du texte il faut un logiciel OCR
comme ReadIris, tu lui fournis le fichier jpg et il le transforme en
fichier texte.


--
Le sage montre la lune, l'imbécile regarde le doigt.