OVH Cloud OVH Cloud

[OCR] le temps qu'il faut pour analyser une page?

4 réponses
Avatar
Saïd
Bonjour,

Un utilisateur de logiciels d'OCR et plus particulierement de
Omnipage Pro X pourait-il me dire combien de temps prends, en gros,
l'analyse d'une page A4 ou une feuille d'un livre standard? Si la
description est trop vague on peut preciser dans la response le nombre de
caracteres de la page et la definition du scan. Et sur quelle machine? (Je
compte utiliser un iBook G3 700, pour quelques centaines de pages en tout.)

Merci.

--
Saïd.

4 réponses

Avatar
francois.jacquemin
Saïd wrote:

Bonjour,

Un utilisateur de logiciels d'OCR et plus particulierement de
Omnipage Pro X pourait-il me dire combien de temps prends, en gros,
l'analyse d'une page A4 ou une feuille d'un livre standard? Si la
description est trop vague on peut preciser dans la response le nombre de
caracteres de la page et la definition du scan. Et sur quelle machine? (Je
compte utiliser un iBook G3 700, pour quelques centaines de pages en tout.)


Attends, c'est pas le temps de l'analyse, qui en bouffe, du temps. C'est
très rapide. Ce qui bouffe du temps, c'est la correction, que tu fais
toi, ensuite, au clavier.
L'analyse prend une poignée de secondes, la correction cinq à dix
minutes. C'est quasiment indépendant de la machine. Pour quelques
centaines de page, phew !

C'est un travail de bénédictin.

Quand l'impression est de très bonne qualité, il arrive qu'il y ait très
peu de corrections. La définition du scan, à partir de 300 dpi tu auras
de très bon résultats. Tu ne gagneras pas grand'chose au-delà.

--
F. Jacquemin

Avatar
marcantispam
François Jacquemin wrote:

Saïd wrote:

Bonjour,

Un utilisateur de logiciels d'OCR et plus particulierement de
Omnipage Pro X pourait-il me dire combien de temps prends, en gros,
l'analyse d'une page A4 ou une feuille d'un livre standard? Si la
description est trop vague on peut preciser dans la response le nombre de
caracteres de la page et la definition du scan. Et sur quelle machine? (Je
compte utiliser un iBook G3 700, pour quelques centaines de pages en tout.)


Attends, c'est pas le temps de l'analyse, qui en bouffe, du temps. C'est
très rapide. Ce qui bouffe du temps, c'est la correction, que tu fais
toi, ensuite, au clavier.
L'analyse prend une poignée de secondes, la correction cinq à dix
minutes. C'est quasiment indépendant de la machine. Pour quelques
centaines de page, phew !

C'est un travail de bénédictin.

Quand l'impression est de très bonne qualité, il arrive qu'il y ait très
peu de corrections. La définition du scan, à partir de 300 dpi tu auras
de très bon résultats. Tu ne gagneras pas grand'chose au-delà.


J'abonde tout en rajoutant un point. Avec omnipage pour un gros volume
ça vaut réellement le coup de lui apprendre les pages. ça consiste à
scanner une page du type de ce qu'on veut reconnaitre et bien regarder
tous les points douteux de la reconnaissance pour lui dire à quoi ça
correspond. Sur un texte mal foutu, je l'ai fait pour des trucs
dactylographiés sur papier couleur dans les années 60, c'est un peu long
mais après on gagne un temps fou.


Avatar
Saïd
François Jacquemin :
Saïd wrote:

Bonjour,

Un utilisateur de logiciels d'OCR et plus particulierement de
Omnipage Pro X pourait-il me dire combien de temps prends, en gros,
l'analyse d'une page A4 ou une feuille d'un livre standard? Si la
description est trop vague on peut preciser dans la response le nombre de
caracteres de la page et la definition du scan. Et sur quelle machine? (Je
compte utiliser un iBook G3 700, pour quelques centaines de pages en tout.)


Attends, c'est pas le temps de l'analyse, qui en bouffe, du temps. C'est
très rapide. Ce qui bouffe du temps, c'est la correction, que tu fais
toi, ensuite, au clavier.
L'analyse prend une poignée de secondes, la correction cinq à dix
minutes. C'est quasiment indépendant de la machine. Pour quelques
centaines de page, phew !

C'est un travail de bénédictin.



A la limite de je peux laisser quelques erreurs, c'est pour de l'archivage
et je pourrais faire de tete les corrections au moment de la relecture. (De
toute facon si je suis incapable de me rendre compte d'une erreur du genre
"anabomie" a la place de "anatomie", je lis directement anatomie).

J'avais demande a des personnes de l'assistance de faire la reconnaissance
sur une image prise avec un APN (EOS-300D) sur une page d'un livre, la
reconnaissance a fait zero faute sans correction. Un coup de bol
certainement, ou alors le participant (que je re-remercie) qui a fait la
reconnaisssance travaille en sous-main pour scansoft. ;-)

...300 dpi...


6MPixels sur du A4, ca fait 247 dpi. Caramba! j'aurais du attendre le
8Mpixels...

Merci pour ta reponse en tout cas.

--
Saïd.
C programmers never die - they're just cast into void.


Avatar
Anonyme
à la fin des années 90, j'ai scanné quelque choses comme 200 ouvrages
sur les chiens et les chats avec omnipage 6 pro et la meilleur méthode
que j'avais trouvé consistait à
1) scanner le document à 175%
2) accentuer les contrastes à mort avec paint shop pro (pc, mais c aussi
possible avec photoshop)
3) ensuite faire un blur dessus (comme ca les polices sont plus grasses)
4) ensuite ocriser par packet les pages tiff générés sans apprentissage
: j'avais un taux d'erreur largement inférieur à une méthode avec
apprentissage (je sais c bizarre mais bon)


depuis j'ia plus eu l'occasion d'utiliser Omnipage (c comment maintenant
la 10 ?)




François Jacquemin :

Saïd wrote:


Bonjour,

Un utilisateur de logiciels d'OCR et plus particulierement de
Omnipage Pro X pourait-il me dire combien de temps prends, en gros,
l'analyse d'une page A4 ou une feuille d'un livre standard? Si la
description est trop vague on peut preciser dans la response le nombre de
caracteres de la page et la definition du scan. Et sur quelle machine? (Je
compte utiliser un iBook G3 700, pour quelques centaines de pages en tout.)


Attends, c'est pas le temps de l'analyse, qui en bouffe, du temps. C'est
très rapide. Ce qui bouffe du temps, c'est la correction, que tu fais
toi, ensuite, au clavier.
L'analyse prend une poignée de secondes, la correction cinq à dix
minutes. C'est quasiment indépendant de la machine. Pour quelques
centaines de page, phew !

C'est un travail de bénédictin.




A la limite de je peux laisser quelques erreurs, c'est pour de l'archivage
et je pourrais faire de tete les corrections au moment de la relecture. (De
toute facon si je suis incapable de me rendre compte d'une erreur du genre
"anabomie" a la place de "anatomie", je lis directement anatomie).

J'avais demande a des personnes de l'assistance de faire la reconnaissance
sur une image prise avec un APN (EOS-300D) sur une page d'un livre, la
reconnaissance a fait zero faute sans correction. Un coup de bol
certainement, ou alors le participant (que je re-remercie) qui a fait la
reconnaisssance travaille en sous-main pour scansoft. ;-)


...300 dpi...



6MPixels sur du A4, ca fait 247 dpi. Caramba! j'aurais du attendre le
8Mpixels...

Merci pour ta reponse en tout cas.