OVH Cloud OVH Cloud

application OCR ( optical Charactere recognition )

9 réponses
Avatar
zoot
Je recherche une application OCR pour une installation sur RH7.3
Je scan des documents, des recettes de cuisines ;-), et je voudrais que
la partie texte soit disponible separement, sous forme html, je doit
bien sur passer par une 'extraction' du texte via OCR!

J'aimerais aussi pouvoir l'utilise par une command line, et ainsi en
batch, via un cronjob.
Zoot

9 réponses

Avatar
Caro
"zoot" a écrit dans le message de news:

Je recherche une application OCR pour une installation sur RH7.3
Je scan des documents, des recettes de cuisines ;-), et je voudrais que
la partie texte soit disponible separement, sous forme html, je doit
bien sur passer par une 'extraction' du texte via OCR!


Hélas ! rien sous Linux pour l'instant...
tu as des softs libres mais qui ne fonctionnent pas ou très mal ( textes même pas
reconnaissables, on a
20 fois plus vite fait de les retaper ), cela dit essaye les : OGCD, Kooka, Clara OCR

et un logiciel commercial...et très cher ( 2395 $ ) chez www.vividata.com que tu peux
toujours
tester en version d'évaluation : à ce prix-là, on espère qu'il tourne !

Voilà : comme je me sers souvent d'OCR je n'ai pas le choix : c'est Omnipage sous XP

Ernest

Avatar
zoot
Caro wrote:
"zoot" a écrit dans le message de news:

Je recherche une application OCR pour une installation sur RH7.3
Je scan des documents, des recettes de cuisines ;-), et je voudrais que
la partie texte soit disponible separement, sous forme html, je doit
bien sur passer par une 'extraction' du texte via OCR!


Hélas ! rien sous Linux pour l'instant...
tu as des softs libres mais qui ne fonctionnent pas ou très mal ( texte s même pas
reconnaissables, on a
20 fois plus vite fait de les retaper ), cela dit essaye les : OGCD, Kook a, Clara OCR

et un logiciel commercial...et très cher ( 2395 $ ) chez www.vividata.c om que tu peux
toujours
tester en version d'évaluation : à ce prix-là, on espère qu'il to urne !

Voilà : comme je me sers souvent d'OCR je n'ai pas le choix : c'est Omn ipage sous XP

C'est la copnclusion auquelle j'eteatis aussi arrive :-( Y encore du

chemin a faire pour promouvoir l'utilisation de Linux !!
Merci quand meme!
Zoot
Ernest



Avatar
Frederic Bezies
Le Thu, 24 Aug 2006 04:20:18 -0700, zoot a écrit:

[...]

Hélas ! rien sous Linux pour l'instant...
tu as des softs libres mais qui ne fonctionnent pas ou très mal ( textes même pas
reconnaissables, on a
20 fois plus vite fait de les retaper ), cela dit essaye les : OGCD, Kooka, Clara OCR

et un logiciel commercial...et très cher ( 2395 $ ) chez www.vividata.com que tu peux
toujours
tester en version d'évaluation : à ce prix-là, on espère qu'il tourne !

Voilà : comme je me sers souvent d'OCR je n'ai pas le choix : c'est Omnipage sous XP

C'est la copnclusion auquelle j'eteatis aussi arrive :-( Y encore du

chemin a faire pour promouvoir l'utilisation de Linux !!
Merci quand meme!
Zoot


Cela concerne l'OCR, une utilisation qui concernent certaines personnes et
pas d'autres.

D'ailleurs, quand on voit le résultat de certains logiciels OCR sous
Windows, c'est plus rapide de tout retaper à la main ;)

--
Frederic Bezies -
Site Perso : http://perso.wanadoo.fr/frederic.bezies/
Weblog : http://frederic.bezies.free.fr/blog/


Avatar
Arol
"zoot" a écrit dans le message de news:
C'est la copnclusion auquelle j'eteatis aussi arrive :-( Y encore du
chemin a faire pour promouvoir l'utilisation de Linux !!


Aucun rapport avec linux.
L'OCR est une utilisation professionnelle limitée à un marché de niche et il
n'y a aucun intérêt pour quiconque de développer un soft puissant, gratuit
et libre.

Avatar
zoot
Arol wrote:
"zoot" a écrit dans le message de news:
C'est la copnclusion auquelle j'eteatis aussi arrive :-( Y encore du
chemin a faire pour promouvoir l'utilisation de Linux !!


Aucun rapport avec linux.
L'OCR est une utilisation professionnelle limitée à un marché de ni che et il
n'y a aucun intérêt pour quiconque de développer un soft puissant, gratuit
et libre.


Le rapport avec linux!?

MAis beaucoup d'autre software existe en libre gartuit, apache, tomcat,
sendmail, php Mysql ...
Une niche, mais certains sofwtare libre sont dans des niche encore plus
etroites, OTRS par exemple
Evidement y faut que quelqu'un s'y mette.

Mais Linux ne profite pas de la disparitee des ses distri, ni du manque
d'appilication comparable a ceux sous Wind$os

Une Niche, mais justement, un serveur sous Unix/Linux pourrait tres
bien etre utilise et automatise pour scannner /OCRiser des lots de
document, d'ailleur cela existe sous Unix! j'ai vu chez un editeur de
journeaux, les databases creent a partir de scan/OCR, mais ils
s'agissait evidement d'un software payant ( et pas gratuit ;-) )

Zoot


Avatar
Arol
"zoot" a écrit dans le message de news:
MAis beaucoup d'autre software existe en libre gartuit, apache, tomcat,
sendmail, php Mysql ...


Mauvais exemples.
Ces logiciels ne sont pas sur des marchés de niche mais concernent des
millions d'utilisateurs.

Une niche, mais certains sofwtare libre sont dans des niche encore plus
etroites, OTRS par exemple
Evidement y faut que quelqu'un s'y mette.


Mauvais exemple aussi.
Heu, tu sais quelle genre de techno est utilisée dans l'OCR ?
C'est de la recherche de haut niveau depuis des dizaines d'années sur des
problèmes toujours pas résolus.
C'est pas de la simple CRM comme dans ton OTRS


Une Niche, mais justement, un serveur sous Unix/Linux pourrait tres
bien etre utilise et automatise pour scannner /OCRiser des lots de
document, d'ailleur cela existe sous Unix! j'ai vu chez un editeur de
journeaux, les databases creent a partir de scan/OCR, mais ils
s'agissait evidement d'un software payant ( et pas gratuit ;-) )


Oui c'est une niche parce que ça concerne que quelques clients.
*Tout* le monde ne passe pas son temps à scanner et faire de l'OCR.
Par conséquent ceux qui ont besoin de ce genre d'outils de pointe, paient
très cher, que ce soit linux ou pas.

Donc, comme je l'ai dit, linux n'a rien à voir dans cette question de
disponibilité de OCR sous cette plateforme, les outils existent, sont
performants, mais payants comme windows ou OSX.

Avatar
Nicolas George
"Arol" wrote in message <44ed99fa$0$31018$:
Mauvais exemples.
Ces logiciels ne sont pas sur des marchés de niche mais concernent des
millions d'utilisateurs.


À ça, il faut ajouter que ces logiciens le constituent pas des solutions en
eux-mêmes : avec un Apache, mais sans compétences, on ne va pas très loin,
et c'est justement la compétence de tirer parti d'Apache qui se monnaye. Ce
n'est pas le cas pour un OCR.

Avatar
A Crocq
Donc, comme je l'ai dit, linux n'a rien à voir dans cette question de
disponibilité de OCR sous cette plateforme, les outils existent, sont
performants, mais payants comme windows ou OSX.


En tout cas, si Omnipage ou même ReadIris fonctionnent de façon
parfaitement satisfaisante : ils son fiables et faciles à utiliser
"conviviaux", je ne connais toujours pas d'équivalent, hélas sous Linux.
J'ai installé l'ocr de vividata pour 30 jours mais n'ai pas réussi à le
faire tourner : apparemment, il utilise des commandes en mode console?
Je n'ai pas insisté s'il faut 1/ chercher puis traduire la doc rédigée
en anglais, 2/ scanner un fichier en tif, 3/ le placer dans le bon
répertoire 4/ en mode console etc., j'ai plus vite fait de le taper ou
de passer sous XP, que j'utilise --rarement-- pour ça. XP II ne se
plante pas trop si on ne le relie pas au net et à ses virus : un petit
formatage par an et ça va.

Mais je suis preneur pour tout OCR, même payant tournant sous linux à
condition qu'il ait la maturité d'Omnipage, de ReadIris ou autres que je
ne connais pas.
Cordialement
A. Crocq


Avatar
Frederic Bezies
Le Thu, 24 Aug 2006 14:18:22 +0200, Caro a écrit:


D'ailleurs, quand on voit le résultat de certains logiciels OCR sous
Windows, c'est plus rapide de tout retaper à la main ;)



Tu as déjà utilisé Omnipage ? c'est du 100 % de reconnaissance, avec
par-ci par-là un signe à retoucher ( 1 à 2 par page A4 si l'original


Quelle version ? Mais il est vrai que je n'ai plus touché à des logiciels
d'OCR depuis 2002-2003.

n'était pas terrible) Il ne faut pas
dire n'importe quoi, non plus !



Merdre. C'est vrai, j'aurais du voir ce qu'il y avait de nouveau sur des
logiciels à 200 - 300 euros pièce.

--
Frederic Bezies -
Site Perso : http://perso.wanadoo.fr/frederic.bezies/
Weblog : http://frederic.bezies.free.fr/blog/