Voici que je dois passer le OCR (Optical Character Recognition) =E0 plusier=
s
documents =E9crits =E7a fait longtemps =E0 la machine =E0 =E9crire. Ce sont=
en
fran=E7ais, donc une fois convertis =E0 pdf, je viens de prouver le *tesser=
act*
fran=E7ais et le r=E9sultat a =E9t=E9 d=E9sastreux. La chose a pu millorer =
un peu en
utilisant le *GOCR*, mais le r=E9sultat obtenu a =E9t=E9 =E9galement inacce=
ptable...
Pouvez me recommander un outil un peu plus ad=E9quate =E0 cet t=E2che ?
Bonjour =E0 tous,<br><br>Voici que je dois passer le OCR (Optical Character=
Recognition) =E0 plusiers documents =E9crits =E7a fait longtemps =E0 la ma=
chine =E0 =E9crire. Ce sont en fran=E7ais, donc une fois convertis =E0 pdf,=
je viens de prouver le *tesseract* fran=E7ais et le r=E9sultat a =E9t=E9 d=
=E9sastreux. La chose a pu millorer un peu en utilisant le *GOCR*, mais le =
r=E9sultat obtenu a =E9t=E9 =E9galement inacceptable...<br>
<br>Pouvez me recommander un outil un peu plus ad=E9quate =E0 cet t=E2che ?=
<br><br>Merci en avance...<br><br>Sev.<br><br><br>
------=_Part_13136_16601565.1229619817026--
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/DebFrFrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"
To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org
-- Lisez la FAQ de la liste avant de poser une question : http://wiki.debian.org/DebFrFrenchLists Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"
To UNSUBSCRIBE, email to with a subject of "unsubscribe". Trouble? Contact
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/DebFrFrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"
To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org
-- Lisez la FAQ de la liste avant de poser une question : http://wiki.debian.org/DebFrFrenchLists Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"
To UNSUBSCRIBE, email to with a subject of "unsubscribe". Trouble? Contact
-- Lisez la FAQ de la liste avant de poser une question : http://wiki.debian.org/DebFrFrenchLists Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"
To UNSUBSCRIBE, email to with a subject of "unsubscribe". Trouble? Contact
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/DebFrFrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"
To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org
-- Lisez la FAQ de la liste avant de poser une question : http://wiki.debian.org/DebFrFrenchLists Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"
To UNSUBSCRIBE, email to with a subject of "unsubscribe". Trouble? Contact
Gaëtan PERRIER
Le Thu, 18 Dec 2008 18:03:37 +0100 "Sever P A" a écrit:
Bonjour à tous,
Voici que je dois passer le OCR (Optical Character Recognition) à plusiers documents écrits ça fait longtemps à la machine à écrire. Ce sont en français, donc une fois convertis à pdf, je viens de prouver le *tesseract* français et le résultat a été désastreux. La chose a pu millorer un peu en utilisant le *GOCR*, mais le résultat obtenu a été également inacceptable...
Pouvez me recommander un outil un peu plus adéquate à cet tâche ?
apt-get install tesseract-ocr dispo sous debian
marche vraiment bien.
Gaëtan
-- Lisez la FAQ de la liste avant de poser une question : http://wiki.debian.org/DebFrFrenchLists Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"
To UNSUBSCRIBE, email to with a subject of "unsubscribe". Trouble? Contact
Le Thu, 18 Dec 2008 18:03:37 +0100
"Sever P A" <gnu.sever@gmail.com> a écrit:
Bonjour à tous,
Voici que je dois passer le OCR (Optical Character Recognition) à plusiers
documents écrits ça fait longtemps à la machine à écrire. Ce sont en
français, donc une fois convertis à pdf, je viens de prouver le *tesseract*
français et le résultat a été désastreux. La chose a pu millorer un peu en
utilisant le *GOCR*, mais le résultat obtenu a été également inacceptable...
Pouvez me recommander un outil un peu plus adéquate à cet tâche ?
apt-get install tesseract-ocr dispo sous debian
marche vraiment bien.
Gaëtan
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/DebFrFrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"
To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org
Le Thu, 18 Dec 2008 18:03:37 +0100 "Sever P A" a écrit:
Bonjour à tous,
Voici que je dois passer le OCR (Optical Character Recognition) à plusiers documents écrits ça fait longtemps à la machine à écrire. Ce sont en français, donc une fois convertis à pdf, je viens de prouver le *tesseract* français et le résultat a été désastreux. La chose a pu millorer un peu en utilisant le *GOCR*, mais le résultat obtenu a été également inacceptable...
Pouvez me recommander un outil un peu plus adéquate à cet tâche ?
apt-get install tesseract-ocr dispo sous debian
marche vraiment bien.
Gaëtan
-- Lisez la FAQ de la liste avant de poser une question : http://wiki.debian.org/DebFrFrenchLists Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"
To UNSUBSCRIBE, email to with a subject of "unsubscribe". Trouble? Contact
Daniel Caillibaud
Gaëtan PERRIER a écrit :
[...] je viens de prouver le *tesseract* français et le résultat a été désastreux. [...]
Pouvez me recommander un outil un peu plus adéquate à cet tâche ?
apt-get install tesseract-ocr
C'est la blague du vendredi où il y a des cas où tesseract fonctionne ?
-- Daniel
-- Lisez la FAQ de la liste avant de poser une question : http://wiki.debian.org/DebFrFrenchLists Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"
To UNSUBSCRIBE, email to with a subject of "unsubscribe". Trouble? Contact
Gaëtan PERRIER a écrit :
[...] je viens de prouver le *tesseract* français et le résultat a été désastreux. [...]
Pouvez me recommander un outil un peu plus adéquate à cet tâche ?
apt-get install tesseract-ocr
C'est la blague du vendredi où il y a des cas où tesseract fonctionne ?
--
Daniel
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/DebFrFrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"
To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org
[...] je viens de prouver le *tesseract* français et le résultat a été désastreux. [...]
Pouvez me recommander un outil un peu plus adéquate à cet tâche ?
apt-get install tesseract-ocr
C'est la blague du vendredi où il y a des cas où tesseract fonctionne ?
-- Daniel
-- Lisez la FAQ de la liste avant de poser une question : http://wiki.debian.org/DebFrFrenchLists Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"
To UNSUBSCRIBE, email to with a subject of "unsubscribe". Trouble? Contact
C'est la blague du vendredi où il y a des cas où tesseract fonc tionne ?
Il fonctionne très bien mais n'accepte que du .tif et si possible noir et blanc
-- Daniel
-- Lisez la FAQ de la liste avant de poser une question : http://wiki.debian.org/DebFrFrenchLists Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"
To UNSUBSCRIBE, email to with a subject of "unsubscribe". Trouble? Contact .org
-- Lisez la FAQ de la liste avant de poser une question : http://wiki.debian.org/DebFrFrenchLists Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"
To UNSUBSCRIBE, email to with a subject of "unsubscribe". Trouble? Contact
C'est la blague du vendredi où il y a des cas où tesseract fonc tionne ?
Il fonctionne très bien mais n'accepte que du .tif et si possible noir
et blanc
--
Daniel
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/DebFrFrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"
To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian .org
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/DebFrFrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"
To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org
C'est la blague du vendredi où il y a des cas où tesseract fonc tionne ?
Il fonctionne très bien mais n'accepte que du .tif et si possible noir et blanc
-- Daniel
-- Lisez la FAQ de la liste avant de poser une question : http://wiki.debian.org/DebFrFrenchLists Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"
To UNSUBSCRIBE, email to with a subject of "unsubscribe". Trouble? Contact .org
-- Lisez la FAQ de la liste avant de poser une question : http://wiki.debian.org/DebFrFrenchLists Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"
To UNSUBSCRIBE, email to with a subject of "unsubscribe". Trouble? Contact
Alexandre
(3ème envoi du même mail... je ne comprends pas que je n'arrive pas à poster sur la liste...)
Le mardi 23 décembre de l'année 2008, vers 10 heures et 22 minutes, Daniel Caillibaud écrivait:
Gaëtan PERRIER a écrit :
[...] je viens de prouver le *tesseract* français et le résultat a été désastreux. [...]
Pouvez me recommander un outil un peu plus adéquate à cet tâche ?
apt-get install tesseract-ocr
C'est la blague du vendredi où il y a des cas où tesseract fonctionne ?
je viens de tester un document de 3 pages scanné en pdf
convert -density 300 image.pdf image.tif tesseract image.tif essai -l fra résultat: près de 1% d'erreurs!
par contre si j'utilise la commande: convert image.pdf image.tif : 100% d'erreurs
-- Lisez la FAQ de la liste avant de poser une question : http://wiki.debian.org/DebFrFrenchLists Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"
To UNSUBSCRIBE, email to with a subject of "unsubscribe". Trouble? Contact
(3ème envoi du même mail... je ne comprends pas que je n'arrive pas à
poster sur la liste...)
Le mardi 23 décembre de l'année 2008, vers 10 heures et 22 minutes,
Daniel Caillibaud écrivait:
Gaëtan PERRIER a écrit :
[...] je viens de prouver le *tesseract* français et le résultat a
été désastreux. [...]
Pouvez me recommander un outil un peu plus adéquate à cet tâche ?
apt-get install tesseract-ocr
C'est la blague du vendredi où il y a des cas où tesseract fonctionne
?
je viens de tester un document de 3 pages scanné en pdf
convert -density 300 image.pdf image.tif
tesseract image.tif essai -l fra
résultat: près de 1% d'erreurs!
par contre si j'utilise la commande:
convert image.pdf image.tif : 100% d'erreurs
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/DebFrFrenchLists
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"
To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org
-- Lisez la FAQ de la liste avant de poser une question : http://wiki.debian.org/DebFrFrenchLists Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"
To UNSUBSCRIBE, email to with a subject of "unsubscribe". Trouble? Contact