Ca marche vraiment bien cet OCR de google ! Ce que tu postes c'est ce qui sort directement ou tu es obligé de le retravailler longuement ? Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était complètement merdique, y compris sur du texte imprimé. Là je viens d'essayer sur de l'écriture manuscrite et je suis bluffé. -- F.J.
Ca marche vraiment bien cet OCR de google !
Ce que tu postes c'est ce qui sort directement ou tu es obligé de le
retravailler longuement ?
Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était
complètement merdique, y compris sur du texte imprimé. Là je viens
d'essayer sur de l'écriture manuscrite et je suis bluffé.
Ca marche vraiment bien cet OCR de google ! Ce que tu postes c'est ce qui sort directement ou tu es obligé de le retravailler longuement ? Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était complètement merdique, y compris sur du texte imprimé. Là je viens d'essayer sur de l'écriture manuscrite et je suis bluffé. -- F.J.
Ca marche vraiment bien cet OCR de google ! Ce que tu postes c'est ce qui sort directement ou tu es obligé de le retravailler longuement ? Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était complètement merdique, y compris sur du texte imprimé. Là je viens d'essayer sur de l'écriture manuscrite et je suis bluffé.
c'est retravaillé, mais tu vois la "qualité" des documents... le brut googledoc exporté en pdf: https://dodin.fr.nf/nextcloud/index.php/s/RkEPBDLPSNo7L9G moi je l'exporte en texte brut, plus facile à regrouper (cat...) et le formatage me gêne jdd -- http://dodin.org
Ca marche vraiment bien cet OCR de google !
Ce que tu postes c'est ce qui sort directement ou tu es obligé de le
retravailler longuement ?
Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était
complètement merdique, y compris sur du texte imprimé. Là je viens
d'essayer sur de l'écriture manuscrite et je suis bluffé.
c'est retravaillé, mais tu vois la "qualité" des documents...
Ca marche vraiment bien cet OCR de google ! Ce que tu postes c'est ce qui sort directement ou tu es obligé de le retravailler longuement ? Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était complètement merdique, y compris sur du texte imprimé. Là je viens d'essayer sur de l'écriture manuscrite et je suis bluffé.
c'est retravaillé, mais tu vois la "qualité" des documents... le brut googledoc exporté en pdf: https://dodin.fr.nf/nextcloud/index.php/s/RkEPBDLPSNo7L9G moi je l'exporte en texte brut, plus facile à regrouper (cat...) et le formatage me gêne jdd -- http://dodin.org
Ca marche vraiment bien cet OCR de google ! Ce que tu postes c'est ce qui sort directement ou tu es obligé de le retravailler longuement ? Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était complètement merdique, y compris sur du texte imprimé. Là je viens d'essayer sur de l'écriture manuscrite et je suis bluffé.
c'est retravaillé, mais tu vois la "qualité" des documents... le brut googledoc exporté en pdf: https://dodin.fr.nf/nextcloud/index.php/s/RkEPBDLPSNo7L9G moi je l'exporte en texte brut, plus facile à regrouper (cat...) et le formatage me gêne
OK il faut reprendre mais la base est là, et l'original est assez compliqué. -- F.J.
Ca marche vraiment bien cet OCR de google !
Ce que tu postes c'est ce qui sort directement ou tu es obligé de le
retravailler longuement ?
Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était
complètement merdique, y compris sur du texte imprimé. Là je viens
d'essayer sur de l'écriture manuscrite et je suis bluffé.
c'est retravaillé, mais tu vois la "qualité" des documents...
Ca marche vraiment bien cet OCR de google ! Ce que tu postes c'est ce qui sort directement ou tu es obligé de le retravailler longuement ? Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était complètement merdique, y compris sur du texte imprimé. Là je viens d'essayer sur de l'écriture manuscrite et je suis bluffé.
c'est retravaillé, mais tu vois la "qualité" des documents... le brut googledoc exporté en pdf: https://dodin.fr.nf/nextcloud/index.php/s/RkEPBDLPSNo7L9G moi je l'exporte en texte brut, plus facile à regrouper (cat...) et le formatage me gêne
OK il faut reprendre mais la base est là, et l'original est assez compliqué. -- F.J.
jdd
Le 27/04/2020 à 11:49, efji a écrit :
OK il faut reprendre mais la base est là, et l'original est assez compliqué.
oui, c'est gérable. Très grosse amélioration par rapport à l'existant (tesseract, pour moi) ce qui est curieux c'est qu'ils n'utilisent pas de dictionnaire, les mots étranges sont lus et les fautes banales non :-) jdd -- http://dodin.org
Le 27/04/2020 à 11:49, efji a écrit :
OK il faut reprendre mais la base est là, et l'original est assez compliqué.
oui, c'est gérable. Très grosse amélioration par rapport à l'existant
(tesseract, pour moi)
ce qui est curieux c'est qu'ils n'utilisent pas de dictionnaire, les
mots étranges sont lus et les fautes banales non :-)
OK il faut reprendre mais la base est là, et l'original est assez compliqué.
oui, c'est gérable. Très grosse amélioration par rapport à l'existant (tesseract, pour moi) ce qui est curieux c'est qu'ils n'utilisent pas de dictionnaire, les mots étranges sont lus et les fautes banales non :-) jdd -- http://dodin.org
Intéressant, toujours ce plaisant ton ironique. Il y a des perles, comme : "Si le lecteur délire se documenter..." -- Et c'est ainsi que MELMOTH est infiniment Grand !
Intéressant, toujours ce plaisant ton ironique. Il y a des perles, comme : "Si le lecteur délire se documenter..." -- Et c'est ainsi que MELMOTH est infiniment Grand !
Ca marche vraiment bien cet OCR de google ! Ce que tu postes c'est ce qui sort directement ou tu es obligé de le retravailler longuement ? Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était complètement merdique, y compris sur du texte imprimé. Là je viens d'essayer sur de l'écriture manuscrite et je suis bluffé.
c'est retravaillé, mais tu vois la "qualité" des documents... le brut googledoc exporté en pdf: https://dodin.fr.nf/nextcloud/index.php/s/RkEPBDLPSNo7L9G moi je l'exporte en texte brut, plus facile à regrouper (cat...) et le formatage me gêne
OK il faut reprendre mais la base est là, et l'original est assez compliqué.
J'ai beaucoup utilisé Google Docs pour la thèse de ma fille. Je scannais les pièces en indonésien en JPG (mon vieux scanner ne connaissait pas les PDF) et je les envoyais à Google Docs. Google analysait les JPG, déterminait la langue et me les restituait en texte avec les fautes d'orthographe soulignées que je pouvais corriger. https://www.cjoint.com/doc/20_04/JDBlxl8fSn6_Sabili-16.jpg Ensuite je repassais le texte dans Google Translation et j'obtenais un texte français assez correct. -- Et c'est ainsi que MELMOTH est infiniment Grand !
Ca marche vraiment bien cet OCR de google !
Ce que tu postes c'est ce qui sort directement ou tu es obligé de le
retravailler longuement ?
Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était
complètement merdique, y compris sur du texte imprimé. Là je viens
d'essayer sur de l'écriture manuscrite et je suis bluffé.
c'est retravaillé, mais tu vois la "qualité" des documents...
moi je l'exporte en texte brut, plus facile à regrouper (cat...) et le
formatage me gêne
OK il faut reprendre mais la base est là, et l'original est assez compliqué.
J'ai beaucoup utilisé Google Docs pour la thèse de ma fille.
Je scannais les pièces en indonésien en JPG (mon vieux scanner ne
connaissait pas les PDF) et je les envoyais à Google Docs.
Google analysait les JPG, déterminait la langue et me les restituait en
texte avec les fautes d'orthographe soulignées que je pouvais corriger.
https://www.cjoint.com/doc/20_04/JDBlxl8fSn6_Sabili-16.jpg
Ensuite je repassais le texte dans Google Translation et j'obtenais un
texte français assez correct.
--
Et c'est ainsi que MELMOTH est infiniment Grand !
Ca marche vraiment bien cet OCR de google ! Ce que tu postes c'est ce qui sort directement ou tu es obligé de le retravailler longuement ? Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était complètement merdique, y compris sur du texte imprimé. Là je viens d'essayer sur de l'écriture manuscrite et je suis bluffé.
c'est retravaillé, mais tu vois la "qualité" des documents... le brut googledoc exporté en pdf: https://dodin.fr.nf/nextcloud/index.php/s/RkEPBDLPSNo7L9G moi je l'exporte en texte brut, plus facile à regrouper (cat...) et le formatage me gêne
OK il faut reprendre mais la base est là, et l'original est assez compliqué.
J'ai beaucoup utilisé Google Docs pour la thèse de ma fille. Je scannais les pièces en indonésien en JPG (mon vieux scanner ne connaissait pas les PDF) et je les envoyais à Google Docs. Google analysait les JPG, déterminait la langue et me les restituait en texte avec les fautes d'orthographe soulignées que je pouvais corriger. https://www.cjoint.com/doc/20_04/JDBlxl8fSn6_Sabili-16.jpg Ensuite je repassais le texte dans Google Translation et j'obtenais un texte français assez correct. -- Et c'est ainsi que MELMOTH est infiniment Grand !
Intéressant, toujours ce plaisant ton ironique. Il y a des perles, comme : "Si le lecteur délire se documenter..."
oui, mais là c'est sans doute une erreur de transcription que je dois corriger :-( sur l'original, la lettre est surchargée merci jdd -- http://dodin.org
Intéressant, toujours ce plaisant ton ironique. Il y a des perles, comme : "Si le lecteur délire se documenter..."
oui, mais là c'est sans doute une erreur de transcription que je dois corriger :-( sur l'original, la lettre est surchargée merci jdd -- http://dodin.org