Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

pour les amateurs d'argentique=3a d=c3=a9veloppement d'une pellicule

52 réponses
Avatar
jdd
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie

jdd
--
http://dodin.org

10 réponses

1 2 3 4 5
Avatar
efji
Le 27/04/2020 à 11:24, jdd a écrit :
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie

Ca marche vraiment bien cet OCR de google !
Ce que tu postes c'est ce qui sort directement ou tu es obligé de le
retravailler longuement ?
Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était
complètement merdique, y compris sur du texte imprimé. Là je viens
d'essayer sur de l'écriture manuscrite et je suis bluffé.
--
F.J.
Avatar
jdd
Le 27/04/2020 à 11:34, efji a écrit :
Le 27/04/2020 à 11:24, jdd a écrit :
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie

Ca marche vraiment bien cet OCR de google !
Ce que tu postes c'est ce qui sort directement ou tu es obligé de le
retravailler longuement ?
Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était
complètement merdique, y compris sur du texte imprimé. Là je viens
d'essayer sur de l'écriture manuscrite et je suis bluffé.

c'est retravaillé, mais tu vois la "qualité" des documents...
le brut googledoc exporté en pdf:
https://dodin.fr.nf/nextcloud/index.php/s/RkEPBDLPSNo7L9G
moi je l'exporte en texte brut, plus facile à regrouper (cat...) et le
formatage me gêne
jdd
--
http://dodin.org
Avatar
efji
Le 27/04/2020 à 11:44, jdd a écrit :
Le 27/04/2020 à 11:34, efji a écrit :
Le 27/04/2020 à 11:24, jdd a écrit :
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie

Ca marche vraiment bien cet OCR de google !
Ce que tu postes c'est ce qui sort directement ou tu es obligé de le
retravailler longuement ?
Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était
complètement merdique, y compris sur du texte imprimé. Là je viens
d'essayer sur de l'écriture manuscrite et je suis bluffé.

c'est retravaillé, mais tu vois la "qualité" des documents...
le brut googledoc exporté en pdf:
https://dodin.fr.nf/nextcloud/index.php/s/RkEPBDLPSNo7L9G
moi je l'exporte en texte brut, plus facile à regrouper (cat...) et le
formatage me gêne

OK il faut reprendre mais la base est là, et l'original est assez compliqué.
--
F.J.
Avatar
jdd
Le 27/04/2020 à 11:49, efji a écrit :
OK il faut reprendre mais la base est là, et l'original est assez compliqué.

oui, c'est gérable. Très grosse amélioration par rapport à l'existant
(tesseract, pour moi)
ce qui est curieux c'est qu'ils n'utilisent pas de dictionnaire, les
mots étranges sont lus et les fautes banales non :-)
jdd
--
http://dodin.org
Avatar
Ghost-Raider
Le 27/04/2020 à 11:24, jdd a écrit :
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie

Intéressant, toujours ce plaisant ton ironique.
Il y a des perles, comme :
"Si le lecteur délire se documenter..."
--
Et c'est ainsi que MELMOTH est infiniment Grand !
Avatar
Alf92
jdd (le 27/04/2020 à 11:24:27) :
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie

je n'ai pas accès au PDF transcit :-(
Avatar
Ghost-Raider
Le 27/04/2020 à 11:49, efji a écrit :
Le 27/04/2020 à 11:44, jdd a écrit :
Le 27/04/2020 à 11:34, efji a écrit :
Le 27/04/2020 à 11:24, jdd a écrit :
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie

Ca marche vraiment bien cet OCR de google !
Ce que tu postes c'est ce qui sort directement ou tu es obligé de le
retravailler longuement ?
Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était
complètement merdique, y compris sur du texte imprimé. Là je viens
d'essayer sur de l'écriture manuscrite et je suis bluffé.

c'est retravaillé, mais tu vois la "qualité" des documents...
le brut googledoc exporté en pdf:
https://dodin.fr.nf/nextcloud/index.php/s/RkEPBDLPSNo7L9G
moi je l'exporte en texte brut, plus facile à regrouper (cat...) et le
formatage me gêne

OK il faut reprendre mais la base est là, et l'original est assez compliqué.

J'ai beaucoup utilisé Google Docs pour la thèse de ma fille.
Je scannais les pièces en indonésien en JPG (mon vieux scanner ne
connaissait pas les PDF) et je les envoyais à Google Docs.
Google analysait les JPG, déterminait la langue et me les restituait en
texte avec les fautes d'orthographe soulignées que je pouvais corriger.
https://www.cjoint.com/doc/20_04/JDBlxl8fSn6_Sabili-16.jpg
Ensuite je repassais le texte dans Google Translation et j'obtenais un
texte français assez correct.
--
Et c'est ainsi que MELMOTH est infiniment Grand !
Avatar
jdd
Le 27/04/2020 à 13:01, Ghost-Raider a écrit :
Le 27/04/2020 à 11:24, jdd a écrit :
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie

Intéressant, toujours ce plaisant ton ironique.
Il y a des perles, comme :
"Si le lecteur délire se documenter..."

oui, mais là c'est sans doute une erreur de transcription que je dois
corriger :-(
sur l'original, la lettre est surchargée
merci
jdd
--
http://dodin.org
Avatar
jdd
Le 27/04/2020 à 13:10, Alf92 a écrit :
jdd (le 27/04/2020 à 11:24:27) :
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie

je n'ai pas accès au PDF transcit :-(

ça donne quoi? une page blanche? si oui tu clique sur l'icone de
disquette et tu le télécharge
jdd
--
http://dodin.org
Avatar
Alf92
jdd (le 27/04/2020 à 13:48:56) :
Le 27/04/2020 à 13:10, Alf92 a écrit :
jdd (le 27/04/2020 à 11:24:27) :
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie

je n'ai pas accès au PDF transcit :-(

ça donne quoi? une page blanche? si oui tu clique sur l'icone de
disquette et tu le télécharge

dans ce cas ça me télécharge l'image du texte, pas sa transcription
1 2 3 4 5