pour les amateurs d'argentique=3a d=c3=a9veloppement d'une pellicule

Le
jdd
Vos réponses Page 1 / 6
Trier par : date / pertinence
efji
Le #26544746
Le 27/04/2020 à 11:24, jdd a écrit :
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie


Ca marche vraiment bien cet OCR de google !
Ce que tu postes c'est ce qui sort directement ou tu es obligé de le
retravailler longuement ?
Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était
complètement merdique, y compris sur du texte imprimé. Là je viens
d'essayer sur de l'écriture manuscrite et je suis bluffé.
--
F.J.
jdd
Le #26544753
Le 27/04/2020 à 11:34, efji a écrit :
Le 27/04/2020 à 11:24, jdd a écrit :
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie

Ca marche vraiment bien cet OCR de google !
Ce que tu postes c'est ce qui sort directement ou tu es obligé de le
retravailler longuement ?
Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était
complètement merdique, y compris sur du texte imprimé. Là je viens
d'essayer sur de l'écriture manuscrite et je suis bluffé.


c'est retravaillé, mais tu vois la "qualité" des documents...
le brut googledoc exporté en pdf:
https://dodin.fr.nf/nextcloud/index.php/s/RkEPBDLPSNo7L9G
moi je l'exporte en texte brut, plus facile à regrouper (cat...) et le
formatage me gêne
jdd
--
http://dodin.org
efji
Le #26544752
Le 27/04/2020 à 11:44, jdd a écrit :
Le 27/04/2020 à 11:34, efji a écrit :
Le 27/04/2020 à 11:24, jdd a écrit :
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie

Ca marche vraiment bien cet OCR de google !
Ce que tu postes c'est ce qui sort directement ou tu es obligé de le
retravailler longuement ?
Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était
complètement merdique, y compris sur du texte imprimé. Là je viens
d'essayer sur de l'écriture manuscrite et je suis bluffé.


c'est retravaillé, mais tu vois la "qualité" des documents...
le brut googledoc exporté en pdf:
https://dodin.fr.nf/nextcloud/index.php/s/RkEPBDLPSNo7L9G
moi je l'exporte en texte brut, plus facile à regrouper (cat...) et le
formatage me gêne


OK il faut reprendre mais la base est là, et l'original est assez compliqué.
--
F.J.
jdd
Le #26544763
Le 27/04/2020 à 11:49, efji a écrit :
OK il faut reprendre mais la base est là, et l'original est assez compliqué.


oui, c'est gérable. Très grosse amélioration par rapport à l'existant
(tesseract, pour moi)
ce qui est curieux c'est qu'ils n'utilisent pas de dictionnaire, les
mots étranges sont lus et les fautes banales non :-)
jdd
--
http://dodin.org
Ghost-Raider
Le #26544772
Le 27/04/2020 à 11:24, jdd a écrit :
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie

Intéressant, toujours ce plaisant ton ironique.
Il y a des perles, comme :
"Si le lecteur délire se documenter..."
--
Et c'est ainsi que MELMOTH est infiniment Grand !
Alf92
Le #26544771
jdd (le 27/04/2020 à 11:24:27) :
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie

je n'ai pas accès au PDF transcit :-(
Ghost-Raider
Le #26544776
Le 27/04/2020 à 11:49, efji a écrit :
Le 27/04/2020 à 11:44, jdd a écrit :
Le 27/04/2020 à 11:34, efji a écrit :
Le 27/04/2020 à 11:24, jdd a écrit :
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie

Ca marche vraiment bien cet OCR de google !
Ce que tu postes c'est ce qui sort directement ou tu es obligé de le
retravailler longuement ?
Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était
complètement merdique, y compris sur du texte imprimé. Là je viens
d'essayer sur de l'écriture manuscrite et je suis bluffé.

c'est retravaillé, mais tu vois la "qualité" des documents...
le brut googledoc exporté en pdf:
https://dodin.fr.nf/nextcloud/index.php/s/RkEPBDLPSNo7L9G
moi je l'exporte en texte brut, plus facile à regrouper (cat...) et le
formatage me gêne

OK il faut reprendre mais la base est là, et l'original est assez compliqué.

J'ai beaucoup utilisé Google Docs pour la thèse de ma fille.
Je scannais les pièces en indonésien en JPG (mon vieux scanner ne
connaissait pas les PDF) et je les envoyais à Google Docs.
Google analysait les JPG, déterminait la langue et me les restituait en
texte avec les fautes d'orthographe soulignées que je pouvais corriger.
https://www.cjoint.com/doc/20_04/JDBlxl8fSn6_Sabili-16.jpg
Ensuite je repassais le texte dans Google Translation et j'obtenais un
texte français assez correct.
--
Et c'est ainsi que MELMOTH est infiniment Grand !
jdd
Le #26544775
Le 27/04/2020 à 13:01, Ghost-Raider a écrit :
Le 27/04/2020 à 11:24, jdd a écrit :
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie

Intéressant, toujours ce plaisant ton ironique.
Il y a des perles, comme :
"Si le lecteur délire se documenter..."

oui, mais là c'est sans doute une erreur de transcription que je dois
corriger :-(
sur l'original, la lettre est surchargée
merci
jdd
--
http://dodin.org
jdd
Le #26544779
Le 27/04/2020 à 13:10, Alf92 a écrit :
jdd (le 27/04/2020 à 11:24:27) :
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie

je n'ai pas accès au PDF transcit :-(

ça donne quoi? une page blanche? si oui tu clique sur l'icone de
disquette et tu le télécharge
jdd
--
http://dodin.org
Alf92
Le #26544801
jdd (le 27/04/2020 à 13:48:56) :
Le 27/04/2020 à 13:10, Alf92 a écrit :
jdd (le 27/04/2020 à 11:24:27) :
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie

je n'ai pas accès au PDF transcit :-(

ça donne quoi? une page blanche? si oui tu clique sur l'icone de
disquette et tu le télécharge

dans ce cas ça me télécharge l'image du texte, pas sa transcription
Publicité
Poster une réponse
Anonyme