Ca marche vraiment bien cet OCR de google ! Ce que tu postes c'est ce qui sort directement ou tu es obligé de le retravailler longuement ? Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était complètement merdique, y compris sur du texte imprimé. Là je viens d'essayer sur de l'écriture manuscrite et je suis bluffé.
Vers 2000, j'ai utilisé un truc qui devait s'appeler "simpleocr" (pas sûr), open source sous Windows98SE "custom", pour aider ma fille à faire sa soutenance de fin d'études, en scannant des tas de documents imprimés, mais parfois de mauvaises photocopies. Ça marchait impeccable sans nécessiter beaucoup de corrections manuelles, à une seule condition près : que le document soit scanné parfaitement vertical, auquel cas même un artocle en colonnes était interprété correctement. À peu près à la même époque, j'avais recherché des chaines sous google (je ne me souviens hélas pas de ce que je recherchais, j'aurais bien retenté) , qui m'avait ramené des chaînes fausses de livres anciens (genre Encyclopédie de Diderot et consort), où il confondait allègrement dans les typographies anciennes les f et les t, les s aussi parfois, me ramenant des documents bourrés de fautes d'orthographe et ne traitant pas du tout de ce que je cherchais ;-(( Google-books, c'était pas la joie !!:-< -- "La prévoyance est une des supériorités de l'Européen sur l'indigène, l'imprévoyance incarnée." in "L'agriculture pratique des pays chauds" (Bulletin du Jardin Colonial, 1905, Ministère des colonies)
Ca marche vraiment bien cet OCR de google !
Ce que tu postes c'est ce qui sort directement ou tu es obligé de le
retravailler longuement ?
Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était complètement
merdique, y compris sur du texte imprimé. Là je viens d'essayer sur de
l'écriture manuscrite et je suis bluffé.
Vers 2000, j'ai utilisé un truc qui devait s'appeler "simpleocr" (pas sûr), open
source sous Windows98SE "custom", pour aider ma fille à faire sa soutenance de
fin d'études, en scannant des tas de documents imprimés, mais parfois de
mauvaises photocopies. Ça marchait impeccable sans nécessiter beaucoup de
corrections manuelles, à une seule condition près : que le document soit scanné
parfaitement vertical, auquel cas même un artocle en colonnes était interprété
correctement.
À peu près à la même époque, j'avais recherché des chaines sous google (je ne me
souviens hélas pas de ce que je recherchais, j'aurais bien retenté) , qui
m'avait ramené des chaînes fausses de livres anciens (genre Encyclopédie de
Diderot et consort), où il confondait allègrement dans les typographies
anciennes les f et les t, les s aussi parfois, me ramenant des documents bourrés
de fautes d'orthographe et ne traitant pas du tout de ce que je cherchais ;-((
Google-books, c'était pas la joie !!:-<
--
"La prévoyance est une des supériorités de l'Européen sur l'indigène,
l'imprévoyance incarnée."
in "L'agriculture pratique des pays chauds" (Bulletin du Jardin Colonial, 1905,
Ministère des colonies)
Ca marche vraiment bien cet OCR de google ! Ce que tu postes c'est ce qui sort directement ou tu es obligé de le retravailler longuement ? Tout ce que j'avais pu essayer comme OCR jusqu'à maintenant était complètement merdique, y compris sur du texte imprimé. Là je viens d'essayer sur de l'écriture manuscrite et je suis bluffé.
Vers 2000, j'ai utilisé un truc qui devait s'appeler "simpleocr" (pas sûr), open source sous Windows98SE "custom", pour aider ma fille à faire sa soutenance de fin d'études, en scannant des tas de documents imprimés, mais parfois de mauvaises photocopies. Ça marchait impeccable sans nécessiter beaucoup de corrections manuelles, à une seule condition près : que le document soit scanné parfaitement vertical, auquel cas même un artocle en colonnes était interprété correctement. À peu près à la même époque, j'avais recherché des chaines sous google (je ne me souviens hélas pas de ce que je recherchais, j'aurais bien retenté) , qui m'avait ramené des chaînes fausses de livres anciens (genre Encyclopédie de Diderot et consort), où il confondait allègrement dans les typographies anciennes les f et les t, les s aussi parfois, me ramenant des documents bourrés de fautes d'orthographe et ne traitant pas du tout de ce que je cherchais ;-(( Google-books, c'était pas la joie !!:-< -- "La prévoyance est une des supériorités de l'Européen sur l'indigène, l'imprévoyance incarnée." in "L'agriculture pratique des pays chauds" (Bulletin du Jardin Colonial, 1905, Ministère des colonies)
ça donne quoi? une page blanche? si oui tu clique sur l'icone de disquette et tu le télécharge
dans ce cas ça me télécharge l'image du texte, pas sa transcription
c'est très bizarre... tout marche impec chez moi Chrome linux vieux de 2014.... et Chrome 2019 aussi.
Win10, Firefox à jour (v75) suis-je le seul...?
Ça marche chez moi, FF Chrome Edge, sans différence notable. Il est assez difficile de comprendre ce qui est proposé par les trois liens. Je suppose que le plan du site n'est pas arrêté. Il est possible que l'ouverture d'objets PDF (type application/pdf) soit refusée par le navigateur à cause de la connexion non sécurisée (http et non https). Il me semble impératif de faire l'emplette d'un certificat. En fait, normalement, c'est dans la fourniture de base de tous les contrats d'hébergement. Le premier "Les fac similés" est routé, il pointe vers une galerie de liens vignettres, certains ouvrant des images, d'autres des objets type application/pdf. Le deuxième "Le pdf" est un lien direct vers un fichier .pdf: <a target="_blank" class="urllink" href="http://dodin.org/luciendodin/uploads/Histoire/photographie.pdf" rel="nofollow">Le pdf</a> Le comportement dépend du navigateur, aujourd'hui et par défaut il doit ouvrir le document dans le lecteur PDF interne. On peut préférer: <a class="urllink" href="http://dodin.org/luciendodin/uploads/Histoire/photographie.pdf" download="http://dodin.org/luciendodin/uploads/Histoire/photographie.pdf">Le pdf (télécharger)</a> qui proposera un choix. Le troisième "La transcription" est routé, il ouvre un objet de type application/pdf (dont le contenu est essentiellement un texte). -- Pierre Maurette
Alf92 :
Stephane Legras-Decussy (le 27/04/2020 à 19:57:13) :
ça donne quoi? une page blanche? si oui tu clique sur l'icone de
disquette et tu le télécharge
dans ce cas ça me télécharge l'image du texte, pas sa transcription
c'est très bizarre... tout marche impec chez moi Chrome linux vieux de
2014.... et Chrome 2019 aussi.
Win10, Firefox à jour (v75)
suis-je le seul...?
Ça marche chez moi, FF Chrome Edge, sans différence notable.
Il est assez difficile de comprendre ce qui est proposé par les trois
liens. Je suppose que le plan du site n'est pas arrêté.
Il est possible que l'ouverture d'objets PDF (type application/pdf)
soit refusée par le navigateur à cause de la connexion non sécurisée
(http et non https). Il me semble impératif de faire l'emplette d'un
certificat. En fait, normalement, c'est dans la fourniture de base de
tous les contrats d'hébergement.
Le premier "Les fac similés" est routé, il pointe vers une galerie de
liens vignettres, certains ouvrant des images, d'autres des objets type
application/pdf.
Le deuxième "Le pdf" est un lien direct vers un fichier .pdf:
<a target="_blank" class="urllink"
href="http://dodin.org/luciendodin/uploads/Histoire/photographie.pdf"
rel="nofollow">Le pdf</a>
Le comportement dépend du navigateur, aujourd'hui et par défaut il doit
ouvrir le document dans le lecteur PDF interne. On peut préférer:
<a class="urllink"
href="http://dodin.org/luciendodin/uploads/Histoire/photographie.pdf"
download="http://dodin.org/luciendodin/uploads/Histoire/photographie.pdf">Le
pdf (télécharger)</a>
qui proposera un choix.
Le troisième "La transcription" est routé, il ouvre un objet de type
application/pdf (dont le contenu est essentiellement un texte).
ça donne quoi? une page blanche? si oui tu clique sur l'icone de disquette et tu le télécharge
dans ce cas ça me télécharge l'image du texte, pas sa transcription
c'est très bizarre... tout marche impec chez moi Chrome linux vieux de 2014.... et Chrome 2019 aussi.
Win10, Firefox à jour (v75) suis-je le seul...?
Ça marche chez moi, FF Chrome Edge, sans différence notable. Il est assez difficile de comprendre ce qui est proposé par les trois liens. Je suppose que le plan du site n'est pas arrêté. Il est possible que l'ouverture d'objets PDF (type application/pdf) soit refusée par le navigateur à cause de la connexion non sécurisée (http et non https). Il me semble impératif de faire l'emplette d'un certificat. En fait, normalement, c'est dans la fourniture de base de tous les contrats d'hébergement. Le premier "Les fac similés" est routé, il pointe vers une galerie de liens vignettres, certains ouvrant des images, d'autres des objets type application/pdf. Le deuxième "Le pdf" est un lien direct vers un fichier .pdf: <a target="_blank" class="urllink" href="http://dodin.org/luciendodin/uploads/Histoire/photographie.pdf" rel="nofollow">Le pdf</a> Le comportement dépend du navigateur, aujourd'hui et par défaut il doit ouvrir le document dans le lecteur PDF interne. On peut préférer: <a class="urllink" href="http://dodin.org/luciendodin/uploads/Histoire/photographie.pdf" download="http://dodin.org/luciendodin/uploads/Histoire/photographie.pdf">Le pdf (télécharger)</a> qui proposera un choix. Le troisième "La transcription" est routé, il ouvre un objet de type application/pdf (dont le contenu est essentiellement un texte). -- Pierre Maurette
jdd
Le 28/04/2020 à 05:00, Pierre Maurette a écrit :
Il est assez difficile de comprendre ce qui est proposé par les trois liens. Je suppose que le plan du site n'est pas arrêté.
je suis ouvert aux suggestions :-) jdd -- http://dodin.org
Le 28/04/2020 à 05:00, Pierre Maurette a écrit :
Il est assez difficile de comprendre ce qui est proposé par les trois
liens. Je suppose que le plan du site n'est pas arrêté.
ça donne quoi? une page blanche? si oui tu clique sur l'icone de disquette et tu le télécharge
Sur ce lien : http://dodin.org/luciendodin/index.php?n=Histoire.Photographie Si on clique sur la transcription : http://dodin.org/piwigo/picture.php?/150576-document/category/5701 avec W10 et FF, ça donne : - si FF est réglé pour afficher les PDF : la transcription est bien affichée dans FF -si FF est régler pour télécharger, c'est le fac-simile qui est téléchargé et pas la transcription . -- Et c'est ainsi que MELMOTH est infiniment Grand !
ça donne quoi? une page blanche? si oui tu clique sur l'icone de
disquette et tu le télécharge
Sur ce lien :
http://dodin.org/luciendodin/index.php?n=Histoire.Photographie
Si on clique sur la transcription :
http://dodin.org/piwigo/picture.php?/150576-document/category/5701
avec W10 et FF, ça donne :
- si FF est réglé pour afficher les PDF : la transcription est bien
affichée dans FF
-si FF est régler pour télécharger, c'est le fac-simile qui est
téléchargé et pas la transcription .
--
Et c'est ainsi que MELMOTH est infiniment Grand !
ça donne quoi? une page blanche? si oui tu clique sur l'icone de disquette et tu le télécharge
Sur ce lien : http://dodin.org/luciendodin/index.php?n=Histoire.Photographie Si on clique sur la transcription : http://dodin.org/piwigo/picture.php?/150576-document/category/5701 avec W10 et FF, ça donne : - si FF est réglé pour afficher les PDF : la transcription est bien affichée dans FF -si FF est régler pour télécharger, c'est le fac-simile qui est téléchargé et pas la transcription . -- Et c'est ainsi que MELMOTH est infiniment Grand !
Alf92
Ghost-Raider (le 28/04/2020 à 10:12:30) :
avec W10 et FF, ça donne : - si FF est réglé pour afficher les PDF : la transcription est bien affichée dans FF -si FF est régler pour télécharger, c'est le fac-simile qui est téléchargé et pas la transcription .
où modifies-tu ce réglage ?
Ghost-Raider (le 28/04/2020 à 10:12:30) :
avec W10 et FF, ça donne :
- si FF est réglé pour afficher les PDF : la transcription est bien
affichée dans FF
-si FF est régler pour télécharger, c'est le fac-simile qui est
téléchargé et pas la transcription .
avec W10 et FF, ça donne : - si FF est réglé pour afficher les PDF : la transcription est bien affichée dans FF -si FF est régler pour télécharger, c'est le fac-simile qui est téléchargé et pas la transcription .
où modifies-tu ce réglage ?
Ghost-Raider
Le 28/04/2020 à 10:40, Alf92 a écrit :
Ghost-Raider (le 28/04/2020 à 10:12:30) :
avec W10 et FF, ça donne : - si FF est réglé pour afficher les PDF : la transcription est bien affichée dans FF -si FF est régler pour télécharger, c'est le fac-simile qui est téléchargé et pas la transcription .
où modifies-tu ce réglage ?
Dans FF : Outils/Options/Fichiers et applications/Application/ Portable Document Format : mettre : Aperçu dans Firefox. -- Et c'est ainsi que MELMOTH est infiniment Grand !
Le 28/04/2020 à 10:40, Alf92 a écrit :
Ghost-Raider (le 28/04/2020 à 10:12:30) :
avec W10 et FF, ça donne :
- si FF est réglé pour afficher les PDF : la transcription est bien
affichée dans FF
-si FF est régler pour télécharger, c'est le fac-simile qui est
téléchargé et pas la transcription .
où modifies-tu ce réglage ?
Dans FF : Outils/Options/Fichiers et applications/Application/ Portable
Document Format : mettre : Aperçu dans Firefox.
--
Et c'est ainsi que MELMOTH est infiniment Grand !
avec W10 et FF, ça donne : - si FF est réglé pour afficher les PDF : la transcription est bien affichée dans FF -si FF est régler pour télécharger, c'est le fac-simile qui est téléchargé et pas la transcription .
où modifies-tu ce réglage ?
Dans FF : Outils/Options/Fichiers et applications/Application/ Portable Document Format : mettre : Aperçu dans Firefox. -- Et c'est ainsi que MELMOTH est infiniment Grand !