OVH Cloud OVH Cloud

Photo de registres en nombre!

112 réponses
Avatar
Thierry Houx
Alors voilà, pour mon association, nous faisons des photos de registres
dans les mairies, archives? etc.
Nos photos sont faites souvent en conditions difficiles: Eclairage
artificiel, lumières parasites, ...
Vous avez bien compris que deux choses sont essentielles, la netteté et
la lisibilité du document obtenu.
Comme le documents originel doit être systématiquement corrigé pour
obtenir le résultat ci-dessus attendu, je cherche un outil en mesure de
faire ça par lots: J'ai actuellement 66.000 clichés à traiter.

Un exemple de document (loin d'être le plus mauvais):
https://www.cjoint.com/c/HAmhaagXuFi

10 réponses

Avatar
yamo'
Salut,
Elephant Man a écrit le 12/01/2018 à 16:01 :
Le 12/01/2018 à 14:26, Markorki a écrit :
Bonjour, Mr Elephant Man
Il a oublié la politese formelle, mais les habitués le connaissent et
peuvent
s'en passer.
Je te salue, Thierry Houx !!
Quant à l'intransigeance et la brutalité , j'ai beaucoup plus de mal.

Bonjour.
Il s'agissait d'une usurpation de l'utilisateur qui se fait habituellement
appeler Santa Claup, je l'ai d'ailleurs annulée. Mais comme vous passez
par Gegeweb vous ne verrez pas ma réponse et je ne sais pas comment
décoder votre adresse. Bref, changez de serveur :)

Je cite tel quel.
Si il y a eu d'y avoir une réponse, je propose fr.usenet.divers car on
risque d'être HS.
--
Stéphane
Avatar
Hic
On Sat, 13 Jan 2018 05:41:11 +0100, Thierry Houx
wrote:
Le 12/01/2018 à 19:40, GhostRaider a écrit :
Le 12/01/2018 à 19:07, Alf92 a écrit :
Stephane Legras-Decussy :
Le 12/01/2018 17:40, GhostRaider a écrit :

Une autre méthode Pisasieste :
https://www.cjoint.com/doc/18_01/HAmqN4z7i4X_P1260838-003.JPG

là c'est 10x moins lisible que l'original

en fait je ne vois pas trop l'interet de traiter ces documents.
en vrai ils ne sont certainement pas plus lisibles qu'en photo.
et de toute manière ils ne serviront à rien d'autre qu'à une
consultation par un homme, ce dernier disposant de toute évidence d'un
algo de compréhension bien supérieur à celui d'une machine.

Le gros problème, c'est que les deux qui nous sont montrés ont été
photographiés par des personnes qui ne savent pas photographier :
éclairage dissymétrique, planéité non respectée, mauvais contraste de
l'encre sur le papier.
On ne pourra pas faire grand chose de propre.

Non, avec cet outil:
https://clic-archives.fr/
Mais on est d'accord sur les conditions de la prise de vue, et la
qualité du document, certains dépassent allègrement les 400 ans
conservés dans des conditions pas idéales.
Par contre, il est clair qu'on passe un minimum de temps sur un cliché,
quelques secondes. Un séance représente en moyenne 800 à 1000 clichés.
La nécessité, c'est de retravailler le fichier pour en accroître la
lisibilité: Le releveur s'use les yeux à décrypter le contenu; il faut
s'imaginer faire plusieurs dizaines de pages jour de ce type.
En fait, si je suis bien le débat, il existe bien des programmes batch,
mais ce que je recherche est trop "extrème" pour un traitement
automatique. Je vais faire des déçus.

Ce que tu demandes, est un script
certain le font à partir d'opérations manelles
sur logiciels quelquonques
Avatar
Thierry Houx
Le 13/01/2018 à 09:54, René a écrit :
Avec 3 cartons plume et du ruban gommé il est facile de construire une boite autour de l'espace de travail qui bloquera les éclairages ambiants. Un autre carton doit fermer le dessus et si nécessaire un 5e sera élevé ou baissé devant l'ouverture pour chaque prise de vue. Pouvez-vous emprunter un isoloir de votation? Carton plume sur le haut coton blanc sur les cotés.
René

C'est quelque chose de réalisable, il reste à le garder pratique et peu
encombrant, vu que c'est un travail itinérant: Je vais creuser.
Nous avons à faire à des documents de taille très variable, ainsi que de
qualité.
Avec cette préconisation, on éviterait ainsi la lumière parasite,
notamment pour les documents durs à décrypter, comme cet exemple (encre
à travers le papier):
https://www.cjoint.com/c/HAnj1oDyXii
Avatar
Thierry Houx
Le 13/01/2018 à 10:40, Hic a écrit :
On Sat, 13 Jan 2018 05:41:11 +0100, Thierry Houx
wrote:
Le 12/01/2018 à 19:40, GhostRaider a écrit :
Le 12/01/2018 à 19:07, Alf92 a écrit :
Stephane Legras-Decussy :
Le 12/01/2018 17:40, GhostRaider a écrit :

Une autre méthode Pisasieste :
https://www.cjoint.com/doc/18_01/HAmqN4z7i4X_P1260838-003.JPG

là c'est 10x moins lisible que l'original

en fait je ne vois pas trop l'interet de traiter ces documents.
en vrai ils ne sont certainement pas plus lisibles qu'en photo.
et de toute manière ils ne serviront à rien d'autre qu'à une
consultation par un homme, ce dernier disposant de toute évidence d'un
algo de compréhension bien supérieur à celui d'une machine.

Le gros problème, c'est que les deux qui nous sont montrés ont été
photographiés par des personnes qui ne savent pas photographier :
éclairage dissymétrique, planéité non respectée, mauvais contraste de
l'encre sur le papier.
On ne pourra pas faire grand chose de propre.

Non, avec cet outil:
https://clic-archives.fr/
Mais on est d'accord sur les conditions de la prise de vue, et la
qualité du document, certains dépassent allègrement les 400 ans
conservés dans des conditions pas idéales.
Par contre, il est clair qu'on passe un minimum de temps sur un cliché,
quelques secondes. Un séance représente en moyenne 800 à 1000 clichés.
La nécessité, c'est de retravailler le fichier pour en accroître la
lisibilité: Le releveur s'use les yeux à décrypter le contenu; il faut
s'imaginer faire plusieurs dizaines de pages jour de ce type.
En fait, si je suis bien le débat, il existe bien des programmes batch,
mais ce que je recherche est trop "extrème" pour un traitement
automatique. Je vais faire des déçus.

Ce que tu demandes, est un script
certain le font à partir d'opérations manelles
sur logiciels quelquonques

Oui, et les opérations manuelles peuvent être automatisées, mode
apprentissage macro; l'idéal serait que logiciel puisse analyser le
contenu, afin d'appliquer une correction adaptée.
Avatar
Hic
On Sat, 13 Jan 2018 10:40:29 +0100, Hic wrote:
On Sat, 13 Jan 2018 05:41:11 +0100, Thierry Houx
wrote:
Le 12/01/2018 à 19:40, GhostRaider a écrit :
Le 12/01/2018 à 19:07, Alf92 a écrit :
Stephane Legras-Decussy :
Le 12/01/2018 17:40, GhostRaider a écrit :

Une autre méthode Pisasieste :
https://www.cjoint.com/doc/18_01/HAmqN4z7i4X_P1260838-003.JPG

là c'est 10x moins lisible que l'original

en fait je ne vois pas trop l'interet de traiter ces documents.
en vrai ils ne sont certainement pas plus lisibles qu'en photo.
et de toute manière ils ne serviront à rien d'autre qu'à une
consultation par un homme, ce dernier disposant de toute évidence d'un
algo de compréhension bien supérieur à celui d'une machine.

Le gros problème, c'est que les deux qui nous sont montrés ont été
photographiés par des personnes qui ne savent pas photographier :
éclairage dissymétrique, planéité non respectée, mauvais contraste de
l'encre sur le papier.
On ne pourra pas faire grand chose de propre.

Non, avec cet outil:
https://clic-archives.fr/
Mais on est d'accord sur les conditions de la prise de vue, et la
qualité du document, certains dépassent allègrement les 400 ans
conservés dans des conditions pas idéales.
Par contre, il est clair qu'on passe un minimum de temps sur un cliché,
quelques secondes. Un séance représente en moyenne 800 à 1000 clichés.
La nécessité, c'est de retravailler le fichier pour en accroître la
lisibilité: Le releveur s'use les yeux à décrypter le contenu; il faut
s'imaginer faire plusieurs dizaines de pages jour de ce type.
En fait, si je suis bien le débat, il existe bien des programmes batch,
mais ce que je recherche est trop "extrème" pour un traitement
automatique. Je vais faire des déçus.

Ce que tu demandes, est un script
certain le font à partir d'opérations manelles
sur logiciels quelquonques

pour continuer ,je n'ai jamais assigné de script sur des fichiers
differents ni vu la rapidité à toi de vérifier!
un script avec irfanview,
qui contient smartcouve en interne,
te donne acces à un traitement complet
rvb ,tonalité, lighness,brightnes, saturation ,YCbCR
ainsi qu'au batch intégré
rapide, je ne sais pas mais c'est le plus leger
Avatar
Hic
On Sat, 13 Jan 2018 10:59:15 +0100, Thierry Houx
wrote:
Le 13/01/2018 à 10:40, Hic a écrit :
On Sat, 13 Jan 2018 05:41:11 +0100, Thierry Houx
wrote:
Le 12/01/2018 à 19:40, GhostRaider a écrit :
Le 12/01/2018 à 19:07, Alf92 a écrit :
Stephane Legras-Decussy :
Le 12/01/2018 17:40, GhostRaider a écrit :

Une autre méthode Pisasieste :
https://www.cjoint.com/doc/18_01/HAmqN4z7i4X_P1260838-003.JPG

là c'est 10x moins lisible que l'original

en fait je ne vois pas trop l'interet de traiter ces documents.
en vrai ils ne sont certainement pas plus lisibles qu'en photo.
et de toute manière ils ne serviront à rien d'autre qu'à une
consultation par un homme, ce dernier disposant de toute évidence d'un
algo de compréhension bien supérieur à celui d'une machine.

Le gros problème, c'est que les deux qui nous sont montrés ont été
photographiés par des personnes qui ne savent pas photographier :
éclairage dissymétrique, planéité non respectée, mauvais contraste de
l'encre sur le papier.
On ne pourra pas faire grand chose de propre.

Non, avec cet outil:
https://clic-archives.fr/
Mais on est d'accord sur les conditions de la prise de vue, et la
qualité du document, certains dépassent allègrement les 400 ans
conservés dans des conditions pas idéales.
Par contre, il est clair qu'on passe un minimum de temps sur un cliché,
quelques secondes. Un séance représente en moyenne 800 à 1000 clichés.
La nécessité, c'est de retravailler le fichier pour en accroître la
lisibilité: Le releveur s'use les yeux à décrypter le contenu; il faut
s'imaginer faire plusieurs dizaines de pages jour de ce type.
En fait, si je suis bien le débat, il existe bien des programmes batch,
mais ce que je recherche est trop "extrème" pour un traitement
automatique. Je vais faire des déçus.

Ce que tu demandes, est un script
certain le font à partir d'opérations manelles
sur logiciels quelquonques

Oui, et les opérations manuelles peuvent être automatisées, mode
apprentissage macro; l'idéal serait que logiciel puisse analyser le
contenu, afin d'appliquer une correction adaptée.

il te suffit de choisir un logiciel qui fait des corrections
automatiques
mais tu testes,
pour moi automatique veut dire hazardeux :-)
smartcurve le fait aussi mais le problème doit resté simple,
parfois il me sert d'optimisateur aprés opération manuellle, mais
l'effet n'est pas garantie
Avatar
GhostRaider
Le 12/01/2018 à 22:31, Jean_ a écrit :
Alf92 avait soumis l'idée :
par un homme, ce dernier disposant de toute évidence d'un
algo de compréhension bien supérieur à celui d'une ....

Sexiste ! ;-)

Non, spéciste, ou plutôt, machiniste...
Avatar
GhostRaider
Le 13/01/2018 à 06:07, Thierry Houx a écrit :
Le 12/01/2018 à 23:26, René a écrit :
Le vendredi 12 janvier 2018 09:45:47 UTC-5, Thierry Houx a écrit :
Le 12/01/2018 à 14:20, Stephane Legras-Decussy a écrit :
Le 12/01/2018 08:01, Thierry Houx a écrit :
Un exemple de document (loin d'être le plus mauvais):
https://www.cjoint.com/c/HAmhaagXuFi


https://www.cjoint.com/c/HAmoNHzCWFi
Je ne me vois pas traiter les photos même par petits lots; à terme nous
comptons avoir plus de 300.000 clichés, voire plus si de nouveaux
besoins ou découvertes.

Éclairage irrégulier et trop jaune, document non plat, écriture de
densité variable.
Au nombre de documents il serait bon de se préparer à fond. 2 ou 4
sources flashes ou fluocompacts avec diffuseurs. Une tente en rideau
blanc pour masquer les éclairages parasites. Un support fixe et stable
pour l'APN. Une carte grise/couleurs pro ou des échantillons du
marchand de couleur. Si possible un ordi pour contrôler l'APN et ne
pas lui toucher. Celui-ci permet aussi de voir si la photo d'un
document doit être reprise immédiatement en plus pâle ou plus foncé.
Sur la table un tapis ou papier blanc fixé permettant de centrer les
documents vite et bien. Des gants blancs en coton...

On a acheté un outil facilitant la prise de vue, car effectivement au
début c'était l'APN, et c'était franchement fastidieux:
https://clic-archives.fr/

Ça a l'air pas mal du tout, sauf que l'éclairage zénithal par 8 leds
ponctuelles est mauvais par principe.
Il occasionne des zones centrales mieux éclairées que les zones
périphériques.
Comme dit rené, il faut deux, voire quatre éclairages latéraux, bien
larges, pas ponctuels.
Utiliser un APN à flash automatique, comme un réflex Nikon, donnerait
les meilleurs résultats.
A défaut : intercaler une feuille de plastique translucide entre les
leds et le document.
La difficulté c'est qu'en fonction de l'endroit, on n'est pas maître de
la lumière et de la place qui nous est octroyée.
L'outil fournit un éclairage LED, qui est très bien tant qu'il n'a pas
d'éclairage de néons par exemple, et je ne me vois pas demander au
secrétaire de mairie d'éteindre pour qu'on puisse travailler.

Si, c'est la seule solution, ou alors, entourer le statif d'un écran
pour éliminer tous les autres éclairages : néons, fenêtres etc.
Une solution serait deux flashes latéraux à 45° avec interposition d'une
feuille de plastique translucide, dont la puissance éliminerait les
lumières parasites tout en assurant la meilleure définition.
Voir le fameux diffuseur "Picard Surgelés".
Installer tout son "kit" et faire des photos tests pour régler tous
les paramètres d'un lot de documents semblables. Bloquer l'apn en mode
manuel. Collant sur l'objectif pour éviter que les vibrations changent
le focus ou le zoom... si le focus peut être constant. Ouverture pour
une profondeur de champs couvrant la courbure de certains documents et
pour le meilleur piqué. Photo 1: une feuille blanche inscrite des
références nécessaire. Photo 2: la carte grise pour les corrections
finales sur ordi. Et vient la série de photos toutes pareilles.. >>
Les ajustements sur ordi peuvent être de 2 genres: texte lisible ou
reproduction de document ancien (Ou les 2) Les corrections se font sur
la photo de la carte grise/couleurs (à défaut le fond blanc) puis
s'appliquent automatiquement sur la série comme plusieurs ont commenté.
Lorsque les documents sont de dimensions variées il faut parfois
ajouter une réglette sur la table (et dans la photo) permettant d'en
connaitre les dimensions. Il se peut aussi que certains documents
doivent être finalisés de 2 manières: 1) voir et évaluer l'état d'un
document ancien 2) lire texte et image de ce document. Ce qui peut
demander de faire 2 poses différentes.
Quoi qu'il en soit, surtout à cause du très grand nombre de documents
à photographier, je pense qu'une préparation parfaite apportera une
grande économie de temps et garantira de ne pas avoir à reprendre la
pose de documents plus difficiles.


Tout cela est parfaitement justifié.
Merci René, on va étudier ces propositions, et faire des essais; puis
rédiger une procédure. J'entrevois une possibilité dans ce qui est
évoqué et c'est un progrès net par rapport à notre situation actuelle.
Avatar
Den
Thierry Houx wrote:
les documents durs à décrypter, comme cet exemple (encre
à travers le papier):
https://www.cjoint.com/c/HAnj1oDyXii

J'ai aussi ce problème lors de la photocopie de documents recto-verso :
le recto apparaît en transparence sur le recto. Pour palier ce problème,
je mets un carton gris moyen derrière la page que je veux copier : le
contraste du verso est alors réduit, donc la lecture du verso vient
moins parasiter celle du recto.
Si ça peut aider...
Den
Avatar
GhostRaider
Le 12/01/2018 à 08:01, Thierry Houx a écrit :
Alors voilà, pour mon association, nous faisons des photos de registres
dans les mairies, archives? etc.
Nos photos sont faites souvent en conditions difficiles: Eclairage
artificiel, lumières parasites, ...
Vous avez bien compris que deux choses sont essentielles, la netteté et
la lisibilité du document obtenu.
Comme le documents originel doit être systématiquement corrigé pour
obtenir le résultat ci-dessus attendu, je cherche un outil en mesure de
faire ça par lots: J'ai actuellement 66.000 clichés à traiter.

Le gros problème des exemples que tu nous as fournis, c'est
l'irrégularité de l'éclairage qui parfois dépasse le contraste local de
l'encre pâle sur un fond à peine plus clair.
C'est un défaut majeur, mais il va falloir faire avec.
https://www.cjoint.com/data/HAmhaagXuFi_P1260838.JPG
https://www.cjoint.com/data/HAmoNHzCWFi_P1310721.JPG
https://www.cjoint.com/data/HAnj1oDyXii_Longueil-1770-009.JPG
L'idéal serait de rééquilibrer ce déséquilibre d'éclairage (par Picasa
ou autre) avant tout traitement, mais ces milliers de clichés ne peuvent
évidemment pas être repris un par un car ce déséquilibre n'est
certainement pas constant.
Il te faut donc une méthode qui te permette d'exploiter au mieux, et par
lot, ces nombreux fichiers en acceptant certains défauts sans que le but
initial de lisibilité soit oublié.
Je te propose d'utiliser DxO Optics Pro 11 (gratuit).
Ce logiciel comporte 36 préréglages dont le résultat est affiché sous
forme de vignette.
Pour tes clichés, celui qui semble le plus adapté est HDR noir et blanc.
En un clic, la photo est traitée et sauvegardée.
On peut traiter chaque photo individuellement, ou faire une
multi-sélection. Dans ce cas, tout le lot sera traité en un clic. Ça
peut donc aller très vite.
Certaines zones restent un peu sombres, mais pour mieux les lire, il
suffit, lors de l'affichage sur écran, de déplacer le curseur de
luminosité, comme tu peux le vérifier ci-après.
Ça donne ceci :
https://www.cjoint.com/doc/18_01/HAnmrFXtrZX_P1260838-DxO-HDR-N-B.jpg
https://www.cjoint.com/doc/18_01/HAnmsqvjStX_P1310721-DxO-HDR-N-B.jpg
https://www.cjoint.com/doc/18_01/HAnms4DPvxX_Longueil-1770-009-DxO-HDR-N-B.jpg
Le destinataire peut donc recevoir le fichier original et le fichier DxO
dont il peut éventuellement améliorer la lecture de certaines zones par
une opération simple de déplacement d'un curseur.