CAPTCHA pour améliorer Google Livres !

Le par  |  4 commentaire(s)
Google-Captcha

Google annonce le rachat de la société reCAPTCHA et compte notamment tirer parti de la technologie CAPTCHA pour son polémique projet de numérisation de livres.

Google-CaptchaLa technologie CAPTCHA est connue de pratiquement tous les internautes. Pour l'ouverture d'un compte Gmail par exemple, l'utilisateur doit au préalable élucider un CAPTCHA, à savoir une image contenant divers caractères que seul un être humain est a priori capable de reconnaître. Cette mesure de sécurité permet de lutter contre les spammeurs afin d'éviter qu'ils ne se constituent de manière automatisée une base de données d'adresses mail qui serviront à l'envoi massif de messages non sollicités.

Cette technologie est donc loin d'être étrangère à Google qui a annoncé mercredi l'acquisition pour un montant non communiqué de la société reCAPTCHA. Cette dernière fournit une protection CAPTCHA contre le spam et la fraude à plus de 100 000 sites Web. Néanmoins, si Google paraît intéressé par CAPTCHA, ce n'est pas uniquement dans un souci de sécurité mais aussi pour améliorer son processus de numérisation de livres.

" Les mots dans beaucoup de CAPTCHA fournis par reCAPTCHA proviennent de la numérisation de journaux ou de livres anciens. Les ordinateurs ont du mal à reconnaître ces mots parce que l'encre et le papier ont été dégradés avec le temps, mais en les tapant dans un CAPTCHA, les internautes apprennent aux ordinateurs comment lire du texte numérisé "

, indique Google sur son blog officiel. La firme de Mountain View escompte ainsi des avancées en matière de reconnaissance optique des caractères ( OCR ) utilisée par Google Livres.

Complément d'information

Vos commentaires

Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Le #521151

Google, toujours une longueur d'avance <img src="/img/emo/cool.gif" alt="8:" />
Le #521281
Je comprends pas en quoi l'internaute aide à lire du texte numérisé... Chaque captcha proposé est déjà associé à un mot, non ? :?
Le #521291
Ba en gros, quand les bots chargés de la numérisation ont un doute sur un mot qu'ils n'arrivent à lire, ils le balancent en captcha sur quelques sites parmi les 100 000 utilisant la techno captcah. On parle de sites utilisant la même langue que celle du livre évidement.
Grace aux mots proposés le plus souvent par les utilisateurs, le bot en déduit le bon orthographe qu'il n'arrivait à déchiffrer >ou comment les gens qui utilisent à longueur de journée les captcha travaille en meme temps pour Google <img src="/img/emo/cool.gif" alt="8:" />

superbe <img src="/img/emo/cool.gif" alt="8:" /> ²
Le #954961
superlag>ok, mais comment fait il pour savoir que ce qui est entré par l'utilisateur est correct s'il ne sait pas lui meme ce qui est écrit et donc, s'il ne peut pas vérifier ?

Ou alors l'utilisateur aurait plusieurs réponses possibles ?

Merci
Suivre les commentaires
Poster un commentaire
Anonyme
:) ;) :D ^^ 8) :| :lol: :p :-/ :o :w00t: :roll: :( :cry: :facepalm:
:andy: :annoyed: :bandit: :alien: :ninja: :agent: :doh: :@ :sick: :kiss: :love: :sleep: :whistle: =]