Google-Captcha La technologie CAPTCHA est connue de pratiquement tous les internautes. Pour l'ouverture d'un compte Gmail par exemple, l'utilisateur doit au préalable élucider un CAPTCHA, à savoir une image contenant divers caractères que seul un être humain est a priori capable de reconnaître. Cette mesure de sécurité permet de lutter contre les spammeurs afin d'éviter qu'ils ne se constituent de manière automatisée une base de données d'adresses mail qui serviront à l'envoi massif de messages non sollicités.

Cette technologie est donc loin d'être étrangère à Google qui a annoncé mercredi l'acquisition pour un montant non communiqué de la société reCAPTCHA. Cette dernière fournit une protection CAPTCHA contre le spam et la fraude à plus de 100 000 sites Web. Néanmoins, si Google paraît intéressé par CAPTCHA, ce n'est pas uniquement dans un souci de sécurité mais aussi pour améliorer son processus de numérisation de livres.

" Les mots dans beaucoup de CAPTCHA fournis par reCAPTCHA proviennent de la numérisation de journaux ou de livres anciens. Les ordinateurs ont du mal à reconnaître ces mots parce que l'encre et le papier ont été dégradés avec le temps, mais en les tapant dans un CAPTCHA, les internautes apprennent aux ordinateurs comment lire du texte numérisé "

, indique Google sur son blog officiel. La firme de Mountain View escompte ainsi des avancées en matière de reconnaissance optique des caractères ( OCR ) utilisée par Google Livres.