Cette technologie est donc loin d'être étrangère à Google qui a annoncé mercredi l'acquisition pour un montant non communiqué de la société reCAPTCHA. Cette dernière fournit une protection CAPTCHA contre le spam et la fraude à plus de 100 000 sites Web. Néanmoins, si Google paraît intéressé par CAPTCHA, ce n'est pas uniquement dans un souci de sécurité mais aussi pour améliorer son processus de numérisation de livres.
" Les mots dans beaucoup de CAPTCHA fournis par reCAPTCHA proviennent de la numérisation de journaux ou de livres anciens. Les ordinateurs ont du mal à reconnaître ces mots parce que l'encre et le papier ont été dégradés avec le temps, mais en les tapant dans un CAPTCHA, les internautes apprennent aux ordinateurs comment lire du texte numérisé "
, indique Google sur son blog officiel. La firme de Mountain View escompte ainsi des avancées en matière de reconnaissance optique des caractères ( OCR ) utilisée par Google Livres.