Yahoo!-Visualizing-mots-cles Il y a quelques jours, Yahoo! a mis en ligne l'outil Yahoo! Visualizing. Ce dernier a pour but de montrer comme Yahoo! tire parti du cloud computing et de la technologie Apache Hadoop  ( framework open source pour le traitement massif de données ) afin de filtrer le spam et re-router les emails des plus de 300 millions d'utilisateurs de Yahoo! Mail à travers le monde.

Yahoo! Visualizing présente une carte interactive qui permet d'obtenir diverses données statistiques en quasi temps réel. Toutes ces données sont anonymisées. On pourra par exemple savoir combien d'emails sont traités par seconde. Une moyenne qui oscille aux alentours des 70 000 messages par seconde.

Il est possible de zoomer afin d'affiner les données sur une région géographique particulière. Des données de spam sont fournies, et un panneau à gauche est à déployer pour obtenir des tendances sur des mots clés ( à l'exception du Royaume-Uni, Allemagne, Italie, Espagne et France ). Cette dernière possibilité a tapé dans l'œil aiguisé de Owni.fr.

Pour Owni.fr, avec Yahoo! Visualizing, Yahoo! avoue tout simplement lire les emails des utilisateurs. Interrogé, le responsable juridique de Yahoo! Europe a préféré évoquer des systèmes automatiques - et donc non humains - qui analysent les messages notamment à des fins de lutte contre le spam.

Le procédé n'est pas l'apanage de Yahoo! Mail, puisque Gmail analyse par exemple le " texte des messages afin de filtrer les spams et détecter les virus " comme on peut le lire dans le centre de confidentialité de Google où il est aussi écrit :

" Le système de filtrage Gmail permet également d'analyser les mots clés contenus dans les e-mails afin de cibler l'audience des annonces diffusées. Le processus de diffusion d'annonces en rapport avec le contenu Gmail est entièrement automatisé et ne nécessite aucune intervention humaine. "

Si la pratique n'est pas forcément illégale, elle risque de susciter le débat maintenant qu'elle est devenue plus visible. Des mots clés pour un email, ce n'est quand même pas tout à fait la même chose que pour un moteur de recherche même si la lecture est faite par des robots.

Source : Owni.fr