Google continue de développer les capacités de son intelligence artificielle DeepMind. Celle qui a réussi à battre le champion du monde de jeu de Go, est ainsi désormais capable de lire sur les lèvres des humains.

W10-Windows-Holographic

DeepMind serait ainsi capable de proposer une transcription en temps réel des paroles humaines sans même les entendre, simplement en analysant les mouvements de la bouche et de la langue. L'IA de Google se débrouillerait actuellement déjà mieux que les professionnels.

Son apprentissage a été mené avec des milliers d'heures d'émissions de chaînes de télévision. 5000 heures de vidéo pour 118 000 phrases analysées et enregistrées dans sa base de données. Sur des programmes inconnus de l'IA, DeepMind a obtenu un taux de réussite de 46,8% des mots quand, dans le même temps, un professionnel n'a obtenu qu'un score de 12,4%.

On imagine que cette faculté pourra être utilisée dans les réseaux de caméras de surveillance, notamment pour suivre des conversations suspectes. Mais dans un domaine qui nous touche plus directement, on pourrait voir des systèmes de reconnaissance vocale plus perfectionnés, notamment dans les environnements bruyants.

Source : New Scientist