Microsoft Research développe actuellement un logiciel capable d'apprendre le son et les intonations d'une voix afin de la restituer et la faire parler dans une autre langue grâce à une traduction qui couvre pour le moment 26 langues.

Cette technologie de reconnaissance vocale pourrait donner la possibilité aux utilisateurs de communiquer dans une langue qu'ils ne maîtrisent pas bien lorsqu'ils sont dans un pays étranger. Microsoft Research y voit également un intérêt pour l'apprentissage des langues, dans la mesure où il est plus motivant et simple d'imiter sa propre voix lorsqu'elle parle dans une autre langue.

Le système a besoin d'environ une heure d'entraînement pour obtenir un modèle capable de lire n'importe quel texte avec la propre voix de l'utilisateur. Baptisé Monolingual TTS, le système permet par ailleurs de créer une image 3D de la tête d'une personne pour la faire parler dans une autre lange.

Microsoft-Research-Monolingual-TTS

L'approche de Google est différente puisqu'il s'agit de parler dans sa langue maternelle dans un microphone pour obtenir une traduction dans une autre langue mais avec une voix synthétique.