Le groupe Microsoft est parvenu à créer une système de traduction automatique du chinois à l'anglais capable de traduire des titres de presse et des articles avec la même efficacité qu'un être humain.
Le système a été testé avec succès sur un ensemble de données de référence, baptisé newstest2017 et destiné à évaluer l'efficacité de tels systèmes automatiques de traduction de diverses langues vers l'anglais.
Le système de traduction aurait donc atteint un état de parité avec l'humain et fait suite à l'annonce l'an dernier de cette même parité humaine avec un système de reconnaissance vocale.
C'est d'ailleurs une nouvelle fois Xuedong Huang, déjà impliqué dans ce projet, qui se félicite de ce succès, même s'il ne s'agit en fait que d'une première étape dans une quête qui anime les chercheurs depuis des décennies et comporte toujours des obstacles, notamment pour faire fonctionner la traduction en conditions réelles et non plus seulement avec des données de référence soigneusement choisies.
Le but sera maintenant de parvenir à obtenir une aussi bonne qualité de traduction pour des textes plus complexes avec un vocabulaire moins courant et des tournures plus complexes que celles trouvées dans les articles de presse courants.
Une IA qui travaille comme un humain
Les technologies développées pourront cependant déjà être intégrées dans les outils de traduction de Microsoft. On retrouve ici des techniques d'intelligence artificielle à base de réseaux neuronaux profonds permettant de prendre en compte une plus grande profondeur de contexte pour une traduction plus naturelle.
Ces techniques, dont celle du dual learning (une traduction des phrases dans les deux sens) reprennent d'ailleurs la façon de travailler d'un traducteur humain en reprenant et en améliorant peu à peu les traductions jusqu'à obtenir un résultat jugé satisfaisant.
Pour vérifier la qualité de traduction du système, Microsoft a recruté des experts bilingues chargés d'évaluer les données produites face aux mêmes traductions réalisées par des humains, notamment pour vérifier le champ des nuances des traductions données en fonction des termes et des tournures utilisées.
Le rêve est bien sûr d'arriver un jour, peut-être, à mettre en place un système capable de traduire n'importe quelle langue dans n'importe quelle autre avec une qualité et quelque soit le contexte.