Baptisé M2M-100, ce modèle d'IA est présenté par Facebook comme le premier modèle de traduction automatique multilingue capable de traduire 100 langues vers 100 autres langues, sans s'appuyer sur des données en anglais.

" Lors de la traduction, par exemple du chinois vers le français, les meilleurs modèles multilingues précédents s'entraînent sur le chinois vers l'anglais et l'anglais vers le français parce que les données d'entraînement en anglais sont les plus largement disponibles ", explique Facebook AI.

" Notre modèle s'entraîne directement sur les données du chinois vers le français pour mieux en préserver le sens. " Avec l'algorithme BLEU d'évaluation de la qualité d'un texte traduit par traduction automatique, Facebook AI vante dix points de mieux par rapport aux systèmes centrés sur l'anglais.

facebook-ai-traduction-automatique facebook-ai-traduction-automatique-m2m-100

Pour son modèle, Facebook a créé un jeu de données de 7,5 milliards de paires de phrases dans 100 langues. Le modèle a été entraîné avec plus de 15 milliards de paramètres.

Facebook ne prévoit pas pour le moment d'utiliser le modèle M2M-100 dans ses produits. Il est mis en open source pour la recherche, ainsi que le jeu de données utilisé.