Imaginez : vous entrez une requête, le système récupère les informations correspondant à cette demande dans toutes les langues pratiquées sur le globe terrestre et fournit en retour une réponse synthétique dans votre propre langue.

IARPA logo Ce traducteur universel digne de Star Trek, la IARPA (Intelligence Advanced Research Projects Agency) espère bien le concrétiser prochainement pour en faire un outil au service des agences gouvernementales US (mais pas seulement) et cherche des partenaires pour lui donner vie.

Sachant qu'un peu moins de la moitié des informations du Web ne sont pas en langue anglaise, une grande masse de données ne peut être exploitée correctement dans les outils de recherche d'information.

MATERIAL (Machine Translation for English Retrieval of Information in Any Language) est un projet de type "English-in, English-out", à savoir que la requête est entrée en anglais, de même que son résultat après traitement et traduction depuis les données trouvées dans d'autres langues et pas forcément directement disponibles dans la langue de Shakespeare.

Pour éviter de crouler sous une quantité d'information ingérable, la requête sera formulée en deux étapes, la première définissant un domaine (santé, science, etc) tandis que la seconde sera l'objet proprement dit de la recherche.

Pour mener à bien le projet MATERIAL, la IARPA indique qu'une vaste équipe pluri-disciplinaire est nécessaire dans des domaines divers comme le traitement du langage, la sémantique ou le machine learning et elle invite les universités et instituts de recherche du monde entier à se manifester, avec la perspective d'une publication de leurs travaux dans de prestigieuses revues scientifiques.

Les résultats de ce grand projet de traducteur universel devraient donc au moins en partie être accessibles à tous, avec des applications qui promettent déjà d'ouvrir de nouvelles perspectives en permettant d'exploiter des ressources habituellement peu utilisées.

Source : Ars Technica