Microsoft et Alibaba ont chacun créé une intelligence artificielle capable de lire un document et répondre à des questions, aussi bien voire même mieux qu'un être humain. Tous deux se disputent ainsi la première place au Stanford Question Answering Dataset (SQuAD).

Le SQuAD est présenté comme un ensemble de données de compréhension en lecture composé de questions sur un ensemble d'articles de Wikipédia. Pour plus de 500 articles de l'encyclopédie libre, ce sont 100 000 questions et réponses .

La réponse à chaque question est une portion du passage de lecture correspondant. On comprendra alors que l'exercice implique des réponses factuelles.

Le 3 janvier, Microsoft a soumis un modèle qui a obtenu un score de 82,650 points en fournissant des réponses exactes à des questions. Un système d'Alibaba a par la suite réalisé un score de 82,440. Sur le même ensemble de questions et réponses, le score humain a été de 82,304 points.

Alibaba explique que pour une question du type " Quelles sont les causes de la pluie ? ", son modèle a pu localiser avec exactitude des phrases précises contenant des réponses potentielles.

Dans un billet de blog, Microsoft écrit déjà mettre en pratique des versions préliminaires de son modèle dans son moteur de recherche Bing, et travaille pour une application sur des problèmes complexes.