En début d'année, la firme DeepMind confrontrait AlphaStar, son IA conçue pour jouer à StarCraft 2 aux meilleurs joueurs mondiaux. Depuis, l'intelligence artificielle a été encore améliorée et sa dernière évolution, AlphaStar Final, est désormais capable de jouer en ligue grand-maître et de battre la quasi-totalité des joueurs humains quelle que soit la race choisie (Protoss, Terran ou Zerg).

Un article publié dans la revue Nature décrit la méthode et les efforts réalisés pour parvenir à ce résultat. L'un des éléments impressionnants est que AlphaStar Final réalise ses parties dans des conditions "humaines", avec un nombre de coups limités dans le temps et une vision du jeu via une caméra, en jouant sur le serveur officiel Battle.net, avec les mêmes cartes et les mêmes contraintes que des humains.

Starcraft 2

Pour parvenir à battre 99,8% des joueurs humains, il a fallu développer des modes spéciaux de fonctionnement de l'intelligence artificielle pour la faire fonctionner efficacement selon les contraintes imposées.

Il a fallu aussi éviter les pièges de l'apprentissage lors des parties contre elle-même : l'"oubli" des stratégies gagnantes dans la masse des parties jouées, qui peut conduire l'IA à tourner en rond sans faire de progrès, mais aussi la "réussite à tout prix" et contre tous les adversaires, qui conduit à reproduire les mêmes schémas victorieux au risque de devenir prévisible, ce qui peut être fatal dans un jeu aussi complexe que StarCraft 2.

DeepMind explique que son intelligence artificielle a donc été entraînée comme un humain dans des parties où ses adversaires ne cherchaient pas forcément à gagner mais à mettre en évidence des failles dans son jeu, afin de le rendre meilleur.

StarCraft Alpha est par ailleurs désormais capable de s'améliorer sans intervention humaine, grâce à différentes méthodes de renforcement et d'imitation. Deepmind se félicite de la reconnaissance de ces travaux de longue haleine dans la revue Nature et de la démonstration des capacités d'adaptation de l'intelligence artificielle à un milieu complexe et dynamique, ce qui ouvre des perspectives pour la recherche.

Source : DeepMind