AlphaZero : l'IA de DeepMind apprend et maîtrise le jeu d'échecs en moins de 4 heures

Le par  |  10 commentaire(s)
échecs

L'intelligence artificielle progresse un peu plus chaque jour, et DeepMind continue de battre des records dans le domaine.

La société DeepMind avait déjà étonné en présentant Alpha Go, une IA qui a rapidement battu les meilleurs joueurs du jeu de Go au monde, grâce à un apprentissage automatique et au gain d'expérience à mesure des rencontres.

La firme, qui appartient à Alphabet (Google) a récemment évoqué les prouesses de sa nouvelle forme d'Intelligence artificielle baptisée cette fois AlphaZero.

intelligence artificielle

Il s'agit d'un réseau neuronal qui a appris à jouer au jeu d'échecs ainsi qu'au Shogi (des échecs japonais avec quelques difficultés supplémentaires) et au jeu de Go. L'IA a commencé à jouer contre elle-même pour apprendre seule avant de battre le champion des programmes informatiques d'échecs : Stockfish, et ce, en moins de 4 heures d'apprentissage.

AlphaZero a également battu le champion artificiel de Shogi, Elmo, en moins de deux heures et même surpassé AlphaGo Lee (qui avait battu le champion de jeu de Go Lee Sedol ) en seulement 8 heures....

Au final, l'IA est devenue experte dans ces trois jeux en moins de 24 heures. Contrairement à la précédente IA de DeepMind, celle-ci n'est pas conçue pour gagner dans un jeu spécifique, elle est plus générique et s'adapte plus facilement à n'importe quel jeu combinatoire. Si les progrès sont spectaculaires, c'est que l'apprentissage est parti de rien, uniquement en s'affrontant contre elle-même avec pour seul encadrement les règles du jeu. La notion d'apprentissage prend ici une nouvelle dimension et pourrait donc être appliquée à d'autres domaines.

Complément d'information

Vos commentaires

Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Le #1991600
En même temps, après un jeu complexe comme le Go, les échec ça doit être un jeu d'enfant pour ce genre d'IA
Le #1991603
bon je crois qu'on va pouvoir commencer à la faire jouer en bourse
Le #1991623
C'est vraiment impressionnant !

Ceci dit j'en ai discuté avec un joueur d'échec de très bon niveau et il m'a décrit la faiblesse du système :
Quand on commence une partie de zéro, l'IA l'emportera à tous les coups. Mais elle se perd si on la met face à une situation déjà engagée depuis longtemps (genre au moins 30 coups déjà joués). Il reste donc encore du boulot à faire, l'homme n'a pas dit son dernier mot

Le #1991628
skynet a écrit :

C'est vraiment impressionnant !

Ceci dit j'en ai discuté avec un joueur d'échec de très bon niveau et il m'a décrit la faiblesse du système :
Quand on commence une partie de zéro, l'IA l'emportera à tous les coups. Mais elle se perd si on la met face à une situation déjà engagée depuis longtemps (genre au moins 30 coups déjà joués). Il reste donc encore du boulot à faire, l'homme n'a pas dit son dernier mot


Est-ce que tu as un article ou (mieux) un papier qui explique ça ?
Je trouve cette affirmation très étrange car fondamentalement ça ne change rien pour l'ordinateur qu'on en soit au coup 1 ou 30. C'est même plus facile d'une certaine façon car beaucoup de branches se terminent plus vite.
Le #1991631
EchecCritique a écrit :

skynet a écrit :

C'est vraiment impressionnant !

Ceci dit j'en ai discuté avec un joueur d'échec de très bon niveau et il m'a décrit la faiblesse du système :
Quand on commence une partie de zéro, l'IA l'emportera à tous les coups. Mais elle se perd si on la met face à une situation déjà engagée depuis longtemps (genre au moins 30 coups déjà joués). Il reste donc encore du boulot à faire, l'homme n'a pas dit son dernier mot


Est-ce que tu as un article ou (mieux) un papier qui explique ça ?
Je trouve cette affirmation très étrange car fondamentalement ça ne change rien pour l'ordinateur qu'on en soit au coup 1 ou 30. C'est même plus facile d'une certaine façon car beaucoup de branches se terminent plus vite.


Non hélas, mais je vais chercher.
Je vais peut être aller faire un tour au club ce soir et je lui poserai la question.

Comme toi je suis étonné de ça mais le gars est très bien placé aux échecs et suit l'affaire avec intérêt (les IA successives).
Le #1991670
skynet a écrit :

EchecCritique a écrit :

skynet a écrit :

C'est vraiment impressionnant !

Ceci dit j'en ai discuté avec un joueur d'échec de très bon niveau et il m'a décrit la faiblesse du système :
Quand on commence une partie de zéro, l'IA l'emportera à tous les coups. Mais elle se perd si on la met face à une situation déjà engagée depuis longtemps (genre au moins 30 coups déjà joués). Il reste donc encore du boulot à faire, l'homme n'a pas dit son dernier mot


Est-ce que tu as un article ou (mieux) un papier qui explique ça ?
Je trouve cette affirmation très étrange car fondamentalement ça ne change rien pour l'ordinateur qu'on en soit au coup 1 ou 30. C'est même plus facile d'une certaine façon car beaucoup de branches se terminent plus vite.


Non hélas, mais je vais chercher.
Je vais peut être aller faire un tour au club ce soir et je lui poserai la question.

Comme toi je suis étonné de ça mais le gars est très bien placé aux échecs et suit l'affaire avec intérêt (les IA successives).


C'est tout à fait possible, je n'ai pas non plus la réponse !
Si tu trouves n'hésite pas à partager ça ici, je vais garder l'article en favoris quelques jours
Le #1991700
Je me demande ce que ferait cet AI s'ils le lâchent sur la toile. Ce serait drôle s'il commençait à hacker tous ce qui bouge et le prendre comme un jeu...surtout nos comptes bancaires
Le #1991702
Bonjour,
Je participe régulièrement à des tournois de moteur d'échecs. Le but est de faire jouer les moteurs d'échecs entre eux afin de les améliorer. Ils disent qu'ils ont fait jouer AlpaZero contre le champion des moteurs d'échecs et cela est complètement faux. Ils ont utilisé la version 2016 de stockfish alors que stockfish subit régulièrement des améliorations. De plus, il y a des dérivés de stockfish plus puissant comment Brainfish, RaubFish, Sugar, asmFish.... Aujourd'hui, asmFish est le dérivé de stockfish le plus puissant car il est codé en assembleur et donc il possède une meilleure puissance de calcul en Kilonoeuds. De plus, les dérivés de stockfish utilisent des polyglot books c'est-à-dire des livres avec des ouvertures extrêmement optimisées. Les ouvertures ont été testé et testé dans des milliers de parties, puis calculé par des monstres de pc équipé des meilleurs processeurs xeon. Or durant les matchs de AlphaZero contre Stockfish, stockfish n'avait pas de book et il a joué des tristes ouvertures.
Hier j'ai donc fait un test, 100 parties de asmFish muni du book Medulla contre StockFish 8 sans book(même condition que contre AlphaZero). Et la surprise 76 victoires pour asmFish et 24 matchs nuls.
Le #1991703
j'ai posté le même commentaire 2 fois de suite. Désolé!
Le #1991806
AlanFord a écrit :

Bonjour,
Je participe régulièrement à des tournois de moteur d'échecs. Le but est de faire jouer les moteurs d'échecs entre eux afin de les améliorer. Ils disent qu'ils ont fait jouer AlpaZero contre le champion des moteurs d'échecs et cela est complètement faux. Ils ont utilisé la version 2016 de stockfish alors que stockfish subit régulièrement des améliorations. De plus, il y a des dérivés de stockfish plus puissant comment Brainfish, RaubFish, Sugar, asmFish.... Aujourd'hui, asmFish est le dérivé de stockfish le plus puissant car il est codé en assembleur et donc il possède une meilleure puissance de calcul en Kilonoeuds. De plus, les dérivés de stockfish utilisent des polyglot books c'est-à-dire des livres avec des ouvertures extrêmement optimisées. Les ouvertures ont été testé et testé dans des milliers de parties, puis calculé par des monstres de pc équipé des meilleurs processeurs xeon. Or durant les matchs de AlphaZero contre Stockfish, stockfish n'avait pas de book et il a joué des tristes ouvertures.
Hier j'ai donc fait un test, 100 parties de asmFish muni du book Medulla contre StockFish 8 sans book(même condition que contre AlphaZero). Et la surprise 76 victoires pour asmFish et 24 matchs nuls.


Merci pour ces précisions, j'en apprends un peu plus
J'ai une qurstion, peut être as tu la réponse.
J'ai entendu dire (j'ai du le lire dans un article) que la réussite au jeu avait moins besoin de puissance brute que d'évolution dans son algo d'apprentissage (Deep learning). La réussite au GO, plus complexe que les échecs l'a prouvé.

Peux tu regarder ces deux vidéos et me dire ce que tu en penses ?

https://www.youtube.com/watch?v=trWrEWfhTVg

https://www.youtube.com/watch?v=P6eBraOUBLw

@Echeccritique : Pas vu le gars, mais je continue mes recherches
Regarde les vidéos, ça éclaire déjà sur pas mal de choses ....
Suivre les commentaires
Poster un commentaire
Anonyme