Skip to main content

23 Nov, 2022

L’IA qui permet de jouer de chez Meta peut conclure et rompre des alliances comme un humain.

L’IA qui permet de jouer de chez Meta peut conclure et rompre des alliances comme un humain.

Cela pourrait être un pas vers la construction d’IA capables de gérer des problèmes complexes nécessitant des compromis. DALL.E 2 en utilisant l’invite « IA conquérant l’Europe dans un jeu de société ».

Meta a créé une IA capable de battre les humains dans une version en ligne de Diplomacy, un jeu de stratégie populaire dans lequel sept joueurs s’affrontent pour le contrôle de l’Europe en déplaçant des pièces sur une carte. Contrairement à d’autres jeux de société que l’IA maîtrise, comme les échecs et le go, Diplomacy exige des joueurs qu’ils se parlent – pour former des alliances, négocier des tactiques – et qu’ils repèrent quand les autres bluffent.

L’IA, dénommée Cicero, s’est classée dans les 10 % supérieurs lors de 40 parties en ligne contre 82 joueurs humains (qui ne savaient pas qu’ils affrontaient un robot). Dans un tournoi de 8 parties impliquant 21 joueurs, Cicero est arrivé premier. Meta a décrit ses travaux dans un article publié dans Science.

Apprendre à jouer à la diplomatie n’est pas une mince affaire pour plusieurs raisons. Non seulement elle implique plusieurs joueurs, qui font des mouvements en même temps, mais chaque tour est précédé d’une brève négociation au cours de laquelle les joueurs discutent par paires pour tenter de former des alliances ou de s’attaquer à leurs rivaux. Après ce tour de négociation, les joueurs décident ensuite des pièces à déplacer – et s’ils doivent honorer ou non un accord.

À chaque moment du jeu, Cicero modélise la façon dont les autres joueurs sont susceptibles d’agir en fonction de l’état du plateau et de ses conversations précédentes avec eux. Il détermine ensuite comment les joueurs peuvent travailler ensemble pour un bénéfice mutuel et génère des messages conçus pour atteindre ces objectifs.

Pour construire Cicero, Meta marie deux types différents d’IA : un modèle d’apprentissage par renforcement qui détermine les mouvements à effectuer, et un grand modèle linguistique qui négocie avec les autres joueurs.

Cicero n’est pas parfait. Il a toujours envoyé des messages contenant des erreurs, contredisant parfois ses propres plans ou commettant des bévues stratégiques. Mais Meta affirme que les humains ont souvent choisi de collaborer avec lui plutôt qu’avec d’autres joueurs.

Et cela reste important car si des jeux comme les échecs ou le go se terminent par un gagnant et un perdant, les problèmes du monde réel n’ont généralement pas de solutions aussi simples. Trouver des compromis et des solutions de contournement est souvent plus important que de gagner. Meta affirme que Cicero est une étape vers une IA capable d’aider à résoudre toute une série de problèmes complexes nécessitant des compromis, qu’il s’agisse de planifier des itinéraires pour contourner un trafic dense ou de négocier des contrats.

https://www.science.org/doi/10.1126/science.ade9097