Skip to main content

27 Fév, 2024

Google DeepMind dévoile une IA baptisée «Genie » capable de créer instantanément des jeux jouables

Google DeepMind dévoile une IA baptisée «Genie » capable de créer instantanément des jeux jouables

Formé à partir de plus de 200 000 heures de vidéos de jeux, le modèle expérimental peut transformer n’importe quelle image ou idée en un jeu de plateforme en 2D.

Lundi, DeepMind, l’entreprise de Google spécialisée dans l’IA, a présenté une démonstration en direct de Genie, un modèle d’IA générative capable de créer des jeux jouables à partir d’une simple prompt, après avoir appris les mécanismes du jeu à partir de centaines de milliers de vidéos de jeux.

Développé dans le cadre d’une collaboration entre Google et l’université de Colombie-Britannique, Genie – abréviation de Generative Interactive Environments – permet de créer, à partir d’une seule image, des jeux de plateforme en 2D à défilement latéral basés sur des instructions de l’utilisateur, tels que Super Mario Brothers et Contra.

« Ces dernières années ont vu l’émergence de l’IA générative, avec des modèles capables de générer des contenus nouveaux et créatifs via le langage, les images et même les vidéos », a déclaré Google DeepMind. « Aujourd’hui, nous présentons un nouveau paradigme pour l’IA générative, les environnements interactifs génératifs : Genie ».

Genie peut créer des environnements interactifs et jouables à partir d’une seule image grâce à ce que les chercheurs de Google décrivent comme un modèle d’action latent qui déduit les actions entre les images vidéo, un tokenizer vidéo qui convertit les images vidéo brutes en jetons discrets, et un modèle dynamique qui détermine l’image suivante.

« Plutôt que d’ajouter des biais inductifs, nous nous concentrons sur l’échelle », a déclaré Tim Rocktäschel, développeur chez Google DeepMind, sur Twitter. « Nous utilisons un ensemble de données de plus de 200 000 heures de vidéos de jeux de plateformes en 2D et nous entraînons un modèle mondial de 11 milliards de pixels […] [puis] de manière non supervisée, Genie apprend diverses actions latentes qui contrôlent les personnages de manière cohérente. »

Genie, poursuit Tim Rocktäschel, peut également convertir d’autres types de médias en jeux. Dans le document de recherche Google DeepMind qui l’accompagne, Genie peut être invité à générer une variété de mondes virtuels contrôlables par l’action à partir d’une variété d’entrées.

« Notre modèle peut convertir n’importe quelle image en un monde 2D jouable », ajoute Tim Rocktäsche. « Genie peut donner vie à des créations humaines telles que des croquis, par exemple les magnifiques œuvres d’art de Seneca et Caspian, deux des plus jeunes créateurs de mondes de tous les temps.

Si Genie est capable de créer des mondes en 2D à partir de textes ou d’images, Tim Rocktäschel a montré que le modèle d’IA peut faire plus que construire des side-scrollers, et notamment enseigner à d’autres modèles d’IA ou « agents » des mondes en 3D.

« Nous entraînons également Genie sur des données robotiques (RT-1) sans actions et démontrons que nous pouvons apprendre un simulateur contrôlable par action à partir de ces données », a-t-il déclaré. « Nous pensons qu’il s’agit d’une étape prometteuse vers des modèles de monde général pour l’intelligence artificielle.

Également connue sous le nom de singularité, l’intelligence artificielle générale (AGI) désigne une IA capable de comprendre et d’appliquer des connaissances acquises à un large éventail de tâches, à l’instar d’un être humain.

Google DeepMind a déclaré que l’ensemble de données de Genie a été généré en filtrant des vidéos Internet accessibles au public, en particulier celles qui comportaient des titres tels que « dpeedrun » ou « playthrough », tout en excluant des mots tels que « movie » ou « unboxing ».

Selon Google DeepMind, les progrès de la technologie de l’IA, du matériel et des ensembles de données ont permis de créer un langage cohérent et conversationnel, ainsi que des images « nettes et esthétiques ».

« Lors de la sélection des mots-clés, nous avons vérifié manuellement les résultats pour nous assurer qu’ils produisaient généralement des vidéos de jeux de plateforme en 2D qui n’étaient pas surpassées en nombre par d’autres types de vidéos partageant des mots-clés similaires », poursuivent les chercheurs.

« Avec Genie, nos futurs agents d’intelligence artificielle peuvent être formés dans un programme sans fin de nouveaux mondes générés », a déclaré Google DeepMind. « Dans notre article, nous avons prouvé que les actions latentes apprises par Genie peuvent être transférées dans des environnements réels conçus par des humains, mais cela ne fait qu’effleurer la surface de ce qui pourrait être possible à l’avenir.« 

Grâce en grande partie au lancement du GPT-4 d’OpenAI l’année dernière, les entreprises technologiques, dont Google, Microsoft et Amazon, ont investi massivement dans l’IA générative. Au début du mois, Google a annoncé le lancement d’une version par abonnement de son modèle d’IA Gemini, après avoir changé de nom pour devenir Google Bard.

Parlez aux PNJ propulsés par GPT-4 dans n’importe quel jeu !

Le terme NPC désigne un personnage non-joueur (non-player character) dans les jeux vidéo et les jeux de rôles. Le terme NPC (ou PNJ en français) est utilisé pour designer les gens qui ne pensent pas par eux-mêmes ou qui ne savent pas prendre de décision, créé en juillet 2016.

https://decrypt.co/219064/google-deepmind-ai-makes-playable-2d-sidescroller-platformer-games