Skip to main content

3 Juin, 2024

Des chercheurs rassemblent des humains, des robots et de l’IA générative pour créer de l’art

Des chercheurs rassemblent des humains, des robots et de l’IA générative pour créer de l’art

Des Chercheurs de l’Institut de robotique (RI: Robotic Institute) de l’Université Carnegie Mellon ont développé un système robotique qui co-peint de manière interactive avec les gens. 

FRIDA Collaborative (CoFRIDA) peut travailler avec des utilisateurs de toute capacité artistique, invitant à la collaboration pour créer de l’art dans le monde réel.

« C’est comme l’équivalent en dessin d’une invite d’écriture », a déclaré Jim McCann, professeur agrégé du RI qui dirige le laboratoire textile du RI. « Si vous êtes bloqué et que vous ne savez pas quoi faire, cela peut mettre quelque chose sur la page pour vous. Cela peut briser la barrière d’une page vide. C’est une façon vraiment intéressante d’améliorer la créativité humaine. »

Peter Schaldenbrand, titulaire d’un doctorat, étudiant à l’Institut de Robotique pose à côté de CoFRIDA.

CoFRIDA s’appuie sur des travaux antérieurs avec FRIDA , une collaboration multilab au sein de l’ École d’informatique. Nommée d’après l’artiste Frida Kahlo, FRIDA (Framework and Robotics Initiative for Developing Arts) peut utiliser un pinceau ou un Sharpie pour créer une peinture à partir de messages texte ou d’exemples d’images d’un utilisateur humain. Le projet a été fondé par Jean Oh, professeur-chercheur agrégé au RI et chef du Bot Intelligence Group (BIG), conjointement avec Jim McCann et Peter Schaldenbrand, étudiant doctorant

Pour soutenir une expérience de création artistique plus collaborative, Gaurav Parmar, doctorant au RI et Jun-Yan Zhu, professeur assitant, ont rejoint l’équipe FRIDA pour développer CoFRIDA. Le nouveau système permet aux utilisateurs de fournir des entrées de texte pour décrire ce qu’ils souhaitent peindre. Ils peuvent également participer au processus de création, en peignant à tour de rôle directement sur la toile avec le robot jusqu’à ce qu’ils aient réalisé leur vision artistique.

« CoFRIDA nécessite un niveau d’intelligence plus élevé que le FRIDA original, qui crée seul une œuvre d’art du début à la fin », a déclaré Jean Oh. « La co-peinture est analogue au travail avec une autre personne, qui doit constamment deviner ce qu’elle veut. CoFRIDA doit comprendre les objectifs de haut niveau de l’utilisateur humain pour que ses traits aient un sens par rapport à cet objectif. »

Le co-painting est par nature collaboratif, et développer des données qui entraînent un robot à collaborer est difficile et prend du temps. Pour contourner cette complication, CoFRIDA utilise des données d’entraînement auto-supervisées basées sur le simulateur et le planificateur d’AVC de FRIDA.

Les chercheurs ont créé un ensemble de données auto-supervisé et affiné en demandant à FRIDA de simuler des peintures composées d’une séquence de coups de pinceau, dont certains traits pouvaient être supprimés pour produire des exemples de peintures partielles. L’équipe a dû déterminer comment supprimer des éléments des dessins dans les données de formation tout en laissant suffisamment d’image pour que CoFRIDA puisse la reconnaître.

Par exemple, les chercheurs ont supprimé des détails comme le bord d’une roue ou les vitres d’une voiture, mais ont laissé le contour du véhicule.

« Nous avons essayé de simuler différents états du processus de dessin », a expliqué Jun-Yan Zhu. « Il est facile d’arriver à l’esquisse finale, mais il est assez difficile d’imaginer l’étape intermédiaire de ce processus. »

À l’aide de l’ensemble de données de peintures partielles et complètes, les chercheurs ont affiné un modèle texte-image, InstructPix2Pix, qui a permis à CoFRIDA d’ajouter des coups de pinceau et de travailler avec le contenu existant sur le canevas. Cette approche, qui s’appuie sur des données créées à l’aide du simulateur de pinceaux de CoFRIDA, signifie que la génération d’un tableau intègre les contraintes réelles du robot, comme son ensemble d’outils limité.

En dehors du laboratoire, les chercheurs espèrent que CoFRIDA pourra enseigner la robotique aux gens et développer leur créativité, en encourageant ceux qui pourraient douter de leurs capacités artistiques. CoFRIDA peut également aider à donner vie aux visions des utilisateurs ou à orienter l’œuvre d’art dans une toute nouvelle direction.

« Si vous partez d’un croquis très simple, CoFRIDA emmène l’œuvre dans des directions très différentes. Si vous demandez six dessins différents, vous obtiendrez six options très différentes », a déclaré Peter Schaldenbrand. « C’est bien de pouvoir prendre des décisions à un niveau élevé parce que cela me donne l’impression d’être un directeur artistique. Le robot prend ces décisions de bas niveau quant à l’endroit où placer le marqueur, mais c’est moi qui décide à quoi ressemblera l’ensemble.  » Je me sens toujours en contrôle du processus créatif, et dans un monde où les artistes craignent d’être remplacés par l’IA, CoFRIDA en tant qu’exemple de robot conçu pour soutenir la créativité humaine est incroyablement pertinent. « 

Les chercheurs espèrent que des travaux ultérieurs pourront intégrer la personnalisation dans CoFRIDA, donnant ainsi aux utilisateurs encore plus de contrôle sur le style du produit fini.

https://www.cmu.edu/news/stories/archives/2024/may/ri-research-brings-together-humans-robots-and-generative-ai-to-create-art