Skip to main content

5 Avr, 2023

 Un système robotique à quatre pattes pour jouer au football sur différents terrains

 Un système robotique à quatre pattes pour jouer au football sur différents terrains

« DribbleBot » peut manœuvrer un ballon de football sur des paysages tels que le sable, le gravier, la boue et la neige, en utilisant l’apprentissage par renforcement pour s’adapter à la dynamique variable du ballon.

Les chercheurs ont créé DribbleBot, un système de dribble dans la nature sur divers terrains naturels, notamment le sable, le gravier, la boue et la neige, à l’aide de la détection et de l’informatique embarquées. En plus de ces exploits de football, de tels robots pourraient un jour aider les humains dans des missions de recherche et de sauvetage.

Si vous avez déjà joué au football avec un robot, c’est un sentiment familier. Le soleil brille sur votre visage alors que l’odeur de l’herbe imprègne l’air. Vous regardez autour de vous. Un robot à quatre pattes se précipite vers vous en dribblant avec détermination.

Bien que le bot n’affiche pas un niveau de capacité semblable à celui de Lionel Messi, il s’agit néanmoins d’un impressionnant système de dribble dans la nature. Des chercheurs de l’Improbable Artificial Intelligence Lab du MIT, qui fait partie du Laboratoire d’informatique et d’intelligence artificielle (CSAIL), ont mis au point un système robotique à pattes capable de dribbler un ballon de football dans les mêmes conditions que les humains. Le bot a utilisé un mélange de détection embarquée et d’informatique pour traverser différents terrains naturels tels que le sable, le gravier, la boue et la neige, et s’adapter à leur impact varié sur le mouvement de la balle. Comme tout sportif engagé, « DribbleBot » pouvait se relever et récupérer le ballon après une chute.

La programmation de robots pour jouer au football est un domaine de recherche actif depuis un certain temps. Cependant, l’équipe voulait apprendre automatiquement comment actionner les jambes pendant le dribble, pour permettre la découverte de compétences difficiles à scénariser pour répondre à divers terrains comme la neige, le gravier, le sable, l’herbe et la chaussée.

Un robot, une balle et un terrain se trouvent à l’intérieur de la simulation – un jumeau numérique du monde naturel. Vous pouvez charger le bot et d’autres actifs et définir les paramètres physiques, puis il gère la simulation directe de la dynamique à partir de là. Quatre mille versions du robot sont simulées en parallèle en temps réel, permettant une collecte de données 4 000 fois plus rapide qu’avec un seul robot. C’est beaucoup de données.

Le robot démarre sans savoir comment dribbler le ballon – il reçoit juste une récompense lorsqu’il le fait, ou un renforcement négatif lorsqu’il se trompe. Donc, il essaie essentiellement de déterminer quelle séquence de forces il doit appliquer avec ses jambes. « L’un des aspects de cette approche d’apprentissage par renforcement est que nous devons concevoir une bonne récompense pour faciliter l’apprentissage par le robot d’un comportement de dribble réussi », explique Gabe Margolis, doctorant au MIT, qui a codirigé les travaux avec Yandong Ji, assistant de recherche dans l’Improbable. Laboratoire d’IA. « Une fois que nous avons conçu cette récompense, c’est le moment de s’entraîner pour le robot : en temps réel, c’est quelques jours, et dans le simulateur, des centaines de jours. Au fil du temps, il apprend à s’améliorer de plus en plus dans la manipulation du ballon de football. pour correspondre à la vitesse souhaitée.

Le bot pourrait également naviguer sur des terrains inconnus et se remettre des chutes grâce à un contrôleur de récupération que l’équipe a intégré à son système. Ce contrôleur permet au robot de se relever après une chute et de revenir à son contrôleur de dribble pour continuer à poursuivre le ballon, l’aidant à gérer les perturbations et les terrains hors distribution.

« Si vous regardez autour de vous aujourd’hui, la plupart des robots sont à roues. Mais imaginez qu’il y ait un scénario de catastrophe, une inondation ou un tremblement de terre, et nous voulons que des robots aident les humains dans le processus de recherche et de sauvetage. Nous avons besoin de machines pour parcourir les terrains. qui ne sont pas plats, et les robots à roues ne peuvent pas traverser ces paysages », déclare Pulkit Agrawal, professeur au MIT, chercheur principal de CSAIL et directeur d’Improbable AI Lab. des systèmes robotiques actuels », ajoute-t-il. « Notre objectif dans le développement d’algorithmes pour les robots à pattes est de fournir une autonomie sur des terrains difficiles et complexes qui sont actuellement hors de portée des systèmes robotiques. »

La fascination pour les robots quadrupèdes et le football est profonde – le professeur canadien Alan Mackworth a d’abord noté l’idée dans un article intitulé « On Seeing Robots », présenté à VI-92, 1992. Des chercheurs japonais ont ensuite organisé un atelier sur « Les grands défis de l’intelligence artificielle,  » qui a conduit à des discussions sur l’utilisation du football pour promouvoir la science et la technologie. Le projet a été lancé sous le nom de Robot J-League un an plus tard, et la ferveur mondiale s’est rapidement ensuivie. Peu de temps après, « RoboCup » est née.

Comparé à marcher seul, dribbler un ballon de football impose plus de contraintes sur le mouvement de DribbleBot et sur les terrains qu’il peut traverser. Le robot doit adapter sa locomotion pour appliquer des forces au ballon pour dribbler. L’interaction entre la balle et le paysage peut être différente de l’interaction entre le robot et le paysage, comme l’herbe épaisse ou la chaussée. Par exemple, un ballon de football subira une force de traînée sur l’herbe qui n’est pas présente sur le trottoir, et une pente appliquera une force d’accélération, modifiant la trajectoire typique du ballon. Cependant, la capacité du bot à traverser différents terrains est souvent moins affectée par ces différences de dynamique – tant qu’il ne glisse pas – de sorte que le test de football peut être sensible aux variations de terrain que la locomotion seule ne l’est pas.

« Les approches passées simplifient le problème du dribble, en faisant l’hypothèse d’un sol plat et dur. Le mouvement est également conçu pour être plus statique ; le robot n’essaie pas de courir et de manipuler le ballon simultanément », explique Ji. « C’est là que des dynamiques plus difficiles entrent dans le problème de contrôle. Nous nous sommes attaqués à cela en étendant les avancées récentes qui ont permis une meilleure locomotion en extérieur dans cette tâche composée qui combine des aspects de locomotion et de manipulation adroite ensemble. »

Côté matériel, le robot dispose d’un ensemble de capteurs qui lui permettent de percevoir l’environnement, lui permettant de sentir où il se trouve, de « comprendre » sa position et de « voir » une partie de son environnement. Il dispose d’un ensemble d’actionneurs qui lui permettent d’appliquer des forces et de se déplacer lui-même et des objets. Entre les capteurs et les actionneurs se trouve l’ordinateur, ou « cerveau », chargé de convertir les données des capteurs en actions, qu’il appliquera via les moteurs. Lorsque le robot roule sur la neige, il ne voit pas la neige mais peut la sentir grâce à ses capteurs moteurs. Mais le football est un exploit plus délicat que la marche. L’équipe a donc utilisé des caméras sur la tête et le corps du robot pour une nouvelle modalité sensorielle de vision, en plus de la nouvelle habileté motrice. Et puis, on dribble.

« Notre robot peut aller dans la nature car il embarque tous ses capteurs, caméras et calculs. Cela a nécessité quelques innovations pour que l’ensemble du contrôleur s’adapte à ce calcul embarqué », explique Margolis. « C’est un domaine où l’apprentissage est utile car nous pouvons exécuter un réseau neuronal léger et l’entraîner à traiter les données de capteur bruyantes observées par le robot en mouvement. C’est en contraste frappant avec la plupart des robots d’aujourd’hui : généralement, un bras de robot est monté sur une base fixe et est assis sur un établi avec un ordinateur géant branché directement dessus. Ni l’ordinateur ni les capteurs ne sont dans le bras robotique ! Donc, tout cela est lourd, difficile à déplacer.

Il reste encore un long chemin à parcourir pour rendre ces robots aussi agiles que leurs homologues dans la nature, et certains terrains étaient difficiles pour DribbleBot. Actuellement, le contrôleur n’est pas formé dans des environnements simulés qui incluent des pentes ou des escaliers. Le robot ne perçoit pas la géométrie du terrain ; il ne fait qu’estimer ses propriétés de contact avec le matériau, comme le frottement. S’il y a une marche, par exemple, le robot restera bloqué — il ne pourra pas soulever la balle au-dessus de la marche, une zone que l’équipe veut explorer à l’avenir. Les chercheurs sont également ravis d’appliquer les leçons apprises lors du développement de DribbleBot à d’autres tâches qui impliquent la locomotion combinée et la manipulation d’objets, transportant rapidement divers objets d’un endroit à l’autre en utilisant les jambes ou les bras.

« DribbleBot est une démonstration impressionnante de la faisabilité d’un tel système dans un espace de problèmes complexes qui nécessite un contrôle dynamique de tout le corps », déclare Vikash Kumar, chercheur chez Facebook AI Research qui n’a pas participé aux travaux. « Ce qui est impressionnant avec DribbleBot, c’est que toutes les compétences sensorimotrices sont synthétisées en temps réel sur un système peu coûteux utilisant des ressources de calcul embarquées. Bien qu’il fasse preuve d’une agilité et d’une coordination remarquables, ce n’est que le « coup d’envoi » de la prochaine ère Jeu-On! »

La recherche est soutenue par le DARPA Machine Common Sense Program, le MIT-IBM Watson AI Lab, le National Science Foundation Institute of Artificial Intelligence and Fundamental Interactions, le US Air Force Research Laboratory et l’US Air Force Artificial Intelligence Accelerator. Un article sur les travaux sera présenté à la Conférence internationale IEEE 2023 sur la robotique et l’automatisation (ICRA).

https://news.mit.edu/2023/legged-robotic-system-playing-soccer-various-terrains-0403

https://arxiv.org/abs/2304.01159

https://www.icra2023.org/