Skip to main content

11 Juil, 2024

Cette entreprise d’IA de 1,5 milliard de dollars construit un « cerveau universel » pour les robots

Cette entreprise d’IA de 1,5 milliard de dollars construit un « cerveau universel » pour les robots

Deepak Pathak (à gauche) et Abhinav Gupta (à droite), anciens professeurs de l’université Carnegie Mellon, ont fondé Skild AI en 2023 afin de créer un « cerveau universel » pour l’IA.

Skild AI a levé 300 millions de dollars pour poursuivre le développement de son intelligence robotique prête à l’emploi, dans l’espoir de permettre aux entreprises de l’intégrer dans des robots de toutes sortes.

Les robots, qu’il s’agisse d’humanoïdes bipèdes effectuant des tâches de base en usine ou de « chiens-robots » militaires à quatre pattes destinés au combat urbain, ont besoin de cerveaux. Historiquement, ces derniers ont été hautement spécialisés et construits sur mesure. Mais une startup de robotique basée à Pittsburgh aux Etats-Unis affirme avoir créé une intelligence unique prête à l’emploi qui peut être branchée sur différents robots pour leur permettre d’exécuter des fonctions de base.

Fondée en mai 2023 par Abhinav Gupta et Deepak Pathak, deux anciens professeurs de l’université Carnegie Mellon, Skild AI a créé un modèle fondamental pour ce qu’elle décrit comme un « cerveau à usage général » qui peut être inséré dans une variété de robots, leur permettant d’accomplir des tâches telles que gravir des pentes raides, marcher sur des objets obstruant son chemin et identifier et ramasser des objets.

La société a annoncé mardi qu’elle avait levé 300 millions de dollars à une valeur de 1,5 milliard de dollars lors d’un tour de table de série A mené par Lightspeed Ventures, Softbank, Coatue et le fondateur d’Amazon Jeff Bezos, avec la participation de CRV, Felicis Ventures, Menlo Ventures, Amazon, Sequoia Capital, General Catalyst, SV Angel et CMU.

Raviraj Jain, le partenaire de Lightspeed qui a également dirigé le tour de table d’amorçage de l’entreprise en juillet 2023, a déclaré qu’il avait été très impressionné par les modèles de Skild AI lorsqu’il les avait vus pour la première fois en train d’être testés sous pression en avril dernier.

Les robots qui les utilisaient étaient capables d’effectuer des tâches dans des environnements qu’ils n’avaient jamais vus auparavant et qui n’avaient pas été conçus pour des démonstrations. « À l’époque, les robots étaient capables de monter des escaliers, et je pense qu’il est vraiment fou de voir à quel point ils y sont parvenus, car il s’agit d’un problème de stabilité très complexe », a-t-il déclaré.

Plus impressionnant encore : les robots utilisant les modèles d’IA de Skild ont également démontré des « capacités émergentes », c’est-à-dire des capacités entièrement nouvelles qui ne leur avaient pas été enseignées. Ces capacités sont souvent simples, comme récupérer un objet qui leur échappe ou faire tourner un objet. Mais elles démontrent la capacité du modèle à effectuer des tâches imprévues, une tendance que l’on retrouve dans les systèmes artificiels avancés tels que les grands modèles de langage.

Skild y est parvenu en entraînant son modèle sur une base de données massive de textes, d’images et de vidéos – une base de données qui, selon Skild, est 1 000 fois plus grande que celles utilisées par ses concurrents. Pour créer cette base de données massive, les cofondateurs, tous deux anciens chercheurs en IA chez Meta, ont mélangé un ensemble de techniques de collecte de données qu’ils ont développées et testées au cours de leurs années de recherche.

L’une d’entre elles consistait à engager des contractants humains pour faire fonctionner des robots à distance et collecter des données sur ces actions. Une autre consistait à demander au robot d’effectuer des tâches aléatoires, d’enregistrer les résultats et d’apprendre par essais et erreurs. Le modèle d’IA a également été entraîné sur des millions de vidéos publiques.

Lorsqu’il était doctorant à l’université de Berkeley, Deepak Pathak a mis au point un moyen d’insuffler une « curiosité artificielle » aux robots en récompensant le système lorsqu’il produit des résultats qui surviennent alors qu’il ne peut pas prédire les résultats de ses actions. « Plus l’agent est incertain quant à la prédiction de l’effet de ses actions, plus il est curieux d’explorer », explique-t-il. Cette technique a incité l’IA à explorer davantage de scénarios et à collecter plus de données.

Ses recherches sur l’apprentissage par la curiosité ont été publiées en 2017 et ont été citées plus de 4 000 fois. M. Pathak a également conçu un moyen pour les robots d’utiliser des informations écrites provenant de grands modèles linguistiques comme GPT (sur la manière d’ouvrir une boîte de lait, par exemple) et de les convertir en actions.

« En 2022, nous avons trouvé un moyen de rassembler ces éléments en un seul système cohérent », assure Deepak Pathak. « La notion d’apprentissage à partir de vidéos, d’apprentissage par la curiosité, d’apprentissage à partir de données réelles, mais combinée avec les connaissances issues de la simulation. »

Le modèle de base de Skild AI, entraîné sur 1 000 fois plus de données que ses concurrents, peut être intégré dans une variété de robots, leur permettant d’accomplir des tâches telles que gravir des pentes abruptes, marcher sur des objets obstruant leur chemin et identifier et ramasser des objets.

Skild AI doit faire face à une forte concurrence de la part d’une série d’entreprises de robotique qui ont émergé avec des milliards de dollars de capital-risque grâce au boom de l’IA. Le géant de l’industrie OpenAI a récemment relancé son équipe de robotique pour fournir des modèles aux entreprises de robotique, comme l’a d’abord rapporté Forbes. Il y a aussi des entreprises comme Figure AI, une société de robotique humanoïde dirigée par le PDG milliardaire Brett Adcock, et Covariant, une spin-off d’OpenAI qui construit ChatGPT pour les robots et qui a levé plus de 200 millions de dollars pour y parvenir.

Le cofondateur Gupta affirme que l’accès de Skild AI à de grandes quantités de données le différencie des autres acteurs du secteur, mais il a refusé de divulguer la quantité exacte de données sur lesquelles son modèle est entraîné.

Ken Goldberg, professeur de robotique et d’automatisation à l’université de Berkeley, reconnaît que les données sont la clé de l’évolution de la robotique, mais les robots ont besoin d’un type de données spécifique qui n’est pas largement disponible sur l’internet. En outre, l’utilisation de données recueillies par simulation ne se traduit pas toujours dans le monde réel.

« L’idée qui enthousiasme actuellement la robotique est que nous pouvons faire quelque chose d’analogue aux grands modèles de langage et aux grands modèles de langage de vision, qui ont tous deux des données accessibles à l’échelle de l’internet, avec des milliards d’exemples », a-t-il déclaré. La tâche n’est pas simple pour la robotique, mais Skild AI vise à résoudre ce problème en combinant toutes ses techniques de collecte de données avec davantage d’informations tirées de simulations.

Pathak et Gupta envisagent pour leur entreprise un avenir similaire à celui d’OpenAI, où différents cas d’utilisation et produits peuvent être construits à partir du modèle de base de Skild en le peaufinant. « C’est exactement de cette manière que nous voulons perturber l’industrie de la robotique », souligne Deepak Gupta, ajoutant qu’à terme, ils souhaitent parvenir à une intelligence générale artificielle (un système d’IA hypothétique qui peut rivaliser ou surpasser les capacités humaines) pour les robots, mais avec laquelle les gens peuvent interagir dans le monde physique.

« Le monde de la robotique s’apprête à vivre un « moment GPT-3 », a déclaré Stephanie Zhan, partenaire de Sequoia Capital et investisseur dans Skild AI. « Il s’agira d’un changement monumental qui apportera des avancées similaires à celles que nous avons vues dans le monde de l’intelligence numérique, dans le monde physique. »

https://www.forbes.com/sites/rashishrivastava/2024/07/09/this-15-billion-ai-company-is-building-a-general-purpose-brain-for-robots

https://www.skild.ai