Skip to main content

10 Juil, 2018

Un algorithme d’IA apprend à conduire à une voiture à partir de zéro en 20 minutes

Un algorithme d’IA apprend à conduire à une voiture à partir de zéro en 20 minutes

Deux doctorants en intelligence artificielle de l’université de Cambridge se lancent dans l’apprentissage automatique comme fondement des voitures autonomes. Leur entreprise, Wayve, vient de sortir une vidéo d’une Renault Twizy équipée qui apprend à suivre une voie à partir de zéro, en l’espace d’une vingtaine de minutes.

«La pièce manquante du puzzle de la conduite autonome est constituée d’algorithmes intelligents, mais pas plus de capteurs, de règles et de cartes», explique Shah, cofondateur et PDG de Wayve. «Les humains ont une capacité fascinante à effectuer des tâches complexes dans le monde réel, parce que nos cerveaux nous permettent d’apprendre rapidement et de transférer des connaissances à travers nos nombreuses expériences. Nous voulons donner à nos véhicules de meilleurs cerveaux, pas plus de matériel ».

Avec cette approche en tête, l’équipe a pris une Renault Twizy, équipée d’une seule caméra à l’avant et l’ont modifiée avec la possibilité de piloter par ordinateur la direction, l’accélération et les freins. Ils l’ont relié à une unité de traitement graphique capable d’analyser intelligemment les données de la caméra en temps réel et ont fait tourner un programme d’apprentissage basé sur l’expérimentation, l’optimisation et l’évaluation.

Ils ont mis la Twizy sur une voie étroite et légèrement incurvée. Un conducteur humain s’est assis sur le siège du conducteur, puis a donné le contrôle total à la voiture, ne lui indiquant pas quelle était sa tâche, et l’a laissé expérimenter avec les commandes.

Chaque fois que la voiture est sortie de la route, ils l’ont arrêtée et l’ont corrigée. L’algorithme «pénalisait» la voiture pour avoir fait des erreurs, et la «récompensait» en fonction de la distance parcourue sans intervention humaine. En moins de 20 minutes, ce qui représentait moins de 20 essais, la voiture avait trouvé comment suivre une voie plus ou moins indéfiniment.

Wayve croit que c’est la qualité des systèmes d’apprentissage qui sera le facteur clé de la domination du marché automobile autonome au cours de la prochaine décennie.

« DeepMind nous a montré que les méthodes d’apprentissage profond renforcé peuvent conduire à des performances super-humaines dans de nombreux jeux, y compris Go, les échecs et les jeux informatiques, surpassant presque toujours tout système basé sur des règles », lit-on dans un blog de Wayve. « Nous montrons ici qu’une philosophie similaire est également possible dans le monde réel, et en particulier dans les véhicules autonomes ».

Imaginez-vous déployer une flotte de voitures autonomes, avec un algorithme de conduite qui représente initialement 95% de la qualité d’un conducteur humain. Ce système ne serait pas branlant comme le modèle initialisé de façon aléatoire dans notre vidéo de démonstration, mais serait presque capable de traiter avec des feux de circulation, des carrefours giratoires, des carrefours, etc. Après une journée entière de conduite et d’amélioration en ligne de la prise en charge de la sécurité humaine, le système pourrait peut-être s’améliorer de 96%, puis de 98% après une semaine, et après quelques mois, le système peut être surhumain, ayant bénéficié des retours d’expérience de nombreux conducteurs prudents.

Il y a certainement des éléments d’apprentissage – et des éléments d’apprentissage en réseau – présents dans les opérations actuelles de conduite autonome. L’Autopliot de Tesla, par exemple, enregistre toutes les erreurs qu’un conducteur doit prendre en charge et corriger, et l’utilise pour aider à éduquer d’autres Teslas à travers la même zone. Mais l’idée de laisser une voiture autonome construire son propre modèle de fonctionnement dans le monde, à peu près de la même manière qu’un conducteur humain, est fascinante.

https://wayve.ai/