Skip to main content

13 Fév, 2024

Un petit quadrirotor apprend à voler en 18 secondes

Un petit quadrirotor apprend à voler en 18 secondes

Un court GIF d'appareils simulés en forme de X se déplaçant jusqu'à ce qu'ils s'installent progressivement et restent en place.

Des chercheurs de NYU et TII font voler des robots avec des simulations rapides sur un ordinateur portable grand public. Ces quadrirotors simulés apprennent à voler en seulement 18 secondes, ce qui peut ensuite permettre à un véritable quadrirotor de faire de même.

Il est assez étonnant de voir à quel point les quadrotors ont évolué au cours de la dernière décennie. Par exemple, nous en sommes maintenant au point où ils frisent le jetable, du moins d’un point de vue commercial ou de recherche : pour un peu plus de 200 $ US, vous pouvez acheter un petit drone de 27 grammes, entièrement open source , et tout il faut lui apprendre à voler.

C’est là que les choses deviennent un peu plus difficiles, car apprendre aux drones à voler n’est pas un processus simple. Grâce à une bonne simulation et à des techniques telles que l’apprentissage par renforcement, il est beaucoup plus facile de donner de l’autonomie aux drones qu’auparavant. Mais ce n’est généralement pas un processus rapide, et il peut être difficile d’effectuer une transition en douceur de la simulation à la réalité.

L’Agile Robotics and Perception Lab de l’Université de New York, en collaboration avec le Technology Innovation Institute (TII), a réussi à rationaliser le processus d’obtention d’une autonomie de base pour travailler sur des drones, et à le rationaliser considérablement : le système du laboratoire est capable d’entraîner un drone dans simulation de rien jusqu’au vol stable et contrôlable en 18 secondes chrono sur un MacBook Pro. Et il faut en fait plus de temps pour compiler et flasher le firmware sur le drone lui-même que pour l’ensemble du processus de formation.

Ainsi, non seulement le drone est capable de maintenir un vol stationnaire stable tout en rejetant les poussées, les coups de coude et le vent, mais il est également capable de suivre des trajectoires spécifiques. Pas mal pendant 18 secondes, non ?

L’une des choses qui ralentissent généralement les temps de formation est la nécessité de continuer à affiner exactement ce pour quoi vous vous entraînez, sans l’affiner au point de former uniquement votre système à voler dans votre simulation spécifique plutôt que dans le monde réel.

La stratégie utilisée ici est ce que les chercheurs appellent un programme (on peut aussi le considérer comme une sorte de plan de cours) pour ajuster la fonction de récompense utilisée pour entraîner le système grâce à l’apprentissage par renforcement. Le programme commence par être plus indulgent et augmente progressivement les pénalités pour mettre l’accent sur la robustesse et la fiabilité. Tout est question d’efficacité : suivre la formation dont vous avez besoin de la manière dont elle doit être effectuée pour obtenir les résultats souhaités, et pas plus.

Il existe d’autres astuces, plus simples, qui optimisent également cette technique pour la vitesse. Les algorithmes d’apprentissage par renforcement profond sont particulièrement efficaces et exploitent l’accélération matérielle fournie avec les processeurs Apple de la série M. L’efficacité du simulateur multiplie les avantages de l’efficacité des échantillons basés sur le programme du pipeline d’apprentissage par renforcement, conduisant à ce temps de formation extrêmement rapide.

Cette approche ne se limite pas aux simples petits drones : elle fonctionnera sur à peu près n’importe quel drone, y compris les plus gros et les plus chers, ou même sur un drone que vous construisez vous-même à partir de zéro.

On nous dit qu’il a fallu quelques minutes plutôt que quelques secondes pour former une politique pour le drone dans la vidéo ci-dessus, bien que les chercheurs s’attendent à ce que 18 secondes soient réalisables même pour un drone plus complexe comme celui-ci dans un avenir proche. Et tout est open source, vous pouvez donc en fait construire un drone et lui apprendre à voler avec ce système.

Mais si vous attendez un peu, cela ne fera que s’améliorer : les chercheurs nous disent qu’ils travaillent sur l’intégration avec le pilote automatique du drone open source PX4. À plus long terme, l’idée est d’avoir une politique unique capable de s’adapter à différentes conditions environnementales, ainsi qu’à différentes configurations de véhicules, ce qui signifie que cela pourrait fonctionner sur tous les types de robots volants plutôt que sur de simples quadrotors.

Tout ce dont vous avez besoin pour l’exécuter vous-même est disponible sur GitHub , et le document est sur ArXiv ici .

https://spectrum.ieee.org/drone-quadrotor