Skip to main content

15 Avr, 2024

Des ingénieurs accélèrent le temps de réponse des robots pour réagir aux conversations humaines

Des ingénieurs accélèrent le temps de réponse des robots pour réagir aux conversations humaines

Configuration du microphone sur REEM-C.

Parler à un robot semble souvent guindé ou retardé, grâce aux logiciels informatiques qui tentent de suivre la conversation. Cependant, de nouvelles recherches de l’Université de Waterloo au Canada ont amélioré la capacité des humains à communiquer naturellement avec les robots humanoïdes.

Les chercheurs de Waterloo ont réussi à comprendre comment un robot humanoïde peut identifier la direction d’où vient la parole humaine, se réorienter pour suivre cette voix afin de créer une conversation plus réaliste et accélérer son temps de réaction pour communiquer avec son homologue humain.

« Créer des conversations plus naturelles avec des robots humanoïdes constitue un défi intéressant, car la parole est essentielle à nos interactions sociales », a déclaré Ewen MacDonald, professeur au Département d’ingénierie de conception de systèmes de Waterloo et membre de l’équipe de recherche.

Crédit : Université de Waterloo

L’équipe de recherche a construit un système auditif pour un robot humanoïde en utilisant deux microphones là où les oreilles d’un humain seraient généralement placées pour aider à générer une estimation de la direction dans laquelle les sons audio provenaient. Les sons produits par les humains et d’autres sources acoustiques sont réfléchis par des surfaces telles que des objets ou des murs.

Un pipeline de traitement du signal est nécessaire pour prendre en compte ces réflexions, car elles pourraient tromper les robots humanoïdes sur la provenance du son. Pour qu’un robot réagisse aussi rapidement qu’un humain le ferait par voie sonore, l’ordinateur du robot doit générer cette position estimée extrêmement rapidement.

Les recherches de Waterloo développent un cadre capable d’optimiser la vitesse de traitement du robot et de caractériser différents sons en fonction des performances globales et de la latence. Les tests sur le robot humanoïde ont utilisé le cadre avec des enregistrements dans divers environnements acoustiques.

Exemple de deux signaux de microphone simulés. Visualisation des signaux y1 (bleu) et y2 (orange).

Pranav Barot, un étudiant diplômé en conception de systèmes qui a travaillé sur le document de recherche, a déclaré que l’équipe était motivée par le désir de tester les capacités des robots humanoïdes capables d’écouter et d’interagir avec les humains en temps réel. L’un des défis majeurs de la recherche consistait à tester comment le robot se réoriente pour entendre les humains dans des espaces vastes, bruyants ou bondés.

« Les implications de cette recherche sont importantes dans tout scénario ou environnement dans lequel des robots humanoïdes travailleront avec des êtres humains, à la fois dans des situations de robotique sociale ou dans des situations où les humains et les robots travaillent ensemble », a déclaré Pranav Barot.

https://uwaterloo.ca/scholar/pbarot/publications-and-projects

https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0296452