Skip to main content

25 Sep, 2023

Des scientifiques affirment avoir inventé un haut-parleur qui permet de « mettre en sourdine » les personnes gênantes.

Des scientifiques affirment avoir inventé un haut-parleur qui permet de « mettre en sourdine » les personnes gênantes.

« Vous pouvez avoir quatre personnes qui ont deux conversations et isoler n’importe laquelle des quatre voix.

Cône de silence: Un nouveau haut-parleur peut réorganiser ses sept microphones « auto-déployables » pour diviser une pièce en « zones de parole », ce qui lui permet de suivre et d’identifier différentes voix, même lorsqu’elles se déplacent.

Mieux encore, les chercheurs à l’origine de cette invention affirment que cette localisation précise leur permet non seulement de séparer des conversations simultanées, mais aussi de mettre en sourdine les zones bruyantes – ou les personnes gênantes – sur commande, pour des applications telles que les vidéoconférences lors de réunions.

Comme l’explique en détail une étude récente sur ces travaux, publiée dans la revue Nature Communications, le haut-parleur peu orthodoxe est constitué de ce que l’on appelle un essaim de robots. Les microphones à déploiement automatique se présentent sous la forme de robots de la taille d’un dé à coudre qui communiquent entre eux, se déplacent sur leurs minuscules roues vers différents points, tels de petits Roombas, et retournent à une station de recharge lorsque cela est nécessaire.

« Pour la première fois, en utilisant ce que nous appelons un « essaim acoustique » robotisé, nous sommes en mesure de suivre les positions de plusieurs personnes parlant dans une pièce et de séparer leurs paroles », a déclaré Malek Itani, coauteur principal de l’étude à la Paul G. Allen School of Computer Science & Engineering, dans un communiqué.

Recherche de sons

Pour naviguer dans leur environnement, les prototypes de robots utilisent une technique proche de l’écholocation à haute fréquence, expliquent les chercheurs.

La mobilité qu’elle permet est cruciale. En répartissant les microphones le plus loin possible, le réseau neuronal qui traite les données peut effectuer des calculs plus précis. Pour l’instant, cependant, les robots sont limités à l’itinérance sur les tables, car ils ne sont capables de se localiser que dans l’espace 2D.

« Nous avons mis au point des réseaux neuronaux qui utilisent ces signaux à retardement pour distinguer ce que chaque personne dit et suivre leur position dans l’espace », explique Tuochao Chen, co-auteur principal de l’Allen School, dans le communiqué. « Vous pouvez donc avoir quatre personnes ayant deux conversations et isoler n’importe laquelle des quatre voix et localiser chacune d’entre elles dans une pièce.

Dans la zone

Les affirmations de Tuochao Chen sont confirmées par les résultats des expériences menées dans le monde réel.

Les chercheurs ont testé l’essaim de robots dans des lieux tels que des bureaux et des cuisines pendant que trois à cinq personnes parlaient, le système n’ayant aucune connaissance préalable des lieux ou des voix.

Malgré ces obstacles, l’appareil a réussi à localiser les voix dans 90 % des cas, à moins de 50 cm l’une de l’autre. L’erreur médiane, quant à elle, était encore plus faible, avec un peu moins de 15 cm pour tous les scénarios. C’est assez serré.

En revanche, sa vitesse est un peu moins bonne. En moyenne, il faut 1,82 seconde au système pour traiter trois secondes de son, ce qui peut rendre les vidéoconférences un peu lourdes.

Les chercheurs veulent maintenant appliquer ces techniques de sourdine et de séparation dans l’espace physique, en temps réel, en utilisant ses microphones de localisation pour faire ce qu’un casque antibruit fait dans vos oreilles, mais dans une pièce entière.

https://www.nature.com/articles/s41467-023-40869-8

https://www.eurekalert.org/news-releases/1001914?