Skip to main content

5 Avr, 2018

Un casque étrange pour communiquer quasiment sans son avec les ordinateurs, par subvocalisation

Un casque étrange pour communiquer quasiment sans son avec les ordinateurs, par subvocalisation

Les progrès de la technologie de la reconnaissance vocale l’ont fait devenir une forme d’interface informatique plus viable, mais pas nécessairement plus silencieuse. Pour éviter que le cliquetis des claviers ne soit remplacé par des conversations homme-machine bruyantes, les chercheurs du MIT développent un nouveau système baptisé AlterEgo qui permet aux personnes d’échanger avec les ordinateurs sans parler et de les écouter sans utiliser leurs oreilles.

À première vue, le casque AlterEgo ressemble au produit d’un étudiant en design qui n’a pas fait attention en classe. Au lieu de la combinaison familière d’un écouteur et d’un microphone, le dispositif est une courbe en plastique blanc encombrant comme la mâchoire d’un animal étrange qui pend de l’oreille du porteur et se courbe pour toucher le menton.

Cela peut sembler étrange, mais c’est basé sur une technologie assez sophistiquée. À l’intérieur de l’Alterego se trouvent des électrodes qui scannent la mâchoire et le visage pour déceler des signaux neuromusculaires produits lorsque le porteur pense à verbaliser des mots sans vraiment les énoncer à haute voix, une pratique appelée « subvocalisation ». Cela permet à la tête d’agir comme un microphone pour un ordinateur sans récupérer de sons. Pendant ce temps, une paire d’écouteurs à conduction osseuse transmet des sons de l’ordinateur de l’utilisateur qui contourne les canaux habituels et va directement à l’oreille interne via les os de la mâchoire et du crâne.

Selon le MIT, cela rend la communication silencieuse avec un ordinateur et complètement privée. Un exemple des avantages d’un tel système est de pouvoir utiliser un ordinateur pour battre un adversaire en communiquant silencieusement des mouvements à l’appareil et en recevant subrepticement des conseils. Une utilisation plus éthique serait sur le pont d’un porte-avions, où il est normalement trop bruyant pour parler ou entendre. Mais Arnav Kapur, leader du projet, voit une application plus fondamentale.

« La motivation pour cela était de construire un dispositif d’IA – un dispositif d’augmentation de l’intelligence », explique Arnav Kapur. « Notre idée était la suivante : pourrions-nous avoir une plate-forme informatique plus interne, qui fusionne l’humain et la machine à certains égards et qui ressemble à une extension interne de notre propre cognition ? »

En d’autres termes, une telle interface pourrait permettre aux utilisateurs de se passer de codes d’accès, de taper au clavier, en général, de bidouiller avec des appareils numériques, détournant ces utilisateurs et ceux autour d’une activité dans leur main.

La subvocalisation est connue depuis plus d’un siècle, mais en ce qui concerne les interfaces informatiques, elle n’en est qu’à ses balbutiements. Pour comprendre comment concevoir le casque AlterEgo, l’équipe du MIT a utilisé un ensemble de 16 électrodes disposées sur différentes parties d’une série de visages de volontaires pour trouver les meilleurs signaux neuromusculaires. Ils ont ensuite été invités à subvocaliser une série de mots quatre fois de suite.

L’équipe a trouvé que seulement quatre électrodes sont réellement nécessaires, donc ils croient qu’un dispositif moins encombrant est possible. Actuellement, les algorithmes utilisés fonctionnent sur un vocabulaire d’environ 20 mots chacun pour une série de tâches informatiques. Ceux-ci incluent des problèmes de multiplication et une application d’échecs qui permet d’entrer des mouvements en utilisant la nomenclature alphanumérique standard des échecs.

Une fois que les mots sont sous-localisés, un réseau de neurones passe les données à travers une série de nœuds de traitement simples en couches qui recherchent des corrélations entre les signaux neuromusculaires et des mots spécifiques. Des tests d’utilisabilité sur 10 sujets, qui avaient passé 15 minutes à ajuster le prototype à leur neurophysiologie, suivis de 90 minutes utilisées pour effectuer des exercices sur ordinateur, ont montré une précision de 92%.

Cependant, Arnav Kapur dit que cette performance pourrait être améliorée avec plus de données d’entraînement pour le système. L’espoir est qu’en collectant plus de données, le système peut aller au-delà de simples commandes et réponses.

«Nous sommes en train de collecter des données et les résultats sont intéressants», explique Arnav Kapur. « Je pense que nous aurons une conversation complète un jour. »

http://news.mit.edu/2018/computer-system-transcribes-words-users-speak-silently-0404

http://iui.acm.org/2018/