Skip to main content

6 Avr, 2020

Un nouveau standard en cours d’élaboration vise à minimiser les erreurs de la reconnaissance faciale

Un nouveau standard en cours d’élaboration vise à minimiser les erreurs de la reconnaissance faciale

L’utilisation des applications d’IA biométrique continue de croître à mesure que diverses industries adoptent cette technologie.

Des contrôles aux frontières, au déverrouillage des dispositifs à puce et au renforcement de la sécurité des commerces de détail, en passant par les essais de certaines sociétés de cartes de crédit pour l’authentification des paiements et des hôtels pour l’enregistrement, le nombre d’applications utilisant la reconnaissance faciale va continuer à augmenter.

La nécessité de normes

Les technologies de reconnaissance faciale sont complexes et les taux d’erreur restent importants en fonction du processus d’imagerie et du sujet. Au fur et à mesure du déploiement et de l’augmentation du nombre d’utilisateurs, ces erreurs deviendront plus fréquentes sans une modernisation importante des procédures de capture.

L’IEC (International Electrotechnical Commission) et l’ISO travaillent ensemble à l’élaboration de normes internationales pour les TIC par l’intermédiaire de leur comité technique conjoint (ISO/CEI JTC 1). Le sous-comité 37 couvre la biométrie et a commencé à travailler sur la nouvelle norme ISO/IEC 24358.

Patrick J. Grother dirige les travaux du SC 37.

Qu’est-ce que la reconnaissance faciale et où est-elle utilisée ?

La reconnaissance faciale est un processus. Elle commence par la prise d’une photo du visage. Ensuite, un algorithme de reconnaissance faciale, aujourd’hui construit avec des technologies d’intelligence artificielle (IA), est utilisé pour extraire de l’image les caractéristiques liées à l’identité. Ces caractéristiques peuvent ensuite être comparées aux caractéristiques précédemment extraites d’autres images. Celles-ci peuvent par exemple se trouver dans une base de données.

La reconnaissance faciale est utilisée dans un nombre toujours croissant d’applications. Les principales sont la délivrance de passeports et de permis de conduire, mais elle est également utilisée pour le contrôle des accès aux bâtiments et des frontières, ainsi que dans les enquêtes des services répressifs.

Pourquoi avons-nous besoin d’une norme ?

Les systèmes de reconnaissance faciale font parfois des erreurs. Ils peuvent ne pas correspondre à un utilisateur connu – un faux négatif – ou ils peuvent associer incorrectement différents utilisateurs – un faux positif. Ces résultats dépendent des propriétés des photographies saisies.

En particulier, une image peut être dégradée par des aspects de la qualité de l’image tels qu’une mauvaise exposition ou un flou, ou par des aspects de la manière dont le sujet se présente à l’appareil photo, par exemple en regardant vers le bas, ou en faisant une expression faciale inhabituelle. Ces possibilités motivent la nouvelle norme ISO/IEC 24358. Elle vise à minimiser les erreurs de reconnaissance faciale en définissant une nouvelle génération d’appareils photo qui comprennent l’image qu’ils tentent de recueillir. La situation actuelle est que l’on utilise souvent des appareils photo génériques « muets » qui acceptent naïvement des images mal présentées.

Cette norme conçoit donc des caméras à reconnaissance faciale étroitement couplées à des mesures d’évaluation de la qualité des images effectuées en temps réel. Ce faisant, elle vise à apporter à la reconnaissance des visages au moins la maturité qui caractérise l’acquisition des empreintes digitales et de l’iris. Ces modalités ont bénéficié dès le départ de l’utilisation d’appareils conscients de la caractéristique qu’ils tentent d’acquérir – respectivement les crêtes de frottement et les structures circulaires de l’œil. La reconnaissance des visages n’a commencé à être utilisée que récemment, notamment dans les portiques des passeports électroniques et les téléphones portables.

La caméra comprendra donc le visage, quelles autres capacités aura-t-elle ?

Cette norme vise à fabriquer une nouvelle génération de caméras intelligentes, des caméras techniquement meilleures. Pour de multiples raisons, il s’agit en grande partie d’acquérir des images à une résolution plus élevée. Nous savons que beaucoup de téléphones portables peuvent prendre des photos à très haute résolution et que beaucoup d’appareils photo ont une très haute résolution, plus que ce dont vous avez habituellement besoin et que ces informations s’avèrent utiles pour de multiples raisons. En exigeant la collecte d’images à plus haute résolution, la nouvelle norme vise à permettre aux algorithmes de reconnaissance des visages d’accéder à des informations plus fines sur les visages. Ces informations permettent une reconnaissance faciale précise des jumeaux (les systèmes contemporains ne font pas la distinction entre les jumeaux identiques), une meilleure appréciation des photos par l’homme, par exemple pour étayer un témoignage en salle d’audience, et également une meilleure détection des images « d’attaque » (par exemple à partir de tentatives de spoofing).

Quels sont les autres éléments moteurs ?

Un nombre croissant d’applications de gestion de l’identité civile et d’application de la loi utilisent un grand nombre d’images de visages, qui pourraient plus tard servir de référence. Il existe également de nouveaux programmes utilisant la reconnaissance faciale, comme celui de l’Union européenne pour la confirmation biométrique des sorties. Les États-Unis pilotent la reconnaissance faciale pour la sortie dans les aéroports, tandis qu’en Inde, le programme Aadhaar a commencé à permettre la reconnaissance faciale pour l’authentification.

Voici quelques problèmes techniques :

  • Caméras à l’aveugle – La plupart des images de visages sont collectées à l’aide de caméras qui ne reconnaissent pas les visages. Cela contraste avec la situation de la biométrie des empreintes digitales et de l’iris, où les capteurs permettent une prise de conscience explicite du type d’image qui doit être collecté. Une conséquence simple est que certaines images comprennent deux visages, peut-être ceux d’une personne en arrière-plan ou d’un t-shirt. De telles situations peuvent nuire à la reconnaissance.
  • Dépendance à l’égard des spécifications de conception des images – Les visages sont en grande partie collectés à l’aide d’appareils photo configurés selon une norme documentaire, qui régit la géométrie et la photographie. Il est également fréquent que les photographies soient collectées sans aucune évaluation de la qualité, le photographe étant le seul à en vérifier la conformité.
  • L’évaluation de la qualité est séparée de la collecte – Dans de nombreux cas, une photographie est collectée puis soumise à un serveur dorsal, où sa qualité est évaluée. Si une mauvaise qualité est détectée (par des moyens humains ou automatisés), une nouvelle saisie est lancée quelques heures ou quelques jours plus tard, avec les frais que cela implique.
  • Mauvaise présentation – Les principaux facteurs d’échec de la reconnaissance proviennent de sujets qui ne font pas une présentation frontale, neutre, les yeux ouverts, sans lunettes, avec le visage dans la bonne position. De tels cas sont inévitables lorsque l’on utilise des caméras qui ne sont pas sensibles au visage.
  • Dépendance des gains de précision de la reconnaissance des visages – Les algorithmes de reconnaissance des visages font l’objet de recherches approfondies et les gains de précision ont été documentés. Cependant, les recherches ne sont pas les mêmes en ce qui concerne l’amélioration de la qualité des images des visages.

Les personnes impliquées dans le processus de reconnaissance faciale commettent des erreurs, surtout lorsque la qualité de l’image est mauvaise :

  • Rôle intégral du jugement humain – Dans les applications d’identification telles que les listes de surveillance, les examinateurs humains déterminent si les hypothèses des algorithmes de recherche automatisés sont des faux positifs ou des vrais positifs. De même, lors des vérifications, les humains examinent les rejets pour déterminer s’ils sont faux ou vrais négatifs.
  • Le rôle de l’homme est sapé par les systèmes automatisés – La reconnaissance automatique et la reconnaissance du visage humain fonctionnent avec différents types d’images. Les humains ont besoin de vues à haute résolution, alors que les algorithmes automatisés sont largement construits autour de vues frontales standardisées à relativement faible résolution. Généralement, les images à faible résolution sont utilisées dans les processus d’arbitrage humain parce que les images à haute résolution n’ont jamais été collectées.

Comme mentionné précédemment, cette norme spécifie les propriétés des sous-systèmes biométriques de capture de visages de la prochaine génération destinés à améliorer l’aptitude des photographies à la reconnaissance automatique des visages, à réduire la variabilité de ces photographies, à améliorer la prise en charge de l’identification du visage humain et à empêcher la falsification et la modification illicite des photographies.

Il comprend également des spécifications pour de nouvelles fonctionnalités des sous-systèmes de capture d’images de visages qui visent la qualité des images. Son rôle principal est la collecte d’images de visages vierges provenant de sujets coopérants et susceptibles de résider dans une base de données d’inscription faisant autorité. En outre, il aborde d’autres questions, par exemple, il ajoute un support pour l’expertise médico-légale humaine ; il formalise la compression ; il inclut une protection contre la manipulation et l’altération des images ; il fusionne les processus d’impression.

https://iecetech.org/Technical-Committees/2020-02/New-standard-under-development-aims-to-minimize-facial-recognition-errors

https://www.iec.ch/dyn/www/f?p=103:7:9517014136506::::FSP_ORG_ID,FSP_LANG_ID:5510,25