Les deepfakes pourraient anonymiser les personnes dans les vidéos tout en conservant leur personnalité
Les deepfakes pourraient anonymiser les personnes dans les vidéos tout en conservant leur personnalité

L’IA pourrait générer des visages qui correspondent à l’expression de sujets anonymes pour leur garantir la vie privée, sans perdre leur capacité à s’exprimer.
Les nouvelles : Une nouvelle technique utilise les réseaux antagonistes génératifs (GANs), la technologie derrière les deepfakes, pour anonymiser quelqu’un sur une photo ou une vidéo.
Comment ça marche : L’algorithme extrait des informations de l’expression faciale de la personne en trouvant la position des yeux, des oreilles, des épaules et du nez. Il utilise ensuite un GAN, formé sur une base de données de 1,5 million d’images de visages, pour créer un visage entièrement nouveau avec la même expression et l’intègre à la photo originale, en conservant le même arrière-plan.
Problème : Développée par des chercheurs de l’Université norvégienne des sciences et technologies, cette technique est encore très expérimentale. Elle fonctionne sur de nombreux types de photos et de visages, mais trébuche encore lorsque le visage est partiellement occlus ou tourné sous des angles particuliers. La technique est également très problématique pour la vidéo.
Autres travaux : Ce n’est pas la première technique d’anonymisation des visages basée sur l’IA. En février, des chercheurs de l’Université d’Albany ont utilisé l’apprentissage profond pour transplanter des éléments clés des expressions faciales d’un sujet sur un autre. Cette méthode exigeait qu’un donneur consentant offre son visage comme nouvelle toile pour les expressions.
Pourquoi c’est important : L’anonymisation du visage est utilisée pour protéger l’identité d’une personne, comme un dénonciateur, sur les photos et les séquences vidéo. Mais les techniques traditionnelles, comme le flou et la pixellisation, risquent d’être incomplètes (l’identité de la personne peut de toute façon être découverte) ou de dépouiller complètement la personnalité de la personne (c.-à-d. en supprimant les expressions du visage). Parce que les GAN n’utilisent pas du tout le visage original du sujet, ils éliminent tout risque de l’ancien problème. Ils peuvent également recréer des expressions faciales en haute résolution, offrant ainsi une solution à ces dernières.
Cette technique démontre également une nouvelle proposition de valeur pour les GAN, qui ont acquis la mauvaise réputation d’abaisser l’obstacle à la production de fausses informations persuasives. Bien que cette étude ait été limitée aux médias visuels, elle montre par extension comment les GANs pourraient également être appliqués à l’audio pour anonymiser les voix.
- En intelligence artificielle, les réseaux adverses génératifs (en anglais generative adversarial networks ou GANs) sont une classe d’algorithmes d’apprentissage non-supervisé. Ces algorithmes ont été introduits par Goodfellow et al. 2014. Ils permettent de générer des images avec un fort degré de réalisme. Un GAN est un modèle génératif où deux réseaux sont placés en compétition dans un scénario de théorie des jeux1. Le premier réseau est le générateur, il génère un échantillon (ex. une image), tandis que son adversaire, le discriminateur essaie de détecter si un échantillon est réel ou bien s’il est le résultat du générateur. L’apprentissage peut être modélisé comme un jeu à somme nulle.
https://arxiv.org/abs/1909.04538
https://github.com/hukkelas/DeepPrivacy/blob/master/README.md