Des gens qui n’existent pas

Free-Photos / Pixabay

NVidia vient de publier STYLEGAN. Un réseau de neurones qui fabrique des photos de gens qui n’existent pas. Explorons ensemble ce generative adversarial network.

 

Nous avons dans un précédent article exploré comment le concept de latent space permet de représenter de manière simple et puissante des données complexes.

Dans une récente publication, NVIDIA a présenté stylegan, que nous avons expérimenté ici.

Le latent space, que nous avions exploré dans le cadre de la génération de molécules, permet de transformer une entrée (dans le cas de stylegan un portrait), en vecteur (à 512 dimensions dans ce cas).

La puissance de cette approche est de permettre, en choisissant un vecteur aléatoire, de remonter à un portrait. Ce portrait n’est pas celui d’une vraie personne, mais une image dans l’espace latent.

Quelques exemples de portraits générés par stylegan

Sur la figure ci-dessus, nous voyons ces portraits que nous avons générés en tirant au hasard des vecteurs de 512 dimensions. La qualité des portraits est très crédible.

Mieux, si nous faisons le chemin entre un vecteur et un autre, nous voyons comment les caractéristiques de la représentation évoluent.

 

Ce n’est pas un simple « morphing » comme les logiciels des années 90 le faisaient déjà. On peut observer comment le latent space maintient une coiffure crédible, sans la déformer. Puis découvre les lunettes, les crée de manière transparente puis les transforme en lunettes de soleils.

 

La technologie, bien que plus raffinée, est sensiblement la même que celle que nous avions utilisée pour la génération de texte deeppoet.

 

Des implications multiples

Proprement stupéfiantes de qualité, ces images sont difficilement identifiables comme étant fausses. Déjà, la mode des deep fake se répandant avec l’accessibilité de ces technologies, des usurpations d’identités et autres malversations auront sans doute lieu bientôt. Mais voici également quelques questions à se poser:

  • Le prochain acteur à succès sera-t-il humain?
  • Pourra-t-on bientôt corréler le latent space de stylegan avec celui du génome, pour voir le visage des rois?
  •  Les mannequins publicitaires ont-ils un avenir si on peut ne pas payer leurs droits en les remplaçant pas des images générées?

Quelques remarques techniques

  • Le code est disponible sur github mais le modèle préentrainé ne se charge pas avec le code d’origine
  • Vous pouvez le télécharger ici . Ce fichier contient 3 objets, seul Gs est utile (une fois extrait on peut obtenir un réseau de neurones de 100 Mo)
  • Tensorflow 1.10 et un GPU sont nécessaires (la génération d’image est extrêmement rapide)
  • Dans le fichier dnnlib/___init__.py il a fallu désactiver la ligne « submit_config: SubmitConfig = None »
Télécharger cet article au format PDF ou ePub

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.