Action Exploratoire

XGAN

Apprentissage d'une représentation interprétable de vidéos générées par un GAN
Apprentissage d'une représentation interprétable de vidéos générées par un GAN

Malgré des progrès remarquables dans les réseaux adverses génératifs (GAN), ces réseaux fonctionnent actuellement comme des boîtes noires.

XGAN vise à mieux comprendre la boîte noire des GAN pour la génération de vidéos. XGAN propose des stratégies pour interpréter l'espace latent (a) pendant la conception d'architectures interprétables, et par (b) l'analyse de fonctions symétriques appliquées en même temps sur la représentation latente et les patches des images générées en sortie. Pour l'objectif (a), nous concevrons des architectures originales pour générer des vidéos de bonne qualité, condition nécessaire pour que l'analyse de l'interprétabilité soit significative, et pour permettre l'analyse de la représentation du mouvement dans l'espace latent. Une stratégie orthogonale pour l'objectif (b) consiste à aborder la question « Comment les GAN encodent-ils différentes sémantiques dans l'espace latent ? ».

Ici, nous avons l'intention de trouver des correspondances entre des fonctions simples en entrée et en sortie du générateur.

Équipe(s) impliquée(s)
STARS

Contacts

Antitza Dantcheva

Responsable scientifique