Grâce à ses recherches, les ordinateurs apprennent à voir !

Date:
Mis à jour le 19/03/2020
Membre de l'équipe-projet Thoth au centre Inria Grenoble Rhône-Alpes, spécialisée dans l'intelligence artificielle appliquée à la vision par ordinateur, Julien Mairal vient de recevoir le prix « PAMI Young Researcher Award » , qui récompense les travaux d'un jeune chercheur. Une reconnaissance internationale pour des recherches qui ont permis des avancées concrètes pour l’apprentissage de modèles visuels.

Quel est le domaine de recherche pour lequel vous venez d'être récompensé ?

Julien Mairal
© Inria / Photo C. Morel
© Inria / Photo C. Morel

Le prix récompense les travaux de début de carrière d’un chercheur. Parmi les miens, ceux ayant eu le plus d’impact sont liés à ce qu’on appelle le codage parcimonieux. En science, il est relativement fréquent de chercher un modèle mathématique permettant d’expliquer certaines observations. Lorsque l’on doit choisir parmi plusieurs modèles qui semblent également plausibles, le principe de parcimonie nous dit de privilégier le modèle le plus simple, impliquant le plus petit nombre de variables du problème.

Une partie de mes travaux sont liés à l’automatisation de ce principe pour traiter rapidement une quantité importante de données, notamment pour l’apprentissage de modèles visuels. Dans le cadre de l’image, le principe de parcimonie se traduit par le fait qu’un signal d’entrée est approximativement la somme d’un petit nombre de motifs élémentaires.

Concrètement, quels sont les champs d'application de ces travaux ?

Il est possible de toucher un grand nombre de domaines scientifiques avec les mêmes algorithmes et modèles mathématiques. J’ai ainsi pu travailler avec des modèles visuels pour la restauration d’image (enlever le bruit ou le flou d’une image) et pour la reconnaissance automatique du contenu des images. Ces modèles peuvent également être appliqués dans d’autres cadres. Je reçois ainsi régulièrement des contacts de personnes utilisant mes travaux pour des problèmes de biotechnologie, neurosciences, ou en imagerie médicale par exemple.

Quels sont les défis et les enjeux du futur dans ce domaine ?

Ces dernières années, la technologie s’est beaucoup améliorée en ce qui concerne la reconnaissance visuelle. Par exemple, il y a une dizaine d’années, nous travaillions sur des bases de données comportant environ 10 000 images et une vingtaine de classes d’objets. Aujourd’hui, nous entraînons des modèles plus complexes sur plusieurs millions d’images capables de reconnaître une dizaine de milliers d’objets différents.

Nous allons de plus en plus vers des modèles intégrant pleinement reconnaissance visuelle et langage naturel, afin qu’un ordinateur puisse décrire automatiquement le contenu d’images avec des phrases sensées. Une partie de l'enjeu est de mettre au point des outils qui vont pouvoir traiter de plus en plus d'informations !

Des données massives sont générées et disponibles quotidiennement un peu partout, que ce soit dans le secteur médical ou encore le secteur automobile, pour développer les véhicules sans conducteur par exemple. La technologie va devoir répondre à cela, car toutes ces informations ont besoin d'être traitées. À terme, un autre défi est d’améliorer l'apprentissage non (ou faiblement) supervisé, c'est à dire de développer des systèmes n’ayant pas besoin d’une quantité faramineuse de données étiquetées à la main, comme c’est le cas aujourd’hui.

Que représente pour vous le prix PAMI  ?

C'est une récompense importante pour mes travaux en apprentissage et sur la vision artificielle. C'est aussi une reconnaissance au niveau international, c'est donc très gratifiant car c'est un prix très prestigieux. Je suis honoré d'en être le lauréat.

PAMI  : un prix prestigieux

Le prix PAMI (Pattern Analysis and Machine Intelligence) Young Researcher est décerné chaque année par la IEEE Computer Society, la plus importante association internationale dans le domaine des technologies de l'information. Le prix, qui récompense les travaux d'un jeune chercheur dans les sept ans de publication de sa thèse, a été décerné à Julien Mairal à l'occasion de la conférence « Computer Vision and Pattern Recognition », qui s'est déroulée en juillet dernier à Hawaï.