Transformer les données en connaissances : projet ERC de Julien Mairal

Date:
Mis à jour le 30/03/2020
Membre de l’équipe-projet Thoth, Julien Mairal vient d’être récompensé par le Conseil européen de la recherche (European research council , ERC), qui lui a décerné une bourse "Starting Grant ". Pendant cinq ans, le chercheur va pouvoir se consacrer à la recherche d’algorithmes de traitement de données massives plus simples à utiliser et plus performants.

Quel est votre domaine de recherche ?

Je travaille sur l’apprentissage statistique.
C’est un domaine multidisciplinaire, entre l’informatique, les mathématiques appliquées et les statistiques. Cela entre dans le cadre de ce qu’on appelle la science des données ou l’intelligence artificielle.
Il s’agit de transformer des données soit en connaissances scientifiques, soit en outils technologiques.

Aujourd’hui les données sont partout, elles sont médicales, visuelles… Elles concernent la physique, les neurosciences, la biologie… On parle de big data, et pour les traiter, les scientifiques ont besoin d’outils mathématiques et d’algorithmes.

Sur quelles applications d’apprentissage statistique travaillez-vous en particulier ?

Au sein d’Inria, je travaille dans l’équipe Thoth qui est spécialisée dans l’information visuelle que ce soit l’image simple ou la vidéo. Notre but est d’être capable d’organiser automatiquement cette information et de la traduire en mots. En ce qui concerne le projet ERC, l’objectif est surtout de développer des outils très génériques qui seront accessibles aux scientifiques dans un grand nombre de domaines.

Avec l’apparition de données massives et complexes, les techniques d’apprentissage actuelles doivent évoluer. Des succès importants ont été obtenus grâce à des outils qui nécessitent de constituer une base de données massives entièrement "labellisée". Dans le cas des données visuelles, cela signifie définir manuellement ce que représente chaque partie de l’image. Par exemple, une voiture autonome doit être capable d’apprendre à reconnaître ce qu’est un piéton, mais aussi un arbre, une route, un panneau de signalisation…

Pour cela, elle a besoin d’une grande quantité de données labellisées. Cela représente des centaines d’heures de vidéos où l’on a défini que la route se situait à tel endroit, qu’un piéton pouvait se trouver à tel croisement…

Mais labelliser ces quantités énormes de données s’avère très coûteux. Un gros effort de recherche est mené actuellement pour développer des méthodes qui sont plus simples à utiliser et qui sont capables d’exploiter une grande quantité de données non labellisées. C’est ce qu’on appelle l’apprentissage non supervisé. Quelques données labellisées suffiraient alors pour apporter l’information manquante. Or, en la matière, les humains, même de très jeunes enfants, sont infiniment plus performants que les machines. C’est l’un des verrous que l’on cherche à lever dans le cadre de ce projet ERC.

Qu’est-ce qui vous a attiré dans ces recherches ?

Au cours de mes études, j’ai bifurqué assez vite dans l’informatique après la classe préparatoire, mais je me suis intéressé aussi à d’autres domaines. Ce qui est intéressant dans l’apprentissage statistique, c’est l’aspect pluridisciplinaire.. Par exemple, en ce moment, je collabore avec des chercheurs spécialisés dans le traitement de données génomiques, mais aussi avec d’autres experts en neurosciences. Cet aspect transversal est ma principale source de motivation.

Que représente pour vous cette bourse ERC ?

C’est une distinction prestigieuse dans le milieu académique. Il a fallu définir et défendre un projet solide et cohérent. Cela représente un investissement très important qui se prépare longtemps à l’avance. L’étape de réflexion et d’écriture destinée à définir le projet de recherche à long terme est particulièrement intéressante. D’autres aspects sont plus fastidieux comme la communication pour "vendre" le projet auprès du panel de l’ERC.

Comment allez-vous utiliser cette bourse ?

Une fois que l’on a reçu cette bourse, on dispose d’une période de cinq ans pour se consacrer à ses recherches sans avoir à passer tout un temps auxiliaire à essayer de trouver des financements. Dans le monde de la recherche scientifique, cinq ans, c’est relativement long. Concrètement, l’argent va servir à créer une petite équipe de recherche. Quatre ou cinq personnes pourront travailler à temps plein à mes côtés grâce au financement ERC.

 

Julien Mairal
© Inria / Photo C. Morel

Parcours

  • 2002  : entre à l’École polytechnique ;
  • 2006  : obtient un master de mathématiques appliquées à l’ENS Cachan et un diplôme d’ingénieur de Télécom ParisTech ;
  • 2010  : soutient une thèse à Inria Paris-Rocquencourt sur l’apprentissage statistique appliqué à la vision artificielle et au traitement d’image ;
  • 2011 à 2012  : postdoctorat à Berkeley ;
  • 2012  : rejoint Inria Grenoble ;
  • 2013 : reçoit le prix européen Cor Baayen