Vous avez rejoint Inria en 2015 et faites partie de l’équipe-projet Magnet. Quel est l’objet de vos travaux?
Magnet signifie machine learning in large information networks . Cette équipe-projet est commune avec le CNRS, les universités Lille 3 et Lille 1* et réunit quatorze chercheurs. Nous nous concentrons sur la définition des méthodes et modèles d’apprentissage automatique au sein des réseaux d’informations. La collecte de données peut concerner des domaines très différents : des réseaux classiques comme des infrastructures routières ou encore des réseaux économiques, des réseaux sociaux, des réseaux en biologie, etc.
Quels sont les domaines d’activité impactés par vos recherches ?
Nos travaux peuvent s’avérer utiles dans le cadre de systèmes de veille, de recherche et d'extraction d'informations, de recommandations ou encore de prévision de schémas de comportements. La biologie médicale est un important domaine d’applications. À partir d’un historique de données sur des patients, nous pouvons établir des prédictions sur leur avenir médical et déterminer par exemple quels types de complications pourraient survenir lors d’un séjour à l’hôpital ou encore quels sont les médicaments susceptibles de les guérir.
Quels types d’acteurs ciblez-vous ?
Nos recherches intéressent tous types d’acteurs, dans le domaine universitaire aussi bien que dans l’industrie. En général, ces acteurs possèdent une énorme masse de données qu’ils désirent exploiter afin d’améliorer les processus opératoires. Les applications couvrent des domaines très étendus : de la même manière que l’on peut prévoir le futur d’un patient humain, il est tout à fait possible, grâce à l’exploitation de données, d’envisager les éventuelles pannes d’équipements ou matériels dans une usine. D’un point de vue mathématique, le processus d’alerte précédant un risque de problème est le même chez les patients humains et les machines.
Vous venez aussi d’obtenir une bourse ERC (European Research Council) « Proof of concept project » pour le projet SOM. De quoi s’agit-il ?
SOM se fonde sur le projet de recherche de base MiGraNT (Mining Graphs and Networks ) qui a pris fin en 2015 et pour lequel j’ai reçu une bourse ERC "Starting Grant" à l’université de Ku Leuven en Belgique. Dans le cadre de MiGraNT nous avons développé une approche d’extraction d’informations basée sur des données représentées sous forme de graphes. Notre travail a abouti au développement d’une compréhension théorique de cet apprentissage pour construire des algorithmes utilisables dans des applications de la vie de tous les jours.
Quelle est la différence entre SOM et MiGraNT ?
Le projet ERC-PoC SOM va nous permettre de mettre en pratique la théorie développée au sein de MiGraNT. Il va donc falloir aller à la rencontre de communautés et d’entreprises et les convaincre que ces projets, au travers d’applications concrètes, peuvent leur apporter des bénéfices économiques.
Comment définiriez-vous les applications concrètes du projet SOM ?
L’objectif du projet est d’étudier des méthodes d’apprentissage propres à préserver la confidentialité dans des données structurées en réseaux. Nous nous intéressons plus particulièrement à des domaines impliquant des appareils mobiles. Par exemple le crowdsourcing ou encore le covoiturage : on essaiera ainsi de prédire le trajet possible d’un conducteur sur la base des informations qu’il aura préalablement entrées dans l’application. L’idée est donc d’améliorer le caractère prédictif de certains modes de fonctionnement tout en s’assurant que les règles de confidentialité soient préservées.
Quels sont les projets d’études dans lesquels vous êtes impliqué au sein d’Inria ?
À l’heure actuelle, je travaille sur le projet MUST dont l’objectif est de réduire les émissions de CO2 sur les routes. Nous travaillons en collaboration avec des fabricants de dispositifs enregistrant les emplacements GPS de quelque deux mille véhicules. L’idée est donc d’analyser ces données et de comprendre de quelle manière il est possible de réduire les émissions de gaz en utilisant par exemple des itinéraires différents.
* au sein de l'UMR 9189 CNRS-Centrale Lille-Université Lille1, CRIStAL.