Prenez un objet d’étude complexe, un volcan dont s’échappent des fumeroles par exemple. Ce comportement est le résultat d’interactions entre de nombreux éléments, qui ont chacun leur temporalité et leur poids propres dans le système étudié. Idéalement, pour comprendre ce type d’objet, il faudrait pouvoir suivre chacun des éléments impliqués dans le comportement général : la température du magma, la percolation de l’eau de pluie, le réseau de failles par lesquelles passent les fumerolles… et sûrement encore bien d’autres paramètres auxquels nous n’avons pas accès, ou que nous ne soupçonnons même pas. Trouver les relations entre ces éléments, les motifs récurrents, demande de procéder à une approximation, une modélisation du système.
Mais les outils prédictifs actuels, du type deep learning, fonctionnent le plus souvent sous forme de boîte noire : à partir des données mesurées, on obtient une prédiction sur l’évolution future d’un système, mais celle-ci est uniquement phénoménologique, descriptive. Autrement dit, elle ne permet d’établir que des corrélations entre données amont et aval. Pour remonter aux causes, il faut changer la façon de modéliser le système. La solution ? Injecter un minimum de compréhension physique et relier la dynamique du modèle à celle des mécanismes en jeu et de leurs interactions.
À la recherche des causalités
Le projet de Nicolas Brodu vise à mettre au point une nouvelle classe de modèles prédictifs qui conserve ce sens physique et apporte un gain de compréhension sur le fonctionnement du système. Et, notamment, qui permette d’identifier des états "causaux" : des états qui, lorsque notre objet s’y trouve, mènent toujours au même type de comportement. La modélisation consiste alors à décrire la dynamique de ces états de façon probabiliste, en se basant sur les données observées. Quelles sont les mesures pertinentes ? À quoi correspondent ces états ? À quelles échelles faut-il modéliser le système ? Que ce soit pour une utilisation en vulcanologie, dans le domaine des interfaces cerveau-machine, de la modélisation des mouvements dans une foule, ou pour des applications de type maintenance industrielle, répondre à ces questions demande une étroite collaboration avec les spécialistes de ces disciplines. Grâce à ces échanges, les chercheurs pourront déterminer les paramètres à mesurer pour que les données collectées soient représentatives des états internes du système étudié. Car l’objectif principal est de fournir aux chercheurs de nouveaux outils pour mieux comprendre la dynamique de leurs objets d'étude. Et c’est uniquement si ces modèles sont bien construits, avec l'appui des spécialistes et de leurs connaissances disciplinaires, qu’ils auront une chance de concurrencer, voire de surpasser les boîtes noires actuelles.
Être pionnier, dans la rupture…
L’idée d’utiliser les états internes d’un système pour prédire son comportement futur ne date pas d’hier. C’est notamment la spécialité de Jim Crutchfield, de l’université de Californie à Davis, qui a accepté d’être partenaire du projet TRACME. Dans les années quatre-vingts, ce chercheur a mis au point des algorithmes adaptés à cette modélisation dans le cas où les données sont des séries de valeurs finies, dénombrables. Il a démontré que l’utilisation de ces états causaux constitue, en théorie, le meilleur prédiseur de l’évolution du système. Mais si ces modèles s’avèrent élégants, ils sont également d’une grande complexité algorithmique. Et les utiliser pour calculer les états causaux à partir de données mesurées sur des systèmes réels nécessite souvent de fortes approximations, ce qui détruit une bonne part de leur pouvoir prédictif… On obtient en pratique de meilleures prédictions à partir de modèles plus simples, qui peuvent être mieux calibrés à partir des données.
L’objectif de l’action exploratoire (AEx) TRACME consiste justement à dépasser cet état de l’art et à modéliser les états internes causaux pour des données continues. Ce qui va demander d'utiliser un nouveau formalisme mathématique pour construire les états causaux, dont on puisse tirer des algorithmes complètement différents. Pour ce faire, Nicolas Brodu explique :
On va puiser dans le machine learning la physique statistique, les équations qui permettent de décrire le comportement d’un système sous forme probabiliste…
Mais aussi du côté de... la finance. Car les algorithmes de modélisation des aspects aléatoires des marchés sont bien adaptés à l’étude de systèmes dynamiques dont l’évolution n’est pas déterministe.
Ainsi, en plus de trouver des applications en s’appuyant sur des connaissances disciplinaires très variées, une caractéristique majeure de TRACME est aussi de puiser dans une grande pluridisciplinarité d’aspects méthodologiques.
… mais aussi dans la continuité
Et pour réussir cet interfaçage, le parcours de Nicolas Brodu représente un atout majeur. Après une thèse utilisant l’informatique pour comprendre le comportement des systèmes complexes, déjà, ce touche-à-tout s’est retrouvé tour à tour à travailler sur le cerveau, dans un laboratoire de géosciences, dans le traitement d’images satellitaires, ou encore sur la simulation et la mesure des forces dans les milieux granulaires.... Il endosse alors l’habit d’un physicien et publie en tant que tel dans des revues spécialisées. Grâce à ces expériences, il acquiert une compréhension directe des problématiques du point de vue des chercheurs des différentes disciplines, et peut y appliquer ses connaissances en algorithmique. Une approche scientifiquement très productive pour celui pour qui « la pluridisciplinarité ce n’est pas être assis entre deux chaises mais être capable de comprendre le point de vue de celui qui s’assoit sur chaque chaise. »
Quid des applications industrielles et de l’impact sociétal possible de cette action exploratoire ? Pour l’instant, il bien trop tôt pour s’avancer. Si une première approche mathématique a été élaborée par Nicolas Brodu et a servi de base à la soumission de son projet TRACME, la sélection de ce dernier ne date que de ce début d’année. L’heure est au recrutement d’un doctorant, qui débutera en octobre puis suivront six mois de cours à l’UC Davis (Californie, USA) afin de se former aux techniques de base de la physique statistique, des systèmes dynamiques et des systèmes complexes, dans l'équipe de Jim Crutchfield.
L’objectif ne sera peut-être pas atteint d’ici trois ans ; mais à terme, l'obtention d'une nouvelle classe de modèle avec de bonnes capacités prédictives, interprétable, pourrait se révéler un atout précieux pour de nombreuses applications tant scientifiques qu'industrielles. Alors que des modèles concurrents se contentent de prédire un comportement, sans sens physique, TRACME propose de donner une compréhension du degré de complexité, ou au moins d’activité, du système. L’exemple type d’une action de recherche à risques, mais dont le gain espéré est majeur.
Nicolas Brodu, résolument pluridisciplinaire
Passionné de programmation depuis l’âge de treize ans, Nicolas Brodu a d’abord travaillé comme ingénieur dans l’aérospatiale, avant de soutenir une thèse sur les systèmes complexes à l’université Concordia, à Montréal. Rapidement attiré par les sciences naturelles, il entre ensuite en postdoctorat dans l’équipe ANR OpenVibe d’Inria Rennes, où il travaille sur le traitement des signaux d’électro-encéphalogramme (EEG) pour la réalisation d’interfaces cerveau-machine. Il intègre ensuite un laboratoire d’hydrogéologie, puis enchaîne deux postdoctorats en physique, sur les écoulements granulaires, d’abord à l’Institut de physique de Rennes, puis à Duke University aux États-Unis. Revenu en France, il entre en postdoctorat à Inria Bordeaux en 2014, pour se consacrer au traitement d’image et de signal, puis il y est recruté comme chargé de recherche au sein de l’équipe projet GEOSTAT en 2016.
*Trajectoires causales multiéchelles
L'action exploratoire TRACME a été renommée CONCAUST en décembre 2020.