Explorer des nouveaux modèles prédictifs
Prédire n’est pas comprendre. En tout cas, pas encore ! L’action exploratoire Concaust portée par le chercheur Nicolas Brodu de l’équipe-projet Geostat, pourrait bien faire émerger une nouvelle génération de modèles. Son objectif : explorer de nouveaux outils prédictifs misant sur la simplicité, l’interprétabilité des résultats et la fiabilité. Ces modèles veulent faciliter l’analyse de données scientifiques pluridisciplinaires.
De manière générale, les modèles utilisés à des fins de prédictions sont classés en deux catégories. Les premiers, dits "mécanistes", sont axés sur une connaissance pointue des lois physiques qui régissent un environnement complexe, comme par exemple une forêt. Problème : les processus animant ces systèmes sont si nombreux, qu’établir un modèle simple à grande échelle peut s'avérer trop fastidieux. Les seconds s’appuient sur des algorithmes génériques d’intelligence artificielle, mais ceux-ci ne permettent en général pas de comprendre les relations entre paramètres qui mènent aux prévisions qu’ils réalisent.
Une modélisation centrée sur la causalité
Face à ce constat, les scientifiques ambitionnent une nouvelle génération de modèles innovants en partant d’observations de terrain. Ils permettent d’exploiter ces données pour en extraire de nouvelles connaissances et expliquer leurs prédictions. Cette idée originale s’inspire de méthodes de physique théorique nées dans les années quatre-vingts basées sur le concept « même cause – même conséquence ». Ainsi, chaque fois qu'un système se trouve dans un même état dit "causal", il évolue toujours en suivant les mêmes lois de probabilité.
Par exemple, une forêt dans un état de sécheresse réalisera toujours moins de photosynthèse. Mais à quel point son activité va-t-elle être affectée ? Quels paramètres vont l’influencer et comment ? Pour y répondre, le modèle de l’action exploratoire scrute les relations entre les paramètres des observations passées. Il peut s’agir d’associations de données météorologiques, de mesures de flux de CO₂, etc. Les informations extraites définissent les différents états possibles du système étudié, ici la forêt. Ainsi, en comparant l’état actuel à tous les états observés par le passé, le modèle prédit les futurs probables de notre forêt.
L’objectif n’est pas de concurrencer les modèles mécanistes qui feront toujours mieux sur des cas précis. De même, ceux de machine learning – utilisant le principe « qui se ressemble s'assemble » – sont déjà très utiles et efficaces pour effectuer des prédictions. Concaust vise au contraire une voie intermédiaire menant à une bonne "prédictabilité" tout en gardant une bonne "interprétabilité".
Faciliter l’interprétabilité des données
Le modèle causal permet d’identifier les informations qui vont expliquer la dynamique du système à une échelle donnée. Par exemple, le cycle saisonnier influe sur l’évolution annuelle de la photosynthèse, avec un maximum l’été et un minimum l’hiver lorsque les arbres sont nus. Celle-ci dépend également de la nature des plantes ou des cultures qui recouvrent l’espace à modéliser.
Dans chaque cas, le modèle Concaust permet de retrouver les indicateurs déjà connus par les chercheurs comme ceux susmentionnés. Mais les scientifiques espèrent également en voir ressortir d’autres jusqu’à présent sous-estimés ou restés cachés dans les données. « Notre modèle part toujours d’une problématique d’intérêt pour la discipline qui va l’utiliser », explique Nicolas Brodu. Ce dernier et sa collaboratrice Yao Liu s’intéressent par exemple aux paramètres impliqués dans la résilience des écosystèmes terrestres. Autrement dit, leur capacité à revenir à un état stable après avoir subi une perturbation (infection parasitaire, sécheresse, etc.).
Répondre à des enjeux scientifiques pluridisciplinaires
Afin de vérifier son hypothèse, Nicolas Brodu a testé sa méthode sur l’évolution du phénomène climatique El Niño en collaboration avec les experts Luc Bourrel et Pedro Rau qui l’étudient depuis des années. Celui-ci est rythmé par des oscillations cycliques de la température de surface de la mer et des vents. À son extrême, il affecte de manière inversée les zones continentales de chaque côté du Pacifique sud. Celles-ci sont tantôt touchées par d’importantes sécheresses et des incendies, tantôt par des pluies diluviennes et des inondations dévastatrices.
Les scientifiques se sont demandés si ce modèle permettrait de détecter les prémisses de rares événements extrêmes suffisamment à l’avance. Résultat : sur les données passées, celui-ci parvient à détecter des déviations menant aux événements extrêmes jusqu'à six mois à l'avance. « Chacun de ces événements étant différent, il n’est pas encore possible de conclure sur l'apparition d'événements futurs, mais ces résultats préliminaires sont déjà très encourageants », témoigne le chercheur. Le modèle identifie également plusieurs informations clés pour expliquer cette dynamique : le cycle annuel d’El Niño, la pluviométrie – tous deux déjà connus – mais il souligne également le rôle important joué par la force globale des oscillations.
« Pour le moment, les indicateurs existants sont très génériques. Nous souhaitons évaluer si notre modèle peut apporter des indicateurs plus pertinents selon chaque typologie des régions touchées (zones côtières, arides, humides, en altitude, etc.), car elles n’ont pas les mêmes contraintes », ajoute le chercheur. De telles informations permettraient de déterminer des seuils d’alerte à partir de données mesurées facilement sur le terrain pour prévenir de l’arrivée d’un événement majeur. Et de vérifier si cela marche, c’est la prochaine étape.
Que vous a apporté cette action exploratoire ?
Verbatim
L’action exploratoire nous donne les moyens financiers et institutionnels de prendre des risques sans exigences de publications et de résultats immédiats. Elle m’a permis de faire un travail de fond qui nourrira de la recherche plus applicative pendant des années.
Porteur de l'action exploratoire Concaust
Pour aller plus loin
- El Niño – La Niña oscillations (en anglais), Concaust
- Actions exploratoires Inria : prendre des risques, Inria, 30/04/2021