Changed on 18/01/2024
À l’aide de son smartphone tout un chacun peut mettre un nom sur une plante inconnue rencontrée lors d’une balade : une simple photo et l’intelligence artificielle se charge du reste… Mais la réponse ne repose que sur de la statistique. Pas sur de la connaissance en morphologie botanique. Au Centre Inria de l’Université de Rennes, l’action exploratoire Back to the Trees ambitionne de forger un outil capable de modéliser cette connaissance séculaire pour ensuite identifier une plante par sa description morphologique. L’application pourra servir aux botanistes durant leurs observations, mais aussi au grand public à des fins pédagogiques.
Clé de détermination extrait de la Flore Bonnier
© BnF Gallica

                                                                                  Clé de détermination extrait de la Flore Bonnier

 

Pl@ntNet. INaturalist. PlantSnap. Tela Botanica. Smart’Flore. LeafSnap. Les applications mobiles pour identifier les plantes font florès. Elles s’appuient sur des réseaux de neurones qui agissent comme d’immenses classificateurs d’images. En quelques millisecondes, la réponse s’affiche comme par magie. “Mais ces applications ne couvrent tous les besoins, nuance Simon Castellan, chercheur en informatique au Centre Inria de l’Université de Rennes. Tout d’abord, elles fonctionnent un peu comme un oracle qui répond, mais qui n’explique pas à l’utilisateur pourquoi il donne telle réponse plutôt qu’une autre.” Pour le grand public, impossible donc d’apprendre la botanique via ces applications. “Et pour les botanistes, cette technologie ne suffit pas, car leur pratique scientifique repose sur une toute autre approche exigeant souvent une observation très fine de la plante.

D’où l’idée de construire un outil radicalement différent qui soit capable de se glisser dans cette logique descriptive pour devenir utile aux botanistes et servir aussi à des fins pédagogiques. C’est l’objectif de Back to the Trees. Cette action exploratoire transdisciplinaire est portée par Simon Castellan avec le concours du bio-informaticien Éric Tannier et du botaniste Jos Käfer, du Laboratoire de biométrie et biologie évolutive (LBBE) de Lyon. Une action exploratoire Inria est un dispositif interne pour faciliter l’émergence de nouvelles thématiques de recherche en donnant aux scientifiques les moyens de tester des idées originales.

Flores et clés de détermination

Historiquement, pour connaître et reconnaître les plantes en fonction de leur morphologie, pour les classer par familles, genres et espèces, les botanistes ont produit deux types de documents. Premièrement : les flores. “Ce sont de grands livres servant à décrire la flore d’un écosystème : un pays, une région… Ils ressemblent à des dictionnaires. Il en existe des centaines.” Deuxièmement : les clés de détermination. “Là aussi, ce sont de grands livres, mais pour identifier la plante. Ils fonctionnent sous forme de questionnaires offrant des possibilités de réponses. Les feuilles sont-elles simples ou composées de plusieurs folioles ? Si elles sont composées, allez à telle page. Les étamines et les pétales sont-elles réunies aux sépales par leur base ? Si oui, allez à telle page. Etc.” En informatique, on appellerait cela… un arbre de décision.

Cette identification par observation s’avère moins simple qu’il n’y paraît car l’évolution du végétal a produit un long continuum morphologique. Pas toujours facile de savoir si une plante se trouve d’un côté ou de l’autre d’une délimitation décidée entre deux espèces. Si les feuilles tirent plutôt sur le rouge ou sur l’orange… En outre, le classement lui-même peut s’opérer selon différents critères. Les clés de détermination ne sont pas complètement normalisées. Et pour compliquer encore un peu les choses, au sein d’une même espèce, les plantes ne se ressemblent pas toutes. Il existe une certaine variabilité.

L’action exploratoire comprend deux axes de recherche.

 

D’abord, formaliser cette connaissance botanique. Donc convertir dans un modèle toute cette information accumulée au fil des siècles, rédigée en langue naturelle, parfois ambiguë et utilisant des terminologies disparates. Pour cela, nous avons proposé un modèle. Nous sommes les premiers à aller aussi loin. Mais nous avons conscience des limites de cette modélisation. Il faut rester très humble par rapport à ce continuum végétal. Il ne s’agit pas de catégoriser pour catégoriser.

 

Le défi ? “Savoir par quoi commencer. Pour chaque espèce, il y a énormément de critères. Lesquels mettre en premier ? La composition des feuilles par exemple ? Ou y-a-t-il d’autres critères plus intéressants ?

Aider l’observateur à décrire la plante

En s’appuyant sur cette formalisation, le deuxième axe vise à générer ensuite des clés de détermination. Un problème en réalité très complexe. Car pour aider l’observateur d’une plante à avancer dans sa description, il faut produire un système de questionnaire où s’enchevêtrent énormément de critères selon de multiples déroulés. Alors comment procéder ? C’est en observant le jeu de lettres Wordle que la réponse est venue. Il faut deviner un mot de cinq lettres en faisant des propositions successives. “Or, finalement, c’est un peu pareil. L’enjeu pour générer la clé de détermination, c’est de savoir poser la meilleure question possible pour avancer.”  En s’intéressant aux algorithmes conçus pour optimiser les réponses à Wordle, les scientifiques ont ensuite “dépoussiéré toute une littérature sur la génération d’arbres de décisions basés sur la théorie de l’information.

À partir de là, l’outil prend la forme de fiches que l’on peut venir renseigner via un formulaire de saisie. “Je prends la pâquerette, par exemple. On me demande si c’est une herbacée ou une plante ligneuse. Si c’est une herbacée, possède-t-elle une tige ? Si oui, cette tige est-elle droite ? Grimpante ? Rampante ? Poilue ? Si on la coupe, est-elle creuse ? Aquatique ou pas ? Comment sont les feuilles ? Comment sont les bordures des feuilles  ? Etc.

Mais pour que ces clés de détermination soient pleinement efficaces, elles doivent posséder une qualité supplémentaire : “la tolérance aux erreurs. Et cela, c’est important. D’une part, parce que les données peuvent comporter des erreurs. Parfois aussi, le botaniste comprend mal la question et se trompe. Il arrive également que la plante soit un peu atypique par rapport à son espèce. Ou qu’elle se situe à la frontière entre deux espèces. On ne sait pas bien de quel côté.” Or, avec une clé classique, si le botaniste part dans la mauvaise direction du livre, il s’enferme dans une impasse.

Remettre la personne sur de bons rails

Dans l’idéal, il faut donc un questionnaire capable de remettre la personne sur le bon rail même si elle s’est trompée une ou deux fois. Comment ? Tout d’abord, en laissant une marge de manœuvre dans les réponses. Si le botaniste hésite entre deux couleurs pour décrire une feuille, il peut cocher plusieurs cases à la fois. Ensuite, en adoptant une approche probabiliste basée sur l’inférence bayésienne. “Cela veut dire que nous avons une sorte d’a priori sur la réponse. Nous commençons avec une distribution de probabilité sur chaque espèce. Telle espèce, par exemple, a plus de probabilité d’être présente dans tel écosystème. Donc nous lui affectons un poids. Ce poids va évoluer en fonction des réponses. L’outil demande la couleur des pétales. Si je réponds rouge, le poids augmente. Orange, il diminue un peu. Violet, il diminue beaucoup car c’est à l’autre bout du spectre chromatique attendu.” Donc, peut-être une erreur dans le choix de la plante… “Mais je peux me rattraper à la question suivante. Si la réponse est bonne, le poids remonte.” Ces travaux ont donné lieu à une première publication durant la dernière édition de la conférence Computing Within Limits qui promeut une informatique pour un monde plus durable*.

Pour faire progresser l’outil, les chercheurs travaillent en co-construction avec deux associations locales : Bretagne Vivante et Le Jardin des Mille Pas. Ce dernier organise des balades botaniques. “Ce qui les intéresserait, c’est d’avoir une clé de détermination pour permettre aux visiteurs d’effectuer une promenade de découverte. Notre idée justement, plutôt que de construire une seule grande clé, c’est de générer des clés plus petites, mais pour des écosystèmes particuliers : pour un parc naturel, pour une région, etc. On pourrait les utiliser comme une carte IGN de l’endroit où l’on va, pour identifier, en toute autonomie et de façon conviviale, une plante lors d’une randonnée.

visuel audio bloc par defaut
Titre du lecteur

un outil innovant pour caractériser les plantes avec Simon Castellan

Fichier audio
Audio file