Les bases de données de graphes : de la détection de fraude à la représentation de molécules
Les travaux de Liat se concentrent sur les bases de données de graphes (graph databases), dont l’utilisation est devenue de plus en plus populaire au fil des ans et de la démocratisation du Web et des services en ligne (banques, réseaux sociaux, sites marchands…). Ces bases de données permettent créer des modèles de relations, afin, par exemple, de détecter des fraudes financières ou de faciliter les recommandations en ligne.
Un domaine de recherche passionnant qui concerne des champs d’application et des secteurs d’activités extrêmement variés : les bases de données de graphes sont aussi bien utilisées par des géants du Web comme Amazon ou Facebook qu’en biologie, pour représenter certains types de molécules comme les protéines.
Fondamentalement, ce type de base de données sert à stocker des informations dans un format graphique, dans lequel les nœuds incarnent les entités et les arêtes illustrent les relations entre ces entités.
Voici ci-dessus un exemple de graphe très simplifié schématisant un réseau social. Au vu d’une personne (dite « nœud », représentée ici par A) et de ses relations (périphéries), il est ainsi possible de déterminer qui sont les « amis des amis » (dont la nature de la relation est représenté par les arêtes/flèches) de cette personne précise. Ici, E est l’ami de A, mais aussi l’ami de D, qui est également l’ami de A.
Établir un langage commun pour une meilleure circulation et compréhension de l’information
Obtenir ces graphes est en réalité loin d’être simple. Pour structurer et analyser les données, en d’autres termes pour les rendre exploitables, il faut entre autres repérer les « motifs », c’est à-dire trouver les récurrences entre les données, les extraire et surtout les interroger en leur posant de bonnes questions, de la bonne manière. Tout cela dans un langage informatique bien précis, évidemment.
Ce langage qui permet d’interroger les bases de données n’est pas unique. Tous les acteurs qui placent les graphes au cœur de leurs activités économiques ont recours à des variantes.
Si tous ces langages possèdent la même racine, un peu comme l’espagnol, l’italien et le français, qui sont des langues latines, n’hésite pas à comparer Liat, les langages utilisés restent très différents des uns des autres, il est difficile de les faire se parler, ce qui pose un véritable problème quant à la fluidité de l’information et la croisée des données.
C’est sur cette question complexe que Liat et son équipe travaillent actuellement au département d’informatique de l’École. Le projet auquel elle contribue est à la recherche d’un nouveau standard de langage de requête (graph query language) afin que tous les acteurs puissent interroger leurs bases de données à partir d’un ensemble standardisé de questions.
Cela permettra une meilleure compréhension des programmes, de leur complexité, de leur signification et de leur exactitude, explique la chercheuse.
Tandis que certains de ses collègues se concentrent sur la partie de la « grammaire informatique » (c’est-à-dire vérifier qu’il y ait bien tous les éléments de langage nécessaires s’enchainant dans le bon ordre, l’équivalent d’un sujet-verbe-complément), Liat s’occupe du champ sémantique, en s’interrogeant sur le sens approprié des mots utilisés.
De l’importance de trouver du sens dans la recherche
Ce processus de définition est développé en même temps que la conception du langage lui-même, par un système d’allers-retours rigoureux. « Cela signifie que nous aurons également un impact sur la conception du langage lui-même. Ce projet pourrait influer sur plusieurs secteurs économiques dans les années à venir et ouvrir de nombreuses questions de recherche, ce qui sera passionnant pour la communauté universitaire », estime Liat avec enthousiasme.
Ce sont ces tout derniers travaux qui valent à la jeune scientifique de faire partie cette année des lauréates des Bourses France L’Oréal-UNESCO Pour les Femmes et la Science.
Grâce à ce prix, je vais pouvoir établir de nouvelles collaborations et maintenir celles existantes en allant à la rencontre de chercheurs étrangers mais aussi en participant à des conférences internationales, détaille-t-elle, reconnaissante.
Tout aussi essentiel, Liat va aussi pouvoir se procurer un meilleur équipement informatique, comme des services cloud adaptés et du matériel plus performant, qui lui permettront de vérifier les résultats théoriques de ses recherches, en mettant en œuvre des algorithmes et en exécutant des expériences. « De manière générale, j’espère que mon travail a et aura un impact positif sur la société », déclare la jeune femme, qui a d’abord imaginé devenir psychologue pour aider les gens à aller mieux.
Et si la vocation de Liat a évolué, elle est heureuse de son métier de chercheuse, qui « lui permet d’apprendre tous les jours et de relever des défis mathématiques ». Elle est aussi très attachée au processus de transmission scientifique : « j’aime le temps de la formalisation de la pensée, le moment où une idée prend forme couchée sur le papier, j’aime aussi les communiquer aux autres, surtout si ce que je fais a du sens, ce que j’espère ! », dit-elle en souriant.
En savoir plus
Source : Article initialement paru sur le site web de l'ENS-PSL