Intelligence artificielle : quand les machines apprennent à oublier

Date:
Mis à jour le 08/04/2021
Daniele Calandriello, doctorant au sein de l’équipe-projet Sequel du centre de recherche Inria Lille - Nord Europe, vient de voir ses travaux de recherche récompensés par l’Association française pour l’intelligence artificielle (AFIA). Il y formalise une méthode pour permettre aux machines de ne retenir que l’essentiel au cœur de jeux de données très volumineux, afin de les rendre plus autonomes.
Illustration IA
Geralt via Pixabay, CC0

Les experts du cerveau humain qui s’intéressent aux mécanismes de la mémoire considèrent notre faculté à oublier comme aussi essentielle à l’intelligence que nos capacités à stocker des données. Mémoriser uniquement les informations importantes nous permet de mieux nous adapter à des environnements évolutifs. C’est l’une des principales différences entre l’intelligence humaine et l’intelligence artificielle : nous sommes capables de généraliser et d’extrapoler à partir d’informations parfois parcellaires.

Au contraire, une intelligence artificielle fonctionne, classiquement, à partir d’un très grand nombre de données, à partir desquelles un algorithme crée des connexions, des graphes. Très efficaces dans certains environnements, ces mécanismes se heurtent, à très grande échelle, aux capacités de stockage et de calcul de nos appareils. Certains programmes sont donc inapplicables à partir d’une certaine échelle.

Des machines qui savent oublier

L’équipe-projet Sequel* du centre Inria Lille - Nord Europe travaille depuis plusieurs années à concevoir des algorithmes permettant aux machines de faire le tri parmi des grands volumes de données, afin de démultiplier leurs capacités. Daniele Calandriello, qui a effectué sa thèse au sein de l’équipe, vient de recevoir le prix de la Thèse IA 2018 de l’AFIA (Association française pour l’intelligence artificielle). Son travail intitulé “Apprentissage séquentiel efficace dans des environnements structurés avec contraintes” a été coencadré par deux chercheurs Inria de l’équipe : Michal Valko et Alessandro Lazaric (aujourd’hui en détachement chez Facebook).
« Grâce à sa méthode, des programmes qui ne pouvaient jusqu’alors être appliqués que par des data centers seront désormais accessibles à des smartphones », s’enthousiasme Michal Valko.

Ces travaux s’appliquent aux environnements dits stochastiques, c’est-à-dire des environnements dans lesquels un très grand nombre de données sont enregistrées au fil de l’eau et de manière aléatoire. C’est le cas des réseaux sociaux, qui collectent de nouvelles informations en permanence, mais aussi des systèmes de reconnaissance faciale, qui analysent des images de personnes en mouvement. Les graphes obtenus croissent de manière exponentielle et les programmes qui les traitent nécessitent dès lors des capacités de calcul démesurées.

Grâce à la méthode développée par Daniele Calandriello et l’équipe Sequel, une machine peut désormais apprendre à réaliser elle-même un tri dans les connexions entre les données qu’elle reçoit afin de n’en conserver que l’essentiel. Aucune donnée n’est perdue, mais les graphes qui les connectent sont allégés.

Du marketing à la médecine

Cette méthode fonctionne de manière séquentielle : à chaque nouvelle information enregistrée, le système détermine, au regard des données déjà stockées, la valeur des nouveaux éléments. Les algorithmes d’intelligence artificielle qui fonctionnent à partir des graphes ainsi épurés, traitent un volume d’informations moins important sans perdre en efficacité, ce qui renforce leurs performances.

Mais son principal atout est de réduire à son minimum l’intervention humaine dans le processus, en rendant la machine plus autonome.

La méthode, formalisée et prouvée par Daniele Calandriello, a d’abord germé dans les travaux de Michal Valko. Dès 2009, il avait déjà développé un algorithme de reconnaissance faciale pour Intel, qui offrait alors aux utilisateurs de ses appareils la possibilité de les déverrouiller avec leur visage.
Mais l’équipe imagine désormais des applications dans le domaine du marketing notamment, en partenariat avec Adobe : « nous préparons une application qui sera en mesure de traiter l’intégralité des informations publiées dans le monde sur les réseaux sociaux, pour identifier à un moment précis les meilleurs influenceurs, dans le cadre d’une campagne marketing ou même politique. Imaginez : Facebook représente deux milliards de nœuds. Nous ne pouvions jusqu’à présent faire fonctionner nos programmes qu’à partir d’un jeu de données limité, une région du monde par exemple. À présent, nous pouvons passer à l’échelle. »
Cette méthode pourrait également s’appliquer à la médecine « imaginez, un système qui permettrait d’enregistrer et d’analyser l’intégralité des informations relatives à un patient en permanence, cela pourrait être un formidable outil pour le corps médical. » Dans le domaine de la santé, Sequel est notamment en contact avec les équipes de DeepMind.

Priorité à l’intelligence artificielle

Daniele Calandriello est le cinquième membre de l’équipe Sequel à recevoir cette prestigieuse récompense de l’AFIA. Ses travaux seront également présentés lors de la Conférence internationale sur le machine learning (ICML), qui se tiendra à Stockholm le 10 juillet 2018.

Cette annonce confirme le rayonnement d’Inria dans ce domaine de recherche et récompense ses efforts constants depuis plusieurs années pour prioriser l’intelligence artificielle dans les travaux de ses équipes. En effet, si Sequel se consacre à la recherche fondamentale en intelligence artificielle online, d’autres équipes-projet se spécialisent en offline ou dans différentes applications des algorithmes.

Inria a par ailleurs pris part à la rédaction du récent Rapport Villani sur l’intelligence artificielle.

 

*L'équipe-projet Sequel est commune avec le CNRS, l'Université de Lille − sciences et technologies et l'Université de Lille − sciences humaines et sociales. Au sein de l'UMR 9189 CNRS-Centrale Lille-Université de Lille − sciences et technologies, CRIStAL.