Communiqué de presse

Permettre à la science des données de franchir un cap décisif au service de l’intérêt général : l’apprentissage fédéré, un immense défi scientifique

Date:
Mis à jour le 14/12/2022
Alors qu’une plus grande disponibilité de gros volumes de données permettrait des avancées significatives dans de nombreux domaines, notamment en santé, des questions se posent sur le respect de la vie privée, les coûts et les risques liés à la centralisation et à la transmission de gros volumes de données, ou encore l'acceptabilité de l'intelligence artificielle. C’est tout l’enjeu du Défi Fed-Malin qui vient d’être lancé par Inria avec le soutien du groupe La Poste.

Un enjeu majeur pour la recherche : améliorer l’accès aux données, véritable "carburant" de l’apprentissage automatique

L’apprentissage automatique vise à donner aux ordinateurs la capacité d’apprendre à partir de jeux de données, c’est-à-dire d’améliorer leurs performances à résoudre des tâches sans être explicitement programmés pour chacune. Il s’appuie, pour cela, sur des procédures, les algorithmes d’apprentissage, qui permettent à la machine de s’entraîner et d’apprendre à partir d’exemples qu’on lui présente.

Dans de nombreux cas d'utilisation de l'apprentissage automatique, les données sont naturellement décentralisées : les données des patients sont collectées et stockées par différents hôpitaux, les données sur notre environnement sont générées par des capteurs intégrés dans nos appareils personnels, etc. Analyser l’ensemble de ces données peut permettre des avancées dans de nombreuses applications comme la médecine, ou encore le crowdsensing, qui permet d’analyser et de cartographier des phénomènes d'intérêt sociétal (évolution de la qualité de l’air par exemple).

Or, il n’est pas toujours possible ou souhaitable de centraliser ces données au même endroit, pour des raisons de coût, de réglementation et/ou de confidentialité. C’est notamment le cas en santé où les données sont souvent cloisonnées dans différents "entrepôts" et où la réalisation d’études médicales multicentriques (c’est-à-dire mettant en jeu les données de plusieurs centres de santé) est conditionnée à un processus de demande d’autorisation et une logistique longs et complexes.

L’apprentissage fédéré, un changement de paradigme pour minimiser la collecte de données personnelles et protéger la confidentialité

L’apprentissage fédéré est récemment apparu comme un nouveau paradigme où plusieurs entités avec des ensembles locaux de données entraînent des modèles d’apprentissage automatique de manière collaborative tout en gardant leurs données décentralisées.

L’apprentissage fédéré permet de minimiser la collecte de données personnelles, et peut être combiné avec des techniques de protection de la confidentialité pour éviter que des informations sensibles ne soient révélées lors de l’apprentissage.

"Fed-Malin", un défi scientifique d’une ambition et d’une ampleur inégalées en matière d’apprentissage fédéré, en France et à l’international

Pionnier en France comme à l’international par son ampleur et son caractère largement pluridisciplinaire, "Fed-Malin" est un Défi Inria coporté par les chercheurs Aurélien Bellet et Giovanni Neglia qui ambitionne de faire progresser la recherche sur l'apprentissage fédéré et de développer des cas d'utilisation concrets. Ceci, à travers un consortium impliquant pas moins de dix équipes-projet de l’institut et de ses partenaires, localisées dans six centres Inria et combinant des expertises en apprentissage automatique, systèmes distribués, confidentialité et sécurité, réseaux et médecine.

Les travaux de recherche porteront notamment sur la confidentialité et l'équité, la consommation d'énergie, la personnalisation des modèles et les dépendances temporelles et spatiales. Fed-Malin contribuera également au développement d'outils open source pour l'expérimentation de l'apprentissage fédéré et son déploiement dans le monde réel, et les utilisera pour des applications concrètes en médecine et en crowdsensing.

Fed-Malin se démarque sur la scène européenne et internationale par son large périmètre ainsi que par le savoir-faire et l’expertise de ses membres, qui va permettre de réaliser des avancées théoriques en apprentissage fédéré, mais aussi de rapidement les implémenter dans des librairies logicielles open source et de les appliquer à des problèmes réels.

Avant Fed-Malin, Mammals et Flamed

Le Défi Fed-Malin a partie liée avec un certain nombre de recherches menées au sein d’Inria. Parmi elles, deux "actions exploratoires", Mammals et Flamed, bénéficient également du soutien du Groupe La Poste. La première cherche à fournir des inférences à faible latence en exécutant, à proximité de l'utilisateur final, des modèles simples d'apprentissage automatique qui peuvent également exploiter une base de données locale. La seconde vise à appliquer l’apprentissage fédéré aux études médicales multicentriques dans les hôpitaux.

Des applications concrètes nombreuses, au bénéfice d’un large public

Quoique mal connu encore, l’apprentissage fédéré constitue un enjeu stratégique de premier plan qui nécessitait une initiative d’ampleur comme Fed-Malin pour aider la recherche à franchir un cap décisif. Le sujet s’est développé fortement dans la communauté de l’apprentissage automatique ces deux dernières années mais commence seulement à se propager à d’autres domaines. De plus, les déploiements dans des applications réelles sont encore rares.

La recherche et les développements réalisés dans Fed-Malin dans le cadre d’une "science ouverte" pourront bénéficier à un large public de citoyens et d’organisations publiques, ainsi qu’à l’ensemble de la communauté scientifique. Fed-Malin va aussi permettre de consolider les projets existants d’Inria autour des applications médicales et de renforcer les collaborations avec des acteurs de la santé, comme les hôpitaux du réseau Unicancer, le CHU de Lille et l’alliance G4. Du reste, cette coopération entre recherches de pointe en sciences et technologies du numérique et spécialistes des domaines applicatifs de l’apprentissage fédéré (médecins, radiologues…) est au cœur du modèle de l’apprentissage profond qui s’appuie sur des exemples "étiquetés" par des experts (de l’imagerie médicale, par exemple).

Les avancées de Fed-Malin apporteront au groupe La Poste, fort de plus de 450 experts en data et IA et acteur majeur de la santé, des opportunités d’innovation dans les domaines de l’analyse des données de santé au bénéfice des patients et de la prévention à domicile en faveur de l’accompagnement du vieillissement de la population. Des développements dans d’autres secteurs nécessitant une éthique de la donnée au service de la confiance numérique sont aussi envisagés.

Eu égard aux espoirs qu’il suscite en matière d’applications concrètes pour la santé, la mobilité, l’IoT…, le Défi Fed-Malin est emblématique d’une recherche "engagée" et "impliquée" au service de la société telle que le groupe La Poste, Inria et la Fondation Inria la promeuvent à travers leur partenariat.

Télécharger le communiqué de presse du Défi Fed-Malin