Catuscia Palamidessi obtient une bourse ERC Advanced Grant pour améliorer la sécurisation des données personnelles

Date:
Mis à jour le 19/03/2020
Catuscia Palamidessi, la responsable de l'équipe Comete, du centre de recherche Inria Saclay - Île-de-France, a reçu fin mars une bourse du Conseil Européen de la Recherche (ERC) pour son projet "HYPATIA - Privacy and Utility Allied".

Son objectif : optimiser la sécurisation et l’utilité des données numériques personnelles.

Quelle est la finalité de votre projet «Hypatia» et pourquoi ce nom ?

Portrait de Catuscia Palamidessi
© Inria / Photo S. Erôme - Signatures

Hypatie d'Alexandrie (370-415 de notre ère), philosophe, astronome et mathématicienne, a été assassinée par des fanatiques religieux. Elle symbolise l'idéal de la science contre l'intolérance et l'obscurantisme. C’est ma source d’inspiration depuis de nombreuses années et je lui rends ici hommage.
 
Comme vous le savez, le Big Data est très précieux pour l’industrie, la recherche et la société en général. Mais ces données proviennent souvent d’individus. En collectant plusieurs traces de localisation d’une même personne, par exemple, il est possible d'en déduire où elle vit et travaille, quels sont ses loisirs, de quel type de maladie elle souffre, etc. Toutes ces informations pourraient conduire à des utilisations malveillantes. La vie privée doit donc être protégée.
 
Un des principaux défis en matière de confidentialité numérique est de réussir à sécuriser les données personnelles sans détruire leur utilité. Toutes les méthodes de protection de la vie privée impliquent une perte d'information et donc d’utilité des données pour le but recherché. En réalité, il existe deux principaux types d’utilité : la « qualité de service » et la « précision statistique ». Les deux sont liées Celles-ci sont interconnectées : un utilisateur communique généralement ses données en échange d'un service (sa localisation en échange de points d'intérêt), et l'entité qui fournit le service le fait en échange de ces données, dont elle va extraire des informations statistiques. L’idée principale d’Hypatia est d’atteindre un équilibre entre ces trois éléments : qualité de service, utilité statistique et confidentialité. Une telle optimisation en arborescence n'a jamais été tentée auparavant. C'est probablement la raison pour laquelle le projet a été sélectionné pour une bourse ERC.

Comment comptez-vous relever ce défi ?

C’est bien connu, l'anonymisation, qui supprime le nom et d'autres identifiants (âge, sexe, code postal, etc.), ne suffit pas à garantir la confidentialité des données. Plusieurs attaques nous l’ont prouvé. En 2006 par exemple, AOL a publié des historiques de recherche personnels, détaillés mais anonymisés. Deux journalistes du New York Times ont voulu vérifier s’ils arrivaient à identifier certains des clients. Et ils ont réussi ! En réaction, différentes approches ont alors émergé, dont la plus réussie est la confidentialité différentielle.

Cette méthode probabiliste est utilisée pour sécuriser les informations lors de requêtes sur des bases de données. Elle fonctionne en ajoutant une variable aléatoire au résultat d’une requête, un « bruit statistique », qui rend difficile, pour un attaquant potentiel, la récupération de valeurs d’enregistrements individuels.

Récemment, on a vu apparaître une variante appelée « confidentialité différentielle locale » (LDP). Le principe est identique, ajouter du bruit à la valeur vraie. Mais dans la LDP, cela s’opère du côté de l’utilisateur, sur l'enregistrement individuel. L'avantage est que, contrairement à la confidentialité différentielle, il n’est ici pas nécessaire de faire confiance à un tiers, c’est-à-dire à l'entité qui collecte et stocke les vraies données et applique le « bruit ».
La LDP est au cœur de ma proposition. Je prévois de l’associer à de nouvelles technologies développées dans le domaine de l’apprentissage automatique. Et particulièrement à celle des réseaux génératifs d'adversaire (GAN). Il s’agit essentiellement de faire s’affronter deux machines : l'une génère le bruit, en prenant en compte les contraintes d'utilité ; l'autre simule une attaque et essaye d’identifier les données. Elles interagissent jusqu'à atteindre un point d'équilibre, qui représente le meilleur mécanisme de sécurisation possible (en respectant l'utilité) pour le meilleur adversaire possible.

Que représente cette bourse pour vous ?

C’est bien sûr une satisfaction personnelle de voir mes recherches reconnues et appréciées. Mais c’est également synonyme de beaucoup de liberté. Je souhaite depuis longtemps engager des ingénieurs de recherche pour développer des outils basés sur mes théories, avec une interface adaptée à un public non spécialiste. Et dans mon domaine, la bourse de l'ERC permet principalement des embauches. Les 2,2 millions d’euros aideront à recruter environ sept personnes, thésards, postdoctorants, assistant de recherche… Une partie du budget servira également à organiser un atelier dans quelques années, pour présenter nos premiers résultats à des collaborateurs et de futurs partenaires, notamment industriels. Ces partenariats sont précieux pour mes travaux de recherche, car ils peuvent apporter une réelle expérience de terrain et clarifier les besoins industriels et sociétaux.

Les subventions avancées du Conseil européen de la recherche en 6 questions

  • D’où viennent-elles ? Elles font partie du pilier « Excellence scientifique » du Programme européen Horizon 2020 pour la recherche et l'innovation.
  • Quel est l’objectif ? Soutenir des chercheurs de renom dans toute l’Europe et leur donner les moyens de mener une recherche exploratoire risquée pendant cinq ans, en dehors de tout programme scientifique établi.
  • Qui peut y prétendre ? Des chercheurs en poste, de toutes nationalités et de tous âges, qui sont reconnus comme des leaders dans leur domaine.
  • Quels sont les critères de sélection ? Les projets sont choisis pour leur potentiel à repousser les limites de la science et à répondre à des questions parmi les plus pressantes dans notre société. La structure d’accueil doit se trouver dans un pays européen ou partenaire du programme.
  • Combien d’élus ? Pour cette édition, 2 052 propositions de recherche ont été soumises. Près de 11 % ont été sélectionnées avec des subventions allant jusqu'à 2,5 millions d'euros.
  • Quand postuler ? Les candidatures pour le prochain cycle de financement doivent être déposées entre le 21 mai et le 29 août 2019.

Les recherches de Catuscia Palamidessi en bref

Catuscia Palamidessi est à la tête de l’équipe-projet Comete (Concurrence, Mobilité et Transactions) qui étudie la confidentialité, la sécurité et la manière dont l’information circule sur les réseaux sociaux . Et bien entendu, les risques qui y sont associés.

L’équipe se compose actuellement de deux membres permanents et d’une dizaine de postdoctorants, doctorants et stagiaires. Parmi les axes de recherche de l’équipe, Catuscia Palamidessi se concentre en particulier sur les fuites d’informations et la protection des données sensibles tout en préservant leur utilité.

Ses recherches ont notamment débouché sur Location Guard, un mécanisme d’obscurcissement de données qui permet de protéger la position de l’utilisateur. Il prend la forme d’une extension de navigateur qui ajoute un « bruit contrôlé » aux données de localisation envoyées aux fournisseurs de services tels que « les points d’intérêt autour de moi ». Ces travaux ont conduit à des partenariats avec des industriels tels que Renault et à de nombreuses collaborations académiques à travers le monde.