Authentification : des empreintes uniques pour identifier les internautes
Force est de le constater, nous passons de plus en plus de temps sur Internet et le nombre d’internautes est en perpétuelle croissance. Face à cette importante demande, les navigateurs développent toujours plus de fonctionnalités. Leur objectif : rendre leur accès au web davantage attractif, interactif et disponible. Cette révolution se fait via la collecte de données en apparence anodines chaque fois que nous nous connectons à un site : système d'exploitation, langue du dispositif, polices, résolution de l’écran, etc. Par exemple, connaître la résolution sert à adapter l’affichage des pages ou encore à ajuster la taille d’une vidéo lorsque nous réduisons la fenêtre. Bref, ces données sont collectées à l’aide d’un simple script en arrière-plan, en vue de rendre l’expérience utilisateur agréable.
Seules, les données citées précédemment sont peu sensibles. Mais en les croisant, elles constituent des empreintes numériques uniques, ce qui peut présenter parfois des avantages. Ainsi, ces attributs facilitent l’identification d’un internaute via sa machine (ordinateur, téléphone, tablette). À travers le projet ANR FP-Locker, l’équipe-projet Spirals du Centre Inria de l’Université de Lille propose de les utiliser pour protéger les comptes lors de l’authentification d’un utilisateur. « Elles permettent aussi de bloquer les bots qui représentent plus de la moitié du trafic sur le web dont les « web scrapers » qui sont souvent non désirés par les sites web », indique Walter Rudametkin, maître de conférences en informatique à l’Université de Lille et membre de l’équipe-projet Spirals. Ses travaux lui ont permis d’obtenir une habilitation à diriger des recherches en 2021, après avoir été récompensés par le prix CNIL-Inria « protection de la vie privée » en 2018.
Toutefois, ces mêmes propriétés peuvent aussi servir au traçage des activités des personnes en ligne. Certaines agences de publicité les utilisent déjà pour collecter des informations sur les habitudes et les goûts des internautes à leur insu. « Cette méthode est encore peu courante. Selon différentes études, on la retrouve sur environ 4% du top million des sites les plus consultés au monde. Mais son utilisation se fait souvent en complément des cookies », explique le chercheur.
Les cookies supplantés par les empreintes de navigateur
Les recherches sur ces méthodes sont d’autant plus importantes que le traçage par cookie devient obsolète.
Les empreintes de navigateur sont donc un “moyen invasif de remplacer les cookies”, et Google, qui contrôle le développement de Chrome et influence fortement ses dérivés, tente d’exercer une pression afin de contrôler les méthodes de traçage du futur, ajoute Walter Rudametkin.
Lorsqu’un internaute visite un site, celui-ci peut stocker un cookie dans le navigateur de cet utilisateur et collecter son empreinte simultanément. Si la personne a effacé ses cookies entre deux visites pour se protéger, le site peut malgré tout l’identifier par l’intermédiaire de son empreinte. Il recréé alors son cookie de traçage. Et comme l’empreinte n’est pas stockée sur son appareil, l’internaute ne peut pas empêcher sa collecte. Pis encore, plus un site dispose d’informations sur une personne, plus il est facile de l’identifier. L’équipe-projet Spirals a ainsi démontré que collecter l’empreinte numérique, les cookies et l’adresse IP, permet d’identifier 98 % des personnes sur le Web...
De puissants outils de traçage
Avec son équipe, Walter Rudametkin a mis en évidence que les empreintes s’appliquent aussi bien à la navigation sur ordinateurs que sur téléphones portables. Dans le but de mieux comprendre leur fonctionnement et les contrer, les chercheurs se sont glissés dans la peau de ces agences publicitaires douteuses en collectant des empreintes via leur site de recherche dédié AmIUnique.org. Celui-ci invite ses visiteurs à partager leur empreinte à des fins de recherche tout en leur proposant des moyens de se protéger.
Pour les chercheurs, la puissance de ces empreintes comme outils de traçage vient de trois propriétés majeures : leur unicité, la facilité à relier des empreintes moyennant quelques modifications et leur cohérence. « Environ 80 % des personnes ont une empreinte unique ce qui permet de les reconnaître. Il suffit, par exemple, d’installer une police de caractères rare pour la rendre facilement reconnaissable, ou de posséder une extension peu téléchargée », précise le chercheur.
Toutefois, une empreinte n’est pas éternelle. Elle subit constamment des modifications associées à des mises à jour. Elle se transforme aussi lorsque l’utilisateur ajoute un écran, des extensions, change sa configuration, etc. Est-il donc possible de tracer une personne sur le long terme ? « Nous observons que les modifications apportées sont souvent faibles. Si bien que nous avons pu facilement tracer 20% des personnes pendant toute la durée de notre étude de quatre mois en utilisant seulement leurs empreintes, car elles possédaient des attributs tellement différenciants qu’ils restaient reconnaissables en toutes circonstances », décrit Walter Rudametkin.
Les chercheurs se sont aussi demandé s’il était possible de masquer, bloquer ou altérer certains paramètres pour se protéger. « Nous avons découvert que ces outils étaient tous détectables. Certains sont même si mauvais qu’ils transmettent encore plus d’informations sur l’utilisateur que sans masquage. C’est souvent contre-productif, car cela peut renforcer le caractère unique des empreintes », remarque le chercheur.
La balle dans le camp des développeurs
Est-il alors possible de se protéger ? Premier réflexe à cultiver : effacer régulièrement ses cookies. Les bloqueurs de publicités limitent également la collecte d’empreintes en bloquant les domaines des sites de traçage vers lesquels elles sont renvoyées.
S’il faut choisir, l’attaque par empreinte est moins dangereuse et moins répandue que les cookies. Afin de protéger sa vie privée, il vaut mieux opter pour des navigateurs comme Tor, Firefox ou Brave qui intègrent des mécanismes de défense contre plusieurs techniques de traçage, recommande Walter Rudametkin.
Mais pour les chercheurs, la meilleure solution se trouve au plus près de la source du problème. « Nous remarquons que dans leur course à l’ajout de fonctionnalités, les développeurs de navigateurs créent souvent des systèmes permettant d’identifier les personnes », observe Walter Rudametkin. Collaborer avec les développeurs permettrait donc d’implémenter des solutions directement dans les navigateurs afin de protéger les données de tous.
C’est pourquoi les chercheurs développent des systèmes automatisés de tests et d’analyses d’empreintes. Ces programmes permettent de corriger des failles de sécurité avant d’intégrer les fonctionnalités dans un navigateur. « Les développeurs sont à l’écoute, mais tant qu’ils n’auront pas l’obligation légale de corriger des failles de vie privée, cela ne sera pas une priorité. Des règlementations adaptées sont donc nécessaires pour renforcer la protection des internautes », souligne le chercheur. Une initiative qui ne demande qu’à voir le jour.
Bio express de Walter Rudametkin
2013 – Après des études au Mexique, obtention d’un doctorat en génie logiciel à l’Université de Grenoble Alpes sur les mises à jour dynamiques dans les applications.
2014 – Création du site AmIUnique.org pour la collecte de données et pour présenter les risques de traçage par empreinte de navigateur.
2018 – Prix CNIL-Inria « protection de la vie privée » sur les empreintes de navigateur.
2021 – Habilitation à diriger des recherches de l’Université de Lille : Improving the Security and Privacy of the Web through Browser Fingerprinting.
En savoir plus
- Pistage en ligne : quelles sont ses différentes natures et pourquoi s’en protéger ? Clubic, 25/11/2021
- Everything you always wanted to know about web-based device fingerprinting (but were afraid to ask), Microsoft Research, 27/07/2016.