Culture & Société

Quand la campagne présidentielle inspire les scientifiques

Date:
Mis à jour le 13/07/2022
Des chercheurs d’Inria et du CNRS ont publié une étude sur les systèmes de recommandation en ligne, proposant une méthode originale d’analyse d’algorithmes et prenant pour cas d’usage la campagne présidentielle 2022. Une recherche éclairante sur le sujet des décisions algorithmiques, qui intéresse les citoyens comme le législateur.
photo d'un écran d'ordinateur qui montre les recommandations youtube
NordWood Themes on Unsplash

Une omniprésence des recommandations sur Internet

Réseaux sociaux, plates-formes de contenu, moteurs de recherche, etc. : derrière ces outils utilisés quotidiennement, se cachent des algorithmes sophistiqués, par exemple ce système de recommandation qui nous propose de consulter une vidéo en ligne ou une offre commerciale. Omniprésentes sur Internet, ces recommandations exploitent des données contenues dans les traces que nous laissons au fil de nos navigations numériques, afin de nous guider vers les nouveaux contenus les plus pertinents pour nous… ou pour la plate-forme dont la rémunération dépend souvent du temps de présence en ligne de ses utilisateurs.

Comprendre le fonctionnement de ces outils informatiques et les ressorts des décisions algorithmiques qu’ils opèrent est un enjeu crucial pour les citoyens, les pouvoirs publics, les instances de régulation, etc. Une question de souveraineté numérique à laquelle les recherches fondamentales en informatique peuvent apporter des réponses.

Erwan Le Merrer, chercheur au centre Inria de l’Université de Rennes au sein de l’équipe Wide, et Gilles Tredan, chercheur en informatique au LAAS-CNRS (Laboratoire d'analyse et d'architecture des systèmes) à Toulouse, étudient depuis plusieurs années les algorithmes, dans le contexte des systèmes de recommandation, des modèles de réseaux de neurones, ou des décisions algorithmiques en général.

Fonctionnement en « boîte noire » des algorithmes

« Nos recherches visent à développer des méthodologies d’analyse et des systèmes de mesure permettant de comprendre et d’évaluer le fonctionnement d’algorithmes - en particulier ceux des systèmes de recommandation, au cœur du fonctionnement de certaines plates-formes », explique Ewran Le Merrer. Ces systèmes guident littéralement notre navigation sur Internet : sur YouTube, par exemple, ils comptent pour 70% des clics des utilisateurs vers des contenus qu’ils consultent, par opposition à des recherches intentionnelles.

Image
Portrait de Gilles Trédan
Verbatim

Cela pose des questions fondamentales sur la place des algorithmes et de notre liberté de choisir, de nous informer, etc.

Auteur

Gilles Tredan

Poste

Chargé de recherche au LAAS-CNRS

« Par exemple, l’effet de "bulle d’enfermement algorithmique" c’est-à-dire la tendance d’un "recommandeur" à nous proposer toujours le même type de contenu, est un biais algorithmique bien connu », rappelle Gilles Tredan. Cet effet a tendance à conforter le consommateur, le lecteur ou le citoyen dans son schéma intellectuel, ses habitudes d’achat, ses opinions, etc. Or, nous avons besoin d’une diversité de points de vue pour prendre des décisions politiques, économiques, individuelles ou collectives éclairées.

La transparence algorithmique et l’étude d’algorithmes complexes, comme ceux des recommandeurs, est donc d’un fort intérêt pour les scientifiques comme pour les citoyens. « Du point de vue de la recherche en informatique, comprendre ces algorithmes pose de nombreuses difficultés théoriques et méthodologiques, car ils fonctionnent "en boîte noire". »

Image
Portrait d'Erwan Le Merrer
Verbatim

Nous n’avons pas accès au code informatique de ces programmes complexes, exécutés sur des serveurs tiers et conçus pour apprendre des données de leurs utilisateurs, se modifiant en quelque sorte en permanence

Auteur

Erwan Le Merrer

Poste

chercheur Inria au sein de l'équipe WIDE

Une méthodologie originale

Par conséquent, les scientifiques développent des approches originales afin de scruter ces programmes et mettre en lumière leurs propriétés et leurs limites. Un exemple ? Leurs derniers travaux en date sur le recommandeur de YouTube, dans le contexte de la récente élection présidentielle française. Puisqu'un recommandeur encode le passage des actions sur la plate-forme – dans le cas de YouTube, des visualisations de vidéos –, est-il possible d’extraire un signal à analyser, à partir d’une simple observation des recommandations ?

C’est l’une des questions à laquelle les chercheurs ont apporté une réponse, en montrant comment le recommandeur peut aider à prédire l’état de l’opinion sur les candidats à l’élection. « Notre approche se fonde sur le postulat qu‘un candidat populaire va intéresser de nombreux utilisateurs qui, sur YouTube, vont accéder à des vidéos de ses interventions. Le recommandeur va naturellement faire transparaître cette popularité en proposant à nouveau ces vidéos, ce qui renforcera son audience et sa popularité », détaille Gilles Trédan.

Une mesure des intentions de vote

Les chercheurs ont ainsi travaillé avec des scripts automatiques (des "bots") qui simulent l’activité d’utilisateurs consultant des vidéos sur la plate-forme. Chaque jour pendant la durée de la campagne, ils ont programmé ces bots pour se rendre sur la catégorie "Actualités nationales", regarder une vidéo choisie aléatoirement, et consulter les quatre vidéos suivantes proposées en lecture automatique. L’action étant renouvelée près de 200 fois par jour, les chercheurs ont analysé les cinq vidéos consultées et, si leur sujet concernait la présidentielle, la durée d’une phrase attribuée à un candidat a été créditée à son temps de parole.

« Avec cette approche, nous disposions d’une donnée mesurable, une sorte de temps d’exposition du candidat par rapport à ses concurrents, que nous comparions chaque jour avec les résultats des sondages », explique Erwan Le Merrer. Quel a été le résultat de cette étude ? Les chercheurs ont mis en évidence une étroite corrélation entre l’indicateur qu’ils ont calculé et les intentions de vote… « Les valeurs que nous avons obtenues sont cependant moins stables que celles données par les sondages, et, pour certains candidats, parfois sur ou sous-évaluées, tempère Gilles Trédan. L’erreur de prédiction, par comparaison avec les sondages, est néanmoins faible, de l’ordre de 3% sur la période étudiée… et elle est encore moindre (1,5% environ) sur le résultat effectif du premier tour. »

Une recherche utile au régulateur

Les chercheurs ont publié une synthèse de leur travaux, dont les conclusions peuvent par exemple intéresser les instituts de sondage, qui y trouveront peut-être matière à réflexion future. « Les sondages sont effectués auprès de centaines ou de milliers d’utilisateurs, tout au plus, rappelle Erwan Le Merrer. Le recommandeur de YouTube interagit, lui, avec des millions de personnes quotidiennement, et s’adapte à cela : étudier la corrélation de signaux de ce type est certainement une piste intéressante, non seulement pour la recherche en informatique, mais pour des applications concrètes en sciences politiques. »

« Nous pensons également à d’autres usages de ces données, complète Gilles Trédan. Une campagne présidentielle est un temps fort de l’histoire d’un pays, de sa sociologie, etc., que nos travaux ont contribué à documenter de façon originale : ces informations, mises en contexte, intéresseront peut-être dans quelques années des chercheurs en sciences sociales ? »

Mais c’est sans doute à plus court terme que ces travaux trouveront des applications concrètes. « Suivant les conseils d’un de nos collègues d’Inria, qui s’intéresse aux questions d’audit et de régulation des algorithmes, nous nous sommes rapprochés du PEReN (le Pôle d’expertise de la régulation numérique), avec qui nous comptons échanger régulièrement autour de nos travaux et de leurs potentielles implications réglementaires », conclut Erwan Le Merrer. De nouvelles perspectives à l’horizon.

Pour en savoir plus