Serena Villata, pionnière d’une IA qui argumente et qui débat

L’IA, une arme contre les fake news

Et si les ordinateurs nous aidaient à réfléchir, et pas seulement à traiter de l’information ? Et si l’IA pouvait détecter des arguments dans un texte, les classer, évaluer leur fiabilité ? Et si elle permettait de prévenir le cyberharcèlement ou les fake news ? Ces questions sous-tendent le parcours de Serena Villata, chercheuse au centre Inria de l'Université Côte d'Azur, spécialiste du traitement du langage et de la génération automatique d’arguments. Elle vient d’être récompensée par le Prix Inria – Académie des sciences jeunes chercheurs et jeunes chercheuses.

C’est l’un de ses codirecteurs de thèse qui l’a orientée sur cette voie en 2007, en lui proposant de travailler sur les « modèles computationnels de l’argumentation". Autrement dit, sur la façon dont l’IA pouvait extraire et représenter la structure logique d’un texte. « À l’époque, ces modèles étaient très simples, raconte Serena Villata : des arguments "pour" ou "contre" un sujet ou une décision. »

Des avancées théoriques au traitement du langage naturel

La chercheuse enrichit la théorie sur deux points. D’abord, l’ajout d’une "relation de support", pour intégrer les arguments qui en renforcent un autre. Exemple : les photos de la Terre depuis l’espace confortent l’argument selon lequel la Terre est ronde, et non plate. Deuxième ajout, la prise en compte de la fiabilité des sources à l’origine des arguments : ces derniers gagnent ou perdent en acceptabilité si l’émetteur est un expert du sujet ou un néophyte.

Verbatim

Je suis parvenue à intégrer ces avancées théoriques dans des algorithmes puis à les transposer à l’analyse automatique du "langage naturel", c’est-à-dire des écrits produits par des personnes.

Serena Villata

Prix de la Jeune chercheuse Inria – Académie des Sciences 2021

Avec l’aide de linguistes, Serena Villata développe les tout premiers algorithmes d’extraction automatique d’arguments. Ces derniers sont classés en prémisses ou en conclusions, les liens qui les relient sont des relations d’attaque ("pour" ou "contre") ou de support. Magique : la structure logique du texte est mise en évidence, sans intervention humaine.

Visionner la vidéo

Les débats des élections américaines passés au crible

Cette grille d’analyse est puissante et polyvalente : après une étape d’apprentissage, elle fonctionne pour des discours politiques, des textes médicaux, des échanges en ligne sur Twitter ou Facebook… Elle suscite donc un grand intérêt. Rapidement, Serena Villata est invitée dans des conférences internationales et multiplie les projets de recherche français et européens.

Son travail est notamment à l’origine de Disputool, un projet d’argument mining des débats entre candidats à l’élection présidentielle américaine, de 1960 à 2016. Autre initiative, l’outil d’aide à la décision Acta (Argumentative Clinical Trial Analysis), qui analyse automatiquement des comptes-rendus d’essais cliniques de médicaments et de traitements. Plus besoin de les lire intégralement pour se faire une idée : leur conclusion et les arguments qui la fondent sont représentés sous forme de graphe d’argumentation avec lequel les utilisateurs peuvent interagir.

Des outils pour repérer les victimes de cyberharcèlement

Toutefois, c’est dans le domaine des réseaux sociaux et de la prévention du harcèlement que les travaux de Serana Villata rencontrent le plus fort retentissement. Elle a conçu des outils d’intelligence artificielle capables de repérer automatiquement les messages haineux sur les réseaux sociaux en combinant l’analyse des liens entre les utilisateurs avec celle des messages. Ces outils détectent ainsi les internautes victimes de misogynie, d’homophobie, de racisme ou de toute autre forme de haine en ligne. Une approche semblable peut être menée pour repérer des émetteurs de fake news.

« Je continue à améliorer ces outils en collaboration avec des écoles italiennes et françaises qui s’en servent pour mieux gérer les échanges entre élèves sur leur intranet, précise la chercheuse. Je les utilise également pour un projet sur la prévention de la haine en ligne mené dans le cadre de l’OTESIA*. Il comporte en particulier des actions de sensibilisation auprès des étudiants. »

Depuis décembre 2019, Serena Villata est aussi membre du Comité national pilote d’éthique du numérique. « Une mission passionnante : les questions éthiques autour de l’IA dépassent largement le seul domaine informatique. J’ai la chance d’y réfléchir avec des sociologues, des philosophes, des juristes et des députés. »

*Observatoire des impacts technologiques, économiques et sociétaux de l’intelligence artificielle

Trois moments phares de son parcours

Ses premiers travaux sur la théorie de l’argumentation formelle, en 2007 – « C’était un sujet à caractère fondamental, mais il pouvait donner naissance à de multiples applications dans la vraie vie : la plupart des échanges entre individus s’appuient sur des arguments. Mais à l’époque, ces applications semblaient futuristes et très ambitieuses... »
Ses débuts dans l’argumentation en langage naturel, en 2012 – « Je suis passée de la théorie informatique au concret et au quotidien : extraire automatiquement des arguments à partir des messages sur un forum, d’un débat politique, d’un texte de loi… Tout était à construire et je faisais partie des pionnières ; c’était le bon moment pour s’y mettre. »
Ses projets sur des sujets de société, à partir de 2018 – « Mes recherches ont commencé à s’orienter vers la prévention de la haine en ligne, la propagande, la désinformation… C’est important pour moi de sentir que mes travaux ont une réelle utilité sociale. »

Quel est le plus grand défi en matière de génération automatique d’arguments ?

« Le grand défi du moment dans mon domaine, c’est de concevoir un chatbot capable de dialoguer en langage naturel avec des utilisateurs, par exemple des scolaires, pour les aider à développer leur esprit critique. Il pourrait leur expliquer un sujet, l’illustrer par des exemples, opposer des contre-arguments aux fake news qu’il suscite, décrire les effets dévastateurs de la propagation de ces fake news, etc.

C’est un objectif très ambitieux : le chatbot devrait pouvoir traiter de manière automatique n’importe quel thème, sans y être préparé, en s’adaptant aux connaissances de l’interlocuteur. De plus, il faut éviter qu’un tel outil soit détourné pour des campagnes de désinformation. Sa conception doit être multidisciplinaire, et associer aux informaticiens des juristes, des sociologues, etc. »

Serena Villata en six dates-clés

Biographie expresse

2007 – Début de sa thèse, menée en cotutelle les universités de Turin et de Luxembourg.

2010 – Docteure en informatique (intelligence artificielle).

2011 – Intègre en tant que postdoc le centre Inria Sophia Antipolis – Méditerranée.

<> Cliquez sur les flèches pour faire défiler son parcours.

Biographie expresse

2015 – Chargée de recherche 1^ère classe au CNRS.

2018 – Invitée à présenter ses résultats à l’une des principales conférences mondiales en IA, IJCAI (International Joint Conferences on Artificial Intelligence).

2021 – Prix de la Jeune chercheuse Inria – Académie des Sciences.

Prix Inria 2021

Découvrez les chercheurs Inria récompensés

En savoir plus

Page de l'équipe-projet Wimmics
Cyber harcèlement : une intelligence artificielle formée au langage des réseaux sociaux, France Inter, 02/02/2019.
Liberté et discipline des réseaux sociaux : les leçons du premier confinement sur la désinformation, Emmanuel Didier (CNRS, ENS et EHESS), Serena Villata (université Côte d’Azur, CNRS, Inria), et Célia Zolynski (université Paris 1 Panthéon-Sorbonne), The Conversation, 11/12/2020.
Artificial Intelligence and ethics : technological and human-centered challenges, Serena Villata, Conférence internationale "Les Femmes et l'IA" (université Côte d’Azur, 3iA Côte d’Azur, CNRS, Inria), Institut EuropIA, 23/09/2021.
Désinformation en temps de crise : liberté et discipline des plates-formes, Binaire – Le Monde, décembre 2020.
Des logiciels pour gérer le cyberharcèlement, Binaire – Le Monde, avril 2020.

Pour aller plus loin

International Joint Conferences on Artificial Intelligence (IJCAI)
Comprendre un processus cognitif grâce à l’analyse statistique du mouvement des yeux, interstices.info, 17/12/2021