Serena Villata, pionnière d’une IA qui argumente et qui débat
Date:
Mis à jour le 18/07/2022
Et si les ordinateurs nous aidaient à réfléchir, et pas seulement à traiter de l’information ? Et si l’IA pouvait détecter des arguments dans un texte, les classer, évaluer leur fiabilité ? Et si elle permettait de prévenir le cyberharcèlement ou les fake news ? Ces questions sous-tendent le parcours de Serena Villata, chercheuse au centre Inria de l'Université Côte d'Azur, spécialiste du traitement du langage et de la génération automatique d’arguments. Elle vient d’être récompensée par le Prix Inria – Académie des sciences jeunes chercheurs et jeunes chercheuses.
C’est l’un de ses codirecteurs de thèse qui l’a orientée sur cette voie en 2007, en lui proposant de travailler sur les « modèles computationnels de l’argumentation". Autrement dit, sur la façon dont l’IA pouvait extraire et représenter la structure logique d’un texte. « À l’époque, ces modèles étaient très simples, raconte Serena Villata : des arguments "pour" ou "contre" un sujet ou une décision. »
La chercheuse enrichit la théorie sur deux points. D’abord, l’ajout d’une "relation de support", pour intégrer les arguments qui en renforcent un autre. Exemple : les photos de la Terre depuis l’espace confortent l’argument selon lequel la Terre est ronde, et non plate. Deuxième ajout, la prise en compte de la fiabilité des sources à l’origine des arguments : ces derniers gagnent ou perdent en acceptabilité si l’émetteur est un expert du sujet ou un néophyte.
Verbatim
Je suis parvenue à intégrer ces avancées théoriques dans des algorithmes puis à les transposer à l’analyse automatique du "langage naturel", c’est-à-dire des écrits produits par des personnes.
Auteur
Poste
Prix de la Jeune chercheuse Inria – Académie des Sciences 2021
Avec l’aide de linguistes, Serena Villata développe les tout premiers algorithmes d’extraction automatique d’arguments. Ces derniers sont classés en prémisses ou en conclusions, les liens qui les relient sont des relations d’attaque ("pour" ou "contre") ou de support. Magique : la structure logique du texte est mise en évidence, sans intervention humaine.
Cette grille d’analyse est puissante et polyvalente : après une étape d’apprentissage, elle fonctionne pour des discours politiques, des textes médicaux, des échanges en ligne sur Twitter ou Facebook… Elle suscite donc un grand intérêt. Rapidement, Serena Villata est invitée dans des conférences internationales et multiplie les projets de recherche français et européens.
Son travail est notamment à l’origine de Disputool, un projet d’argument mining des débats entre candidats à l’élection présidentielle américaine, de 1960 à 2016. Autre initiative, l’outil d’aide à la décision Acta (Argumentative Clinical Trial Analysis), qui analyse automatiquement des comptes-rendus d’essais cliniques de médicaments et de traitements. Plus besoin de les lire intégralement pour se faire une idée : leur conclusion et les arguments qui la fondent sont représentés sous forme de graphe d’argumentation avec lequel les utilisateurs peuvent interagir.
Toutefois, c’est dans le domaine des réseaux sociaux et de la prévention du harcèlement que les travaux de Serana Villata rencontrent le plus fort retentissement. Elle a conçu des outils d’intelligence artificielle capables de repérer automatiquement les messages haineux sur les réseaux sociaux en combinant l’analyse des liens entre les utilisateurs avec celle des messages. Ces outils détectent ainsi les internautes victimes de misogynie, d’homophobie, de racisme ou de toute autre forme de haine en ligne. Une approche semblable peut être menée pour repérer des émetteurs de fake news.
« Je continue à améliorer ces outils en collaboration avec des écoles italiennes et françaises qui s’en servent pour mieux gérer les échanges entre élèves sur leur intranet, précise la chercheuse. Je les utilise également pour un projet sur la prévention de la haine en ligne mené dans le cadre de l’OTESIA*. Il comporte en particulier des actions de sensibilisation auprès des étudiants. »
Depuis décembre 2019, Serena Villata est aussi membre du Comité national pilote d’éthique du numérique. « Une mission passionnante : les questions éthiques autour de l’IA dépassent largement le seul domaine informatique. J’ai la chance d’y réfléchir avec des sociologues, des philosophes, des juristes et des députés. »
*Observatoire des impacts technologiques, économiques et sociétaux de l’intelligence artificielle
« Le grand défi du moment dans mon domaine, c’est de concevoir un chatbot capable de dialoguer en langage naturel avec des utilisateurs, par exemple des scolaires, pour les aider à développer leur esprit critique. Il pourrait leur expliquer un sujet, l’illustrer par des exemples, opposer des contre-arguments aux fake news qu’il suscite, décrire les effets dévastateurs de la propagation de ces fake news, etc.
C’est un objectif très ambitieux : le chatbot devrait pouvoir traiter de manière automatique n’importe quel thème, sans y être préparé, en s’adaptant aux connaissances de l’interlocuteur. De plus, il faut éviter qu’un tel outil soit détourné pour des campagnes de désinformation. Sa conception doit être multidisciplinaire, et associer aux informaticiens des juristes, des sociologues, etc. »
Comprendre un processus cognitif grâce à l’analyse statistique du mouvement des yeux, interstices.info, 17/12/2021