BACK IN TIME : Baliser l’Analyse CryptographiK de lettres anciennes grâce à l’INtelligence artificielle : Technique et IMplémentation Exploratoire. L’invitation à un voyage dans le temps est le nom de l’une des 72 actions exploratoires financées dans le cadre d’un programme Inria. Si l’acronyme qui expose de manière synthétique les objectifs du projet est transparent, les lettres anciennes qui en constituent le sujet d’étude le sont beaucoup moins. Et pour cause, elles ont été délibérément chiffrées afin de réserver à la compréhension d’un petit nombre d’initiés les informations jugées sensibles qu’elles recèlent. Autant dire que pour le chercheur qui, des centaines d’années plus tard, entreprend de les décrypter, le défi n’est pas facile à relever. Cécile Pierrot, chargée de recherche dans l’équipe Caramba(*), en a fait l’expérience en 2022 avec une lettre de Charles Quint.
Constatant l’insuffisance des outils de la cryptographie, la chercheuse avait alors fait appel à l’expertise de Camille Desenclos, maîtresse de conférences en Histoire moderne à l’Université de Picardie Jules-Verne et spécialiste de la cryptographie des XVIe et XVIIe siècles. Leurs compétences conjuguées vinrent à bout d’un code dont les secrets étaient bien gardés depuis près de cinq cents ans. Fortes de ce succès et enthousiasmées par l’efficacité de leur association, la cryptographe et l’historienne décidèrent de prolonger l’expérience pour tenter de concevoir un outil qui permettrait de faciliter le déchiffrement de documents chiffrés. Le projet BACK IN TIME, dont Cécile Pierrot est la responsable scientifique, était né.
La cryptographie, une pratique millénaire
La cryptographie étant sans doute aussi ancienne que l’écriture elle-même, le nombre de documents restant à déchiffrer est considérable. « Le premier document chiffré que l’on connaisse est une sorte de protection contre le piratage industriel, explique Cécile Pierrot. Ce sont des tablettes d’argile réalisées en Mésopotamie 1 500 ans avant notre ère par un artisan qui souhaitait protéger une recette de vernis utilisée lors de la fabrication de ses poteries. » Il existe potentiellement autant de méthodes de chiffrement que de rédacteurs, pour autant le principe de base s’appuie le plus souvent sur la substitution homophonique consistant à remplacer un signe alphabétique du texte original par un ou plusieurs autres, lettres, chiffres ou symboles.
Les tables de chiffrement étant rarement conservées, la difficulté pour celui qui cherche à décoder est de parvenir à identifier ces correspondances et à en comprendre la logique, ce qui nécessite d’effectuer une classification qualitative et quantitative des signes utilisés. « Il est possible de réaliser manuellement la transcription de deux ou trois lettres de quelques pages, mais lorsqu’il y en a des centaines un outil d’automatisation s’impose. » Cet outil, Cécile Pierrot va le chercher auprès de Thibault Clérice qui mène, au sein de l’équipe ALMAnaCH, des recherches combinant traitement automatique des langues et humanités computationnelles. Le projet Charles Quint s’appuyait déjà sur une association inédite entre informatique et histoire, BACK IN TIME prolonge la démarche en introduisant un troisième partenaire : l’intelligence artificielle.
Apprendre à se comprendre
Avant même d’aborder les difficultés techniques – la principale à laquelle est confrontée l’IA est de lui permettre de reconnaitre des éléments graphiques inconnus –, le premier obstacle à dépasser pour l’équipe constituée est d’établir les modalités d’un travail en commun. C’est tout l’enjeu de l’action exploratoire BACK IN TIME. La chose serait simple si chacun des trois partenaires traitaient de manière isolée les tâches qui lui incombent en fonction de son niveau d’expertise. Ce n’est pas le cas puisque la collaboration repose sur des interactions permanentes qui viennent s’enrichir les unes les autres à la façon d’un cercle vertueux. Ainsi, les connaissances historiques qui donnent des indices sur l’angle d’attaque (le décryptage) sont en retour enrichies par l’identification de la méthode de protection (le cryptage).
« En tant que cryptographes, nous utilisons fréquemment des algorithmes et sommes donc assez proches de nos collègues de l’IA, mais mélanger informatique et histoire n’est pas courant car nous ne travaillons pas dans les mêmes laboratoires, ni sur les mêmes campus et il est rare de se rencontrer par hasard pour échanger » constate Cécile Pierrot. Difficile mais pas impossible, et en tout cas profitable, comme en témoigne Camille Desenclos : « Essayer d’expliquer sa façon de travailler à quelqu’un qui évolue dans un autre domaine de recherche oblige à adapter ses formulations à son interlocuteur et met parfois en lumière des impensés. »
Une démarche novatrice et exploratoire
La démarche s’inscrit pleinement dans le Contrat d’Objectifs et de Performance du projet Ambition Inria 2023 qui encourage la création d’équipes-projets autour de recherches innovantes, intégrant prise de risque scientifique et interdisciplinarité afin de répondre aux grands défis sociétaux liés à la souveraineté numérique. L’accompagnement d’Inria permettra à l’équipe derrière BACK IN TIME de bénéficier jusqu’en 2026 des services de deux ingénieurs.
À ce stade, un premier prototype a été élaboré et offre des résultats suffisamment probants pour que Thibault Clérice se dise persuadée de la possibilité de mettre au point, à moyens termes, « un outil qui saura utiliser la bonne grille de lecture, que ce soit pour la reconnaissance des caractères ou pour le déchiffrement ». Outil que l’équipe de BACK IN TIME a prévu de développer sous licence libre. « Les apports pourraient être énormes. L’action exploratoire va nous permettre de voir ce qui peut être fait et comment, afin d’engager ensuite quelque chose de plus grand » estime Camille Desenclos. «Au niveau du développement de l’IA, parvenir à gérer des documents de ce type permettra de faire sauter les verrous existant sur certaines langues qui n’ont pas de système graphique numériquement disponible. Par exemple, les inscriptions Maya qui ne sont pas encore intégrées dans Unicode, ce qui pose des problèmes quand on veut transcrire des documents contenant ces écritures » ajoute Thibault Clérice. « Nous avons déjà identifié des chercheurs de disciplines un peu plus éloignées des nôtres, linguistes ou autres, qui pourraient se joindre à nos recherches, y compris au niveau européen » indique quant à elle Cécile Pierrot avant de conclure : « Ce sera le projet d’après. »
En attendant, les trois partenaires de BACK IN TIME ont d’ores et déjà remporté une première victoire : ils ont réussi à rapprocher des domaines d’expertises scientifiques qui ne se côtoyaient pas spontanément et à trouver les clés qui leur permettent de déchiffrer mutuellement leurs langages spécifiques.
(*) L’équipe Caramba est une équipe projet Inria commune au Centre Inria de l’Université de Lorraine, au CNRS et à l’université de Lorraine, au sein du laboratoire Loria.
Les experts
- Cécile Pierrot
Après un doctorat au Laboratoire d’Informatique de l’UPMC Sorbonne-Universités et un post-doctorat entre l’Institut de mathématiques de l’Université d’Oxford et le Centrum Wiskunde & Informatica d’Amsterdam, Cécile Pierrot intègre le centre Inria de l'Université de Lorraine en 2018 et étudie la cryptographie contemporaine au sein de l’équipe Caramba où elle est chargée de recherches. Lauréate du Trophée K2 2017 « Cybersécurité », elle enseigne à l’École des Mines Nancy et à Télécom Nancy.
- Camille Desenclos
À l’issue d’un doctorat soutenu à l’École nationale des chartes, Camille Desenclos est nommée maîtresse de conférences en Histoire moderne à l’Université de Haute-Alsace en 2015, puis, depuis 2020, à l’Université de Picardie Jules-Verne où elle est co-responsable du master Histoire, Civilisations et Patrimoine. Spécialiste des XVIe et XVIIe siècles, elle étudie l’histoire de la cryptographie, les institutions et pratiques de la diplomatie ainsi que les relations entre la France et le Saint-Empire.
- Thibault Clérice
Titulaire d’un doctorat en Lettres classiques à l’Université Lyon 3, Thibault Clérice a été ingénieur au King’s College (Londres), directeur de master à l’École nationale des chartes et Junior Fellow en IA appliquée aux SHS à Paris Sciences Lettres avant de rejoindre l’équipe ALMAnaCH du centre Inria de Paris en 2023. Il est membre fondateur et co-éditeur de HTR united, catalogue international d’entrainement d’IA à la reconnaissance d’écriture manuscrite.