« Nous pensons souvent le patrimoine comme un ensemble d’objets physiques et concrets », note Laurent Romary, chercheur au sein de l’équipe-projet Inria Almanach, spécialiste du traitement automatique des langues.
Mais pour que ces objets puissent être étudiés par le plus grand nombre, il est indispensable d’associer un patrimoine numérique à ce patrimoine tangible.
Et c’est tout l’objet du projet européen Parthenos, qui se termine fin octobre.
Celui-ci a été mis en place il y a quatre ans à l’initiative de DARIAH (Digital Research Infrastructure for the Arts and Humanities), un Consortium européen pour une infrastructure de recherche européenne (ERIC) qui développe des méthodes numériques en sciences humaines, et de Clarin (Common langage resource and technology infrastructure), qui travaille sur le développement et la distribution de ressources et d’outils pour le traitement des langues. Le projet Parthenos rassemble 16 partenaires (académies, université, centres et infrastructures de recherche, etc.), dont la majorité sont spécialistes des sciences humaines et sociales (SHS)… et quelques-uns du numérique, comme Inria. Car Laurent Romary, qui a également été directeur de DARIAH entre 2014 et 2018, a tout naturellement associé l’institut à ce nouveau projet.
Indispensables standards
« Il y avait à l’échelle de l’Europe, outre les deux ERIC (DARIAH et Clarin), plusieurs autres initiatives visant à faire progresser la maîtrise du numérique dans les SHS, comme ARIADNE (Advanced Research Infrastructure for Archaeological Dataset Networking in Europe) en archéologie, CENDARI (Collaborative EuropeaN Digital Archive Infrastructure) en histoire, ou EHRI (European Holocaust Research Infrastructure) sur l’Holocauste », retrace Laurent Romary.
L’idée de Parthenos a été de rassembler toutes ces pistes autour d’une même vision politique et de mutualiser les moyens. Avec comme but de développer des composantes de formation aux méthodes numériques, mais également un véritable environnement numérique avec des réseaux d’hébergement de données au niveau européen, des formats et des standards internationaux…
C’est justement sur ce point qu’Inria a apporté la majeure partie de son expertise. L’Institut s’est en effet vu confier la direction du groupe de travail sur les standards. « C’est un sujet assez aride mais indispensable, souligne le chercheur. Nous pensons en effet connaître le numérique parce que nous savons utiliser Word ou un navigateur internet, mais dès que l’on commence à travailler sur du matériau numérique — son, image, informations des spectromètres — il faut utiliser les bonnes méthodes pour que les données soient traitées dans les bonnes conditions et soient réutilisables. Les standards sont là pour cela. »
Le numérique, pas à pas
Pour coller le plus précisément possible aux besoins des chercheurs en SHS, l’institut et ses partenaires sont partis des scenarios de recherche et ont détaillé leur déroulement numérique sur une plate-forme, baptisée SSK (Standardization Survival Kit). Concrètement, ils ont rédigé une marche à suivre, avec, étape par étape, les ressources numériques à utiliser et les points de vigilance à maîtriser pour chacun des 27 scénarios de recherche identifiés jusqu’ici. Ceux-ci concernent la production d’un dictionnaire ou encore celle d’objets 3D, en passant par la gestion des résultats de spectrométrie ou la création de métadonnées.
« Nous sommes partis d’ateliers de deux à trois jours durant lesquels les chercheurs définissaient leur scenario de recherche sur papier ; puis nous les avons mis en forme au sein de la plate-forme SSK », détaille Laurent Romary.
L’objectif est d’amener tous les chercheurs à comprendre et à maîtriser ces méthodes et d’éviter ainsi la fragmentation. Sans cela, chaque chercheur se contentera d’ouvrir un document Excel et d’y traiter ses données, sans souci d’utilisation par des pairs ou d’archivage.
Pour encore plus d’efficacité, la plate-forme, à présent hébergée au sein de la très grande infrastructure de recherche Huma-Num, est en accès libre et les chercheurs peuvent y contribuer en ajoutant leurs scénarios. En outre, elle s’articule avec une plate-forme de formation liée à l’utilisation de méthodes numériques en sciences humaines et sociales, également mise au point dans le cadre de Parthenos.
Une réflexion élargie
En savoir plus :
- Équipe-projet Almanach (Automatic Language Modelling and Analysis & Computational Humanities)
- Plateforme SSK
« Avec ce projet, nous avons répondu à la problématique des partenaires en SHS… mais nous en tirons également des bénéfices !, se félicite Laurent Romary. Il nous a par exemple offert une très bonne compréhension de la gestion des données à large échelle. J’ai d’ailleurs été nommé responsable Données pour Inria en mars et j’ai lancé une grande enquête auprès des chercheurs pour identifier leurs pratiques et voir comment Inria pouvait développer une politique des données dans les années à venir. Tout cela découle de Parthenos. »
Le projet en lui-même n’aura pas de suite « à l’identique », mais il a ouvert de nombreuses autres pistes, par exemple en histoire et archives. Et dans de tels futurs développements, la plate-forme SSK développée sous la direction d’Inria pourrait bien de nouveau trouver sa place… pour faire avancer encore un peu plus la maîtrise du numérique dans les SHS, et donc l’étude et la sauvegarde du patrimoine.
Ce projet a été financé par la Commission européenne dans le cadre du programme H2020 sous l'appel “H2020 – EU.1.4.1.1. – Developing new world-class research infrastructures”.