Quelle définition pourriez-vous donner de la science ouverte ?
Laurent Romary : Le concept de science ouverte est issu d’une prise de conscience que les évolutions technologiques de ces 50 dernières années offraient de nouvelles possibilités d’envisager un accès plus large aux résultats scientifiques à destination des chercheurs eux-mêmes, mais aussi du tissu économique et de la société en général.
Alors que, dans un premier temps, la science ouverte a visé à corriger les dérives d’un système de publication scientifique aux mains de grands éditeurs privés, elle s’est orientée vers des thématiques intégrant les apports possibles d’une plus grande disponibilité des résultats scientifiques, par exemple en termes de reproductibilité.
Pour une institution telle qu’Inria, la science ouverte correspond aussi à une plus grande maîtrise éditoriale et technologique de ses contenus, en en augmentant la visibilité, la citabilité, mais aussi la pérennité. Dans ce cadre, nous y intégrons à la fois les productions proprement scientifiques de nos chercheurs, mais aussi tout ce qui touche à l’éducation et à la médiation scientifiques, pour lesquelles nous visons une dissémination la plus large possible des ressources que nous produisons.
Quels en sont les enjeux contemporains de la science ouverte, et les objectifs d’une politique d’incitation à court et moyen termes ?
Le plan national pour la science ouverte (PNSO), dont la deuxième édition a été publiée par le Ministère de l'Enseignement supérieur (MESRI) en juillet 2021, s’appuie sur les trois piliers que sont les publications, les données de la recherche et les codes sources des logiciels de recherche. Bien que ces trois objets possèdent des caractéristiques et une histoire qui leur sont propres, il est possible de dégager deux grands axes d’une politique visant à en favoriser l’ouverture. D’une part, il faut disposer d’infrastructures publiques et pérennes qui puissent les héberger et qui en garantissent l’accès sur le temps long. Il y a dans ce cadre une réelle tension avec l’émergence d’acteurs privés, tels que Research Gate ou Academia dans le domaine des publications, qui ont compris l’enjeu de s’approprier les contenus scientifiques dans un but de valorisation financière.
Par ailleurs, il faut intégrer la dimension de science ouverte au plus près des activités des chercheurs sans que cela devienne une charge administrative pour eux. Un des éléments clés est par exemple l’intégration de la science ouverte dans la production des rapports d’activités d’équipes ou des bilans de fin de projet de sorte qu’une publication déposée dans l’archive ouverte HAL y soit automatiquement intégrée sans effort supplémentaire pour les chercheurs.
Inscrire les actions d’éducation et de médiation scientifiques dans une logique de science ouverte est aussi une volonté forte de relier les citoyens et les scientifiques.
Comment Inria favorise-t-il le développement culturel et technique de l’idée de science ouverte ?
Inria a toujours eu une politique de participation au développement des plates-formes de la science ouverte et d’accompagnement des chercheurs.
Après avoir très tôt déployé son propre portail dans l’archive ouverte de publications HAL, l’institut est maintenant partenaire de l’unité d’appui et de recherche CCSD (Centre pour la communication scientifique directe) en collaboration avec les deux autres tutelles que sont le CNRS et INRAE. De façon concomitante, notre service IES s’est organisé pour accompagner les chercheurs dans leurs dépôts dans HAL, modérer les contenus et surtout garantir la qualité des contenus pour en faciliter la réutilisation.
Sur les codes sources de logiciel de recherche, Inria a accompagné depuis sa création le développement de l’initiative Software Heritage qui vise à un recensement et un archivage de l’ensemble du patrimoine logiciel en sources ouvertes passé et existant. Software Heritage héberge actuellement près de 12 milliards de fichiers de code source correspondant à 170 millions de projets logiciels.
Sur les ressources en éducation et médiation scientifiques, Inria accorde depuis très longtemps une importance au partage et à la diffusion ; citons Interstices pour explorer les sciences du numérique ou encore les différents Mooc produits par le Inria Learning Lab dont le succès ne dément pas.
Inria reste un institut pionnier en matière de publications ouvertes, qu’en est-il des données de la recherche ?
Les données de la recherche forment un ensemble bien plus hétérogène et complexe à gérer que les publications : il peut tout aussi bien s’agir de données primaires issues de capteurs, de simulation, ou de moissonnage de ressources en ligne, de données résultant de traitements informatiques complexes, comme c’est le cas des paramètres d’un modèle de machine learning, ou encore des jeux de données ciblés qui viennent illustrer une publication.
En fonction de la nature de la recherche, on peut observer de grandes variations de volumétrie, mais aussi de formats plus ou moins structurés ou normalisés. Enfin, de nombreuses contraintes peuvent porter sur les données sur lesquelles nous travaillons quand il s’agit de manipuler des informations personnelles, médicales, commerciales ou sur lesquelles portent des droits de propriété intellectuelle. Il s’agit pour l’institut d’offrir des moyens d’hébergement sécurisés à nos équipes de recherches tout en facilitant la diffusion en accès libre quand les conditions correspondantes le permettent.
Une première étape pour Inria est d’accompagner la réflexion des chercheurs dans le domaine de la gestion des données, notamment dans le cadre de la production de plans de gestion de données, tels qu’imposé par l’ANR, l’Union européenne ou encore dans le cadre du récent décret sur l’intégrité scientifique. Par ailleurs, Inria souhaite au plus vite pouvoir s’appuyer sur la future plate-forme nationale Recherche Data Gouv d’hébergement des données de recherche.