L’équipe du projet HAL-Inria : Prix Inria du soutien à la recherche et à l'innovation

Date:
Mis à jour le 08/04/2021
Publier, bénéficier d'une visibilité et être évalué par ses pairs, ce sont les trois enjeux scientifiques auxquels répond la plateforme HAL-Inria. Lancé en 2005, « Hyper article en ligne » est un portail d'archives ouvertes devenu incontournable pour les chercheurs. Le prix Inria du soutien à la recherche et à l’innovation 2015 récompense l'équipe qui agit au quotidien pour développer HAL et ses outils, en collaboration avec le CNRS.

En quelques années, le portail HAL (Hyper articles en ligne) géré par le CNRS a bouleversé la recherche en devenant un modèle alternatif pour la publication scientifique. L'une de ses portes d'entrée, HAL-Inria joue pleinement son rôle : permettre aux chercheurs de déposer leurs publications, tout en les plaçant sous le statut d'archives ouvertes. La visibilité des documents est immédiate, puisque les métadonnées sont créées directement par le déposant. « En se penchant sur ce modèle du libre accès aux résultats scientifiques, Inria s'est dit que ses communautés ne pâtiraient plus des longs délais des traitements éditoriaux qui peuvent aller jusqu'à deux ans avant la publication  », explique Jacques Millet, délégué à l'information et l'édition scientifiques d’Inria.

« Lors du lancement de HAL-Inria en 2005, Beaucoup d’éditeurs scientifiques étaient persuadés que HAL ne pouvait servir qu'à échanger des documents préparatoires, des notes, éventuellement des rapports, mais pas des contributions au sens de publications finalisées et dûment référencées  », raconte Jacques Millet. Dix ans plus tard, HAL-Inria a atteint une masse critique de publications en passant progressivement de l'incitation à l'obligation institutionnelle au dépôt dans l’archive HAL. Depuis 2013, les chercheurs Inria doivent publier sur le portail s'ils veulent que leurs résultats de recherche figurent dans leurs rapports d'activité ou d’évaluation.

Inria contribue de façon volontariste au développement des services de la plateforme HAL, internationale et mutualisée à l’échelle des établissements d’enseignement supérieur et de recherche français. En 2014, au moment du passage à la V3, il y a eu beaucoup d'efforts demandés aux équipes : « Nos réseaux métiers ont été impliqués très en amont pour maintenir le niveau de qualité des données, poursuit Jacques Millet.Entre mai et octobre 2014, tout a été vérifié pour qu'il n'y ait aucune perte le jour J.  »

Prochaine évolution, le développement de nouveaux services aux chercheurs, avec la promotion des « épi-revues ». Ces revues électroniques open-accesss ont alimentées par les articles déposés dans HAL, eux même certifiés par les pairs et validés par des comités éditoriaux dédiés. « Avec HAL, l'enjeu était de reprendre la main, sans nécessairement opposer les communautés scientifiques aux éditeurs commerciaux , affirme Jacques Millet. Nous sommes sur la bonne voie, sans avoir encore atteint l'étage pour que se développe une véritable alternative éditoriale.  » C'est cet essor que récompense le prix décerné aux équipes mobilisées sur les évolutions de HAL, décisives pour la libre diffusion et la valorisation des résultats scientifiques.

Alain Monteil

Coordinateur du pôle archives ouvertes IES (Information et Edition Scientifique) et membre du pôle édition scientifique.

« Cela fait dix ans que je travaille sur HAL ! Depuis la phase d'études en 2004, puis le lancement de HAL-Inria en 2005... En tant que coordinateur IES, je m'occupe des publications en libre accès. Je veille à ce que tout se passe bien avec les chercheurs lorsqu'ils déposent ou quand ils utilisent les services liés à HAL. Je suis documentaliste, mon rôle est de distribuer et mettre en place les actions décidées par Inria en matière d'archives ouvertes au sein du pôle archives ouvertes.

Par exemple, la publication intégrale étant un objectif important, nous avons fait un sondage pour en connaître les freins. Nous ciblons évidemment les déposants qui viennent juste de publier la notice d'une publication sur HAL et non le texte intégral. Avec un trio de documentalistes, nous avons écrit les questions et envoyé le mailing. Dans ce cas précis, nous avons reçu 60% de réponses, ce qui est un taux élevé. Je propose ensuite des actions pour lever les freins identifiés.

Pour générer leur rapport d'activité ou d'évaluation, les chercheurs ont vu leur tâche grandement simplifiée avec HAL-Inria. Parfois il y a des blocages, nous sommes là pour y répondre. S'il manque des publications, c'est en général parce que des champs ont été mal renseignés, notamment ceux liés aux équipes. 95% des dépôts sont modérés par le CCSD (Centre pour la communication scientifique directe) et nous gérons les 5% restants. Ce sont des documents non déposables sur HAL générique, mais qu'Inria souhaite publier, comme les mémoires d'étudiants, les présentations ou les introductions, associées à des conférences, etc. Dans le cas des étudiants, nous faisons valider les contenus par leurs responsables pédagogiques.

Pour la saisie des métadonnées, nous avons une interface sur laquelle on voit clairement les manques et les erreurs. Par exemple, pour contourner le champ obligatoire « résumé », certains indiquent : « pas de résumé » ! Nous les contactons alors pour faire un peu de pédagogie et expliquer l'intérêt d'un vrai résumé de leur publication, notamment pour l'indexation par Google. Nous pouvons intervenir directement sur HAL, le CCSD nous a donné des droits d'administration. Nous nous réservons cette possibilité pour régler les urgences. Cela arrive souvent pendant la période du rapport d'activité. Nous avons un surcroît de travail, car il y a des retardataires qui publient au dernier moment. Il faut valider beaucoup de publications en même temps, pour qu'elles puissent apparaître et être intégrées dans le rapport d'activité. À partir de la mi-novembre, on passe quand même de 30 dépôts en moyenne par jour à 250…

L'outil HAL donne satisfaction, mais tout est perfectible, et nous nous investissons à améliorer la qualité des données. Les technologies avancent : nos chercheurs n’utilisent plus de simples PDF, mais des pages Web dynamiques. Rien n'est figé. On va vers plus de simplification, plus d'ouverture, vers d'autres formes de diffusion et de communication comme Twitter. Nous veillons à respecter les normes et standards et nous sommes attentifs à leurs évolutions.

Ce prix est une belle reconnaissance du travail accompli lors de cette migration, mais également depuis 10 ans. J’associe à ce prix les documentalistes du réseau IES qui ont par le passé apporté leur contribution à HAL-Inria et qui, à présent, travaillent dans les autres pôles de l’IES, certains ont grandement facilité le passage de HAL V2 à HAL V3. »

Laurence Farhi

Ingénieure en développement d'applications, service e-information scientifique et multimédia (SEISM), direction des systèmes d’information

« Nous n’avions pas le droit à l’erreur ! Mi-octobre 2014, lors de la migration vers HAL V3, les fonctionnalités de création/modification de la V2 ont été interrompues un vendredi soir. Dès le lundi suivant, la nouvelle version était opérationnelle, il n'y a pas eu d'interruption de service ! Nous avions quelques inquiétudes sur la récupération des données, mais finalement tout s'est bien passé. C'était une migration risquée vu le volume de données – environ un million de publications – mais aussi par le nombre important d'utilisateurs. Ce passage réussi est le fruit d'un important travail de préparation et de coordination. Dans HAL V3, tout a été réécrit par le CCSD (Centre pour la communication scientifique directe) du CNRS : l'architecture de l'application a été complètement revue, le code entièrement réécrit, les référentiels repensés... Nous devions nous assurer de la pérennité de toutes les données mais aussi du bon fonctionnement de nos applications basées sur HAL qui ont dû être adaptées.

Au cours du développement de HAL V3, avec Laurent Romary, directeur de recherche Inria et conseiller scientifique auprès de la Direction générale déléguée à la science, nous avons travaillé à la mise en œuvre du format pivot de description des publications en s’appuyant sur le standard TEI (Text Encoding Initiative). Avec le pôle archives ouvertes, nous avons pu tester la version bêta : tests quantitatifs par les informaticiens de SEISM et qualitatifs par les documentalistes de l'IES. Ce travail a permis de détecter des bugs qui ont été remontés au fil de l’eau au CCSD. Aujourd'hui, cette nouvelle version de HAL est stable, elle utilise des technologies plus modernes, plus rapides et mieux sécurisées. Un outil permet de gérer les référentiels des auteurs, structures de recherches, etc... Des interfaces de programmation (API) permettent d'interroger ces référentiels et les documents déposés dans HAL, mais aussi de déposer dans l'archive ouverte via le protocole Sword.

Mon travail se répartit en trois missions importantes. La première est de développer, avec Thierry Dautcourt, collègue informaticien d’Inria également primé, des outils pour améliorer la qualité des données, détecter les doublons de publications, d'auteurs ou de détecter des incohérences. Le second axe est de développer des applications pour les chercheurs, disponibles depuis le site haltools.inria.fr. Dernière application à avoir migré sur HAL V3, Bib2hal permet de déposer un lot de publications dans HAL à partir d’un fichier BibTeX. Ces outils sont ensuite proposés au CCSD pour être diffusés auprès de toute la communauté des chercheurs et utilisateurs de HAL. Enfin, troisième axe, j'assure le support technique de HAL, le 1er niveau étant assuré par les collègues de l'IES.

Je suis contente que l'équipe HAL-Inria reçoive ce prix. C'est une reconnaissance du travail collectif mené entre la DSI et l'IES, notamment lors du passage à HAL V3. Il démontre tout l'intérêt que porte Inria à la valorisation de ses publications au travers de l'archive ouverte HAL ainsi que tout le travail que nous menons pour améliorer la qualité des données et le niveau de service aux chercheurs. »

L'équipe lauréate

  • Marie-Laure Bretin
  • Brigitte Briot Thorey
  • Claire Buren
  • Thierry Dautcourt
  • Laurence Farhi
  • Audrey Genoud
  • Agnès Hermann
  • Anne Jaigu
  • Alain Monteil
  • Jozefina Sadowska
  • Alfred Zami
Equipe HAL
© Inria / Photo G. Scagnelli