Logiciel

Software Heritage : archive mondiale du logiciel

Date:
Mis à jour le 08/12/2021
Inria a ouvert en 2016 au public le projet Software Heritage. Ce projet, à l'initiative d'Inria, a pour objectif de collecter, organiser, préserver, et rendre accessible, à tous, le code source de tous les logiciels disponibles. Un enjeu de portée mondiale.
Illustration Enseigner l'informatique
© Inria / Photo G. Scagnelli

 

En construisant une archive universelle et pérenne du logiciel, Software Heritage vise à mettre en place une infrastructure essentielle au service de la société, de la science et de l’industrie.

Un défi sociétal, technique et scientifique 

Logo Software Heritage

Pour échanger des messages, payer des factures, accéder au divertissement, chercher des informations, ou planifier des voyages, pratiquement tous nos actes quotidiens dépendent de logiciels exécutés par des ordinateurs. Mais cela n’est que la partie émergée de l’iceberg : le logiciel contrôle l’électronique embarquée dans nos voitures et dans les équipements médicaux, il fait fonctionner les réseaux de transport et d’énergie, les banques et l’administration des organisations publiques et privées. Le logiciel est au cœur de tout développement technologique et est devenu indispensable pour la recherche scientifique dans tous les domaines. Il joue donc un rôle central et même critique dans notre vie quotidienne, notre industrie et notre société.

Afin de préserver ce patrimoine et de répondre aux défis technologiques et scientifiques de demain, il est essentiel de construire dès aujourd’hui une archive universelle et pérenne du logiciel. Software Heritage vise à construire à la fois une moderne « bibliothèque d’Alexandrie » du logiciel, le référentiel unique du code source et un grand instrument de recherche pour l’Informatique : le projet va permettre de préserver et diffuser la connaissance aujourd'hui encodée dans le logiciel, et augmentera notre capacité d'accéder à l'ensemble de l'information numérique. La base s’appuiera notamment sur une infrastructure distribuée, de manière à garantir la robustesse et la disponibilité des données.

Software Heritage pose les fondations d'un grand instrument de recherche en sciences du numérique qui permettra des avancées significatives pour la qualité, la sûreté de fonctionnement et la sécurité des logiciels que nous utilisons tous les jours, et deviendra à terme le catalogue de code de référence pour tous les utilisateurs industriels.

Pour Inria, Software Heritage est non seulement l'outil de préservation du patrimoine logiciel mondial reconnu par l'UNESCO, mais aussi un instrument au service de la science ouverte, et une formidable source de sujets d'étude dont on commence à peine à prendre la mesure.

Jean-Frédéric Gerbeau, Directeur général délégué à la science d'Inria

 

Les codes sources du secteur public, ce sont des milliers de dépôts. Rendre ces codes accessibles à tous exige qu'ils soient facilement découvrables, quelles que soient les forges où ils sont développés,  et préservés dans le temps long.  code.gouv.fr s'attaque au premier
 problème, mais c'est grâce à Software Heritage que l'Etat répond au second.

Bastien Guerry, DINUM

Software Heritage aujourd’hui : d'Inria à Microsoft

À ce jour, Software Heritage a déjà collecté plus de vingt millions de projets logiciels, deux milliards et demi de fichiers sources uniques archivés ainsi que tout l’historique de leur développement, ce qui en fait d’ores et déjà l’archive de code source la plus riche de la planète.

Software Heritage a déjà reçu le soutien de scientifiques, d’industriels, de sociétés savantes, de fondations, d’organisations indépendantes et institutionnelles. Parallèlement, deux premiers partenaires internationaux se sont déjà engagés pour soutenir le projet et l’aider à grandir : Microsoft , ainsi qu'une institution publique au service de la recherche scientifique, le DANS de la Royal Academy des Pays-Bas.

Le code source du logiciel constitue un patrimoine intellectuel essentiel pour le fonctionnement de nos sociétés. En tant que grand industriel du logiciel, nous sommes fiers d’être les premiers acteurs à contribuer à Software Heritage. Nous mettons à disposition l’infrastructure Azure pour contribuer à assurer la robustesse et la disponibilité de l’archive.

Jean Paoli, General Manager à Microsoft Corp.

Tous concernés, tous contributeurs

Ce projet a été initié par Inria, institut de recherche dédié au numérique et acteur incontournable du logiciel depuis de nombreuses années, convaincu du rôle essentiel du logiciel dans le développement de la société numérique. Inria a souhaité relever le défi, en mettant en place une équipe dédiée et les moyens nécessaires pour démarrer le projet. L'institut lance à présent un appel mondial à rejoindre cette initiative et ouvre le site softwareheritage.org.

Pour collecter tout le code source disponible, nous avons besoin de contributeurs qui signalent les milliers de sites disparates dans lesquels se retrouve aujourd'hui éparpillé le patrimoine logiciel mondial.

Pour contribuer au développement, nous avons une longue tradition de collaboration dans le monde du logiciel libre et nous allons ouvrir dans les prochains jours tout le code source de notre plate-forme pour que les développeurs du monde entier puissent participer à cet effort.

Pour répondre aux défis scientifiques nouveaux posés par la construction d’une archive universelle du code source à partir d’informations dispersées, nous avons besoin de la contribution des chercheurs dans toutes les disciplines.

Pour préserver et mettre à disposition ces contenus, nous avons besoin de ressources humaines, matérielles et financières et de partenaires, français et internationaux.

Le projet Software Heritage

  • Patrimoine culturel : préserver notre patrimoine logiciel, contribuer à préserver l’accès à tous les contenus numériques et fournir une source précieuse pour l’étude des technologies ;
  • Industrie : Software Heritage construit une archive de référence qui a le potentiel d’apporter des bénéfices industriels d’une grande ampleur, allant de la traçabilité à la conformité, de l’analyse et la qualification du code à la détection des failles, de la reconnaissance de modèles de programmation à l’analyse des tendances dans l’utilisation des composants ;
  • Recherche : Software Heritage garantira la disponibilité et la traçabilité du code source utilisé dans les recherches réalisées dans tous les domaines scientifiques ; il rendra possibles des études logicielles avancées et des expériences utilisant les données massives de tous les logiciels libres ;
  • Éducation : Software Heritage fournira aux enseignants et aux étudiants la plus grande compilation d’exemples de codes sources facilement consultables et référençables favorisant ainsi une meilleure formation.

Accéder au site officiel de Software Heritage