Changed on 12/09/2024
Au travers d’une lettre de Mission adressée à Inria le 04 mai 2022, le Gouvernement demandait à Inria le développement et la maintenance à l’état de l’art d’un ensemble de logiciels ouverts couvrant l’intégralité du cycle de la donnée et des modèles. De cette mission est né P16, un projet structuré autour d'une collaboration innovante public-privé. Mise en place, objectifs et feuille de route : zoom sur le projet avec Fabien Le Voyer, Directeur du Programme IA d’Inria, et Yann Lechelle, Président Directeur Général de Probabl.
© Inria / Photo M. Magnin

Dans quel cadre a été créé le projet P16 ?

Fabien Le Voyer, Directeur du Programme IA, Inria : En 2018, le gouvernement a lancé une Stratégie Nationale pour l’IA dans l'objectif de consolider notre souveraineté et de nous positionner parmi les leaders mondiaux du secteur. 

Après une première phase résolue à accroître les capacités et la compétitivité française dans le domaine de la recherche, le coup d'envoi de la deuxième phase est donné en novembre 2021. Inscrit dans la stratégie d’accélération France 2030, le virage est pris pour orienter les mesures vers la diffusion des technologies d’IA au sein de l’économie en renforçant la formation à l'IA, en développant une offre de technologies Deep Tech et en misant sur le rapprochement de l’offre et la demande de solutions d’IA. 

Parmi les mesures phares, le Gouvernement a confié à Inria la mission de développer et maintenir un ensemble de communs numériques souverains pour l'intelligence artificielle, au niveau français et européen. De cette demande de l’État est né le projet P16, en tant que mesure N°16 de la Stratégie d’Accélération pour l'IA. 

Cette démarche s’inscrit dans une dynamique plus globale de délégation par l’État à l’Agence de Programmes Algorithmes, Logiciels et usages, du pilotage de projets stratégiques, ayant vocation à intégrer un ensemble large de partenaires, et à fédérer des écosystèmes de recherche et d'innovation autour de priorités communes.

Quel est le principal objectif du projet P16 ?

Fabien Le Voyer : En s'appuyant sur l'expertise d'Inria dans le domaine des outils Open Source, P16 se concentre sur le développement et la maintenance à l'état de l'art d'un ensemble de bibliothèques logicielles couvrant l'intégralité du cycle de la donnée (à savoir : l’interopérabilité des données, leur préparation et le développement de modèles d’apprentissage automatique).

En s’inspirant de la success story de scikit-learn, P16 s’attachera à développer une méthodologie misant sur des standards élevés en termes de production logicielle, des tests approfondis, une documentation optimisée et des tutoriels adaptés, ainsi qu’une communauté forte, pour transformer l’essai avec d’autres logiciels Open Sources d’origine académique et que seraient amené à intégrer le projet.

P16 est un projet ambitieux qui entend fédérer largement les acteurs de la recherche et dynamiser les collaborations entre les écosystèmes académiques et industriels, pour enrichir les bibliothèques et répondre aux besoins diversifiés des utilisateurs.

Les partenaires académiques sont mobilisés via l'Agence de Programme et ces collaborations permettront d'identifier des briques logicielles complémentaires et de renforcer les actions de recherche amont et de pré-industrialisation. 

En parallèle, le lien avec la communauté économique et industrielle est essentiel pour analyser les besoins au plus près des utilisateurs et développer des cas d'usage concrets, permettant ainsi d'améliorer la pertinence des solutions déployées.

Qu’est-ce que Probabl ?

Yann Lechelle, Président Directeur Général de Probabl : Probabl est une spin-off d’Inria car sa genèse se retrouve dans le projet P16, mais aussi en raison de son démarrage avec quelques actifs transférés de l’institut de recherche à cette startup : une équipe et de la propriété intellectuelle. Probabl est aussi une Entreprise à Mission de Souveraineté Industrielle et Numérique au capital réparti entre actionnaires publics (dont Inria), privés et personnes physiques et dont le cadre statutaire garantit la souveraineté numérique française et européenne sur le long terme. Ce modèle d’entreprise a été créée spécifiquement pour répondre au volet post-industriel du projet P16, prenant en compte la nécessité de co-exister de manière compétitive dans un marché à la fois mur et dynamique qui couvre la science des données, l’apprentissage automatique et l’intelligence artificielle.

Forte de ses 1,5 milliard de téléchargements, devant PyTorch (de Meta) et Tensorflow (de Google) combinés, scikit-learn est devenue une technologie fondamentale dans la boite à outil du data scientist à travers le monde. Pour Probabl qui devient l’opérateur officiel de la marque scikit-learn, il convient d’adopter une approche à la fois défensive et offensive dans un environnement commercial compétitif pour maintenir notre pertinence au sein des nations.

Probabl adopte une double mission que l’on retrouve dans sa Raison d’Être (principe inscrit dans ses statuts, une nouveauté issue de la loi PACTE) : une mission d’intérêt général qui vise à générer des dividendes sociétaux sous la forme de communs numériques, sans se soustraire à une mission de performance financière et commerciale plus classique. Ce modèle ambitieux correspond aux enjeux mêmes de notre société moderne qui ne peut pas ignorer la nécessité d’intégrer des composantes extra-financières dans la gouvernance des entreprises. Au-delà des enjeux de responsabilité sociétale des entreprises (RSE) plus classiques, Probabl intègre de manière explicite la notion fondamentale que le numérique français et européen a besoin de s’appuyer sur l’open source et les communs numériques pour rattraper son retard et distribuer au plus grand nombre de partenaires régionaux les outils leur permettant d’améliorer leur propre compétitivité.

L’équipe initiale compte 14 personnes dont une majorité issue du consortium scikit-learn historiquement piloté par Gaël Varoquaux, Directeur de Recherche au sein de l’Équipe Soda, et François Goupil, mais aussi autour de Fabien Gandon, Directeur de Recherche au sein de l’Equipe Wimmics, ainsi que plusieurs externes dont moi-même, dirigeant et entrepreneur du numérique depuis plus de 20 ans.

Structurellement, l’entreprise est française, mais compte déjà une trentaine de collaborateurs répartis entre nos bureaux à Paris, à Saclay (au sein du bâtiment Alan Turing d’Inria), à Berlin, ou en distanciel pour quelques collaborateurs (Sophia Antipolis, Harlem/Amsterdam, Grenoble, Vannes).

 

Comment "cohabitent" la composante académique P16 et la composante industrielle Probabl ?

Afin de garantir l'autonomie financière du projet à horizon 5 ans et pour permettre la maintenance et l'évolution de ses résultats sur le long terme, une structuration publique-privée innovante a été initiée et s'articule autour de :

  • P16, composante académique du projet qui se concentre sur la recherche, l’évaluation et la pré-industrialisation de travaux intégrables dans l’offre globale et qui pourront enrichir les communs numériques sur tous les axes techniques. P16 guidera l'évolution scientifique et technique pendant toute la durée du projet. En parallèle, P16 jouera un rôle essentiel dans la dissémination des connaissances dans le monde académique, tout en développant et coordonnant la dynamique associée à l'échelle française puis européenne.
  • Probabl développe et maintient une offre commerciale de solutions et de services structurée autour de communs numériques tels que scikit-learncorese ou skrub, tout en investissant dans la maintenance de ces technologies. Son rôle s'étend à la facilitation de la diffusion de ces solutions dans le monde industriel, tout en assurant la pérennité économique du projet sur le long terme. L’entreprise vise l’équilibre et une croissance commerciale forte pour garantir sa pérennité au-delà de cette première période de 5 ans.

Ces deux structures œuvrent en partenariat étroit pour garantir le bon fonctionnement du projet et la réussite de cette collaboration innovante pourra devenir, à terme, une inspiration pour la pérennisation d’autres environnements logiciels open source.

Quelle est la feuille de route du projet P16 pour l'année à venir ?

Fabien Le Voyer : Les premières années du projet seront orientées vers la phase de pré-industrialisation, pour amener les premières briques logicielles identifiées à l'état de la pratique de la production logicielle.

Dans les mois à venir, P16 publiera un Appel à manifestation d’intérêt (AMI), largement ouvert sur la communauté de recherche en particulier, pour sélectionner, au fil de l'eau, des propositions de méthodes, algorithmes, briques logicielles, etc. qui viendront intégrer l'offre globale du projet.

P16 s’appuiera sur toute l’étendue des ressources et les nombreuses initiatives développées par Inria, notamment dans le cadre de la formation avec Inria Academy ou pour renforcer son ancrage au sein de la communauté Open Source, avec Software Heritage.

Au-delà d’Inria, P16 aura vocation à devenir un véhicule potentiel de transfert industriel de projets de recherche qui s'inscrivent dans la SNIA, tels que les projets du PEPR IA, axés sur l’IA de confiance, l’IA frugale et l’IA embarquée, mais également des initiatives portant sur l’évaluation de l’IA ou encore des projets soutenus par les 3IA et les IA-Clusters.

Enfin, pour mener à bien leurs missions, P16 et Probabl miseront sur la construction de relations de confiance avec les partenaires, notamment industriels, et une compréhension mutuelle des besoins marché de différents secteurs.

Quelle est la feuille de route de Probabl pour l'année à venir ?

Yann Lechelle : Probabl est une startup qui doit se structurer pour exécuter un business plan ambitieux. L’entreprise et ses trente collaborateurs sont structurés autour de plusieurs équipes distinctes qu’il est prévu d’étoffer rapidement : équipe open-source (à vocation de développement et maintien des projets clés dont scikit-learn, corese, skrub), équipe d’ingénierie produit (nouveaux produits à forte valeur ajoutée et à vocation commerciale), équipe certifications et formations, équipe services professionnels, et enfin l’équipe support en cours de création. Des fonctions transverses assurent la cohérence de l’ensemble au niveau RH, comptable, légal, marketing et commercial.

Un premier produit est en cours de développement avec pour volonté de présenter un MVP avant la fin de l’année 2024, ainsi que la mise en œuvre d’un programme de Sponsorship et Partenariat privés pour prendre le relai sur le consortium scikit-learn qui n’a plus de raison d’être dans sa forme actuelle. L’équipe professionnelle démarre actuellement avec l’acquisition de l’équipe de l’entreprise Mnemotix qui historiquement travaillait main dans la main avec l’équipe Wimmics. L’équipe certifications et formations prévoit de mettre en œuvre dès le prochain trimestre la première certification officielle au monde de scikit-learn, avec trois niveaux « associate », « professional » et « expert ». 

Coté financement, le modèle de gouvernance et d’actionnariat imaginé pour l’entreprise nécessitent de trouver des investisseurs privés afin d’aboutir à un équilibre avec les capitaux publics engagés dans le cadre du projet P16. Une levée de fonds intermédiaire sera annoncée dès septembre 2024, ce qui permettra d’augmenter la voilure et d’accélérer l’exécution de la feuille de route ambitieuse telle que fixée dans le business plan.