30 ans du Web : une nouvelle phase dans laquelle Inria jouera son rôle au service d’une ambition numérique pour la France et l’Europe
Bruno Sportisse, PDG d'Inria et président du nœud européen du W3C
Jean-François Abramatic, la naissance du web et du W3C
Le World Wide Web est né en Europe, au CERN. Le 12 mars 1989, Tim Berners-Lee a proposé de développer un système de gestion d'informations au service des chercheurs du CERN qu'il a donc appelé World Wide Web. Son déploiement a été accéléré en 1993 par la mise à disposition du public du logiciel de navigation Mosaic développé au National Center for Supercomputing Applications de l’université de l’Illinois (NCSA) par Mark Andreessen.
La première conférence internationale du World Wide Web s'est tenue à Genève en mai 1994, la seconde a été organisée en octobre de la même année à Chicago par le NCSA. Le 1er octobre 1994, le MIT-LCS crée le World Wide Web Consortium (W3C). Tim Berners-Lee rejoint le Massachusetts Institute of Technology (MIT) pour devenir le directeur de W3C. La mission du consortium est de mener le Web à son plein potentiel en développant les standards du Web de manière collaborative. Fin 1994, le CERN choisit de concentrer ses efforts à la construction du Large Hadron Collider (LHC). Le CERN décline donc l'offre de devenir l'hôte européen du W3C. C'est Inria qui est choisi comme partenaire par le MIT en avril 1995. En mai 1996, Inria organise la conférence internationale World Wide Web à Paris. En septembre 1996, alors directeur de recherche à l'Inria, je deviens Chairman du W3C. L'université de Keio devient l'hôte asiatique du W3C en 1996 avant que l'université de Beihang héberge le consortium pour la Chine en 2007.
Gérard Giraudon, le Web s'installe chez Inria
L’invention du Web par Tim Berners-Lee découle de la vision qu’il a eue d’unifier au sein d’un même environnement, au-dessus d’un réseau d’ordinateurs, trois concepts qui préexistaient mais qui ne fonctionnaient pas ensemble :
- Un langage de document structuré HMTL (HyperText Markup Language) – issu de la communauté SGML (fin des années soixante) – qui permet de décrire du contenu d’une page web ;
- Un système d’adressage URL (Uniform Resource Locator) qui permet de donner l’adressage de ladite page web (le numéro IP sur le réseau Internet) issu de recherche sur les hyperliens (début des années soixante) ;
- Un protocole de communication HTTP (HyperText Transfer Protocol) pour transférer les données du Web entre le serveur et le client, bâti au-dessus du protocole TCP (Transmission Control Protocol) (standard IETF [FC 793] du début des années quatre-vingts).
Le Web est alors d’un environnement d’usage mais qui pose de suite des questions de recherche. Après l’ouverture du Web en 1992, de nombreuses équipes de recherche à travers le monde s’emparent du sujet en essayant de trouver les "bonnes" questions de recherche. Le point-clé a été la création du consortium W3C (1994) dont l’objectif est d’assurer la standardisation ouverte des technologies du Web afin d’assurer l’universalité des applications du Web à travers l’interopérabilité des trois piliers – et cela en s’inspirant du mode d’organisation de l’IETF.
Inria a joué un rôle majeur en rejoignant quelques mois après le consortium lancé par le MIT qui venait d’embaucher Tim Berners-Lee pour porter la branche européenne du W3C et contribuer à construire des standards internationaux. Jean-François Abramatic et Alain Bensoussan ont joué un rôle clé et Jean-François est rapidement devenu le président du W3C.
Inria a alors construit une équipe dédiée à Inria Sophia Antipolis qui s’est immédiatement attelée à la tâche avec notamment l’invention des feuilles de style (CSS - Cascading Style Sheets) et Inria s’est appuyé sur ses équipes-projets qui travaillaient dans les différentes dimensions du Web : les protocoles, les interfaces humain-machine, les documents structurés et les systèmes à base de connaissances. Parmi ces équipes les plus emblématiques, on peut citer l’équipe-projet Opera portée par Vincent Quint au centre de recherche Grenoble - Rhône Alpes qui travaillait sur les liens entre structuration des documents et visualisation de manière à ce que la visualisation du contenu s’adapte automatiquement aux dispositifs utilisés pour la visualiser. Parmi les succès, on peut citer le navigateur-éditeur Web Amaya qui a été pendant de nombreuses années le premier navigateur-éditeur diffusé et qui évoluait en implémentant tous les standards Web publiés par le W3C. On peut citer également les travaux de cette équipe portés par Nabil Layaïda sur le langage SMIL (Synchronized Multimedia Integration Language), standardisé par le W3C et qui est à la base des MMS que l’on retrouve sur tous les smartphones du monde actuel. Sur le volet des systèmes à base de connaissances, on peut citer l’équipe-projet Acacia de Rose Dieng qui a rapidement travaillé sur le développement du Web sémantique en contribuant au développement du standard XML puis RDF (Resource Description Framework) et proposant dès le début un moteur pour le Web sémantique (Corese).
Fabien Gandon, le Web d'aujourd'hui, entre liberté et contrôle*
Un Web citoyen ?
Pour Tim Berners-Lee, le Web va au-delà de l’organisation de données scientifiques. C’est une création sociale plus qu’une création technique. Et la société s’est emparée du Web et a créé son contenu. La "toile", c’est le résultat de l'usage fait du Web par plus de 3 milliards de personnes dans le monde, qui, chaque jour, choisissent les parcours et contributions qu’ils veulent y faire. Personne ne centralise et personne ne doit centraliser le contrôle du Web. Mais le W3C, le World Wide Web Consortium, propose les normes techniques pour le faire grandir sans perdre son interopérabilité. Il est le garant du fait, par exemple, que vous puissiez accéder au Web quel que soit notre navigateur. Le W3C réunit plus de 450 membres, institutions universitaires et de recherche et acteurs économiques, de la petite startup aux grands groupes comme Google ou Orange. C’est un forum de discussions. Quand un standard est proposé au W3C, chacun vote pour ou contre. Chaque membre a une voix, quelle que soit sa puissance économique.
Les inquiétudes autour du Web
Architecturalement, le Web est distribué : on peut mettre des contenus sur n’importe quel serveur dans le monde et les relier comme on veut. Vous ne pouvez pas m’empêcher de créer un site et de mettre un lien vers un autre site. Le danger, c’est quand une application recentralise au-dessus du Web. Prenons un réseau social qui deviendrait hégémonique et réunirait les contributions des utilisateurs dans son application. Chacun indique son humeur du moment mais toutes ces informations sont capturées dans les silos de données de l’application. Cela ne veut pas dire que tous les serveurs sont physiquement au même endroit, mais tous sont virtuellement centralisés car ils appartiennent à la même entreprise. On parle de centralisation applicative : elle n’est pas du fait du Web en lui-même mais d’une application au-dessus du Web. Et c’est contre cela que Tim Berners-Lee met en garde. Lui-même est en année sabbatique du W3C parce qu’il travaille sur le projet Solid. L’idée de ce projet est de permettre aux données de rester la propriété des personnes qui les produisent et de leur assurer un accès total à celles-ci. Les applications pourraient s’y connecter lorsque elles en ont besoin, et uniquement pour l’usage autorisé. Les propriétaires de ces données pourraient révoquer cette autorisation à l’application et modifier ces données à tout moment.
Le Web est-il totalement applicatif aujourd'hui ?
La force du Web est de faire les deux : des liens entre des documents, des applications, des bases de données,... bref tout ce que nous pouvons identifier sur le Web. Il permet de relier n’importe quelle ressource à n’importe quelle autre ressource, c’est ce qui le rend si pratique et si extensible. On doit cette avancée aux premiers contenus générés dynamiquement sur le Web tels que les résultats des moteurs de recherche. À l’origine, la navigation web ressemble à « je lis un texte, il y a un lien, je clique, j’atterris sur un autre document ». Avec les moteurs de recherche, il faut générer dynamiquement un contenu web. La page de résultats n’existe pas à l’avance, elle est calculée et générée à la volée en fonction de la requête et des contenus disponibles à cet instant. Avec ces pages dynamiques, on passe d’une logique de document à une logique d’application qui est aujourd’hui courante. Par exemple, se connecter à sa banque en ligne est une application, qui affiche ensuite des documents comme les relevés de compte. Et maintenant que nous utilisons les adresses Web pour identifier tout et n’importe quoi (une protéine, un auteur, une température, un concert, une ville, etc.) le Web nous permet de relier toutes ces choses à loisir de de programmer à loisir les réponses qui nous sont faites lorsque nous passons de l’une à l’autre.
*Extraits de l'entretien de Fabien Gandon par Audrey Dufour, Le Web est une création plus sociale que technique, paru dans La Croix le 12 mars 2019.
Bruno Sportisse, PDG d'Inria et président du nœud européen du W3C
Le Web est l’exemple d’un projet à impact mondial dans lequel Inria a su s’impliquer très tôt à travers son rôle dans le W3C. C’est aussi une parfaite illustration du positionnement singulier d’Inria, qui est là pour prendre des risques en recherche et en innovation : je veux rendre hommage au rôle déterminant et visionnaire qu’ont joué des personnalités comme Alain Bensoussan et Jean-François Abramatic. Aujourd’hui, de nouveaux défis sont devant nous. Comment faire évoluer le Web sur des bases qui privilégient la garantie de confiance sous toutes ses formes (cybersécurité, respect de la vie privée, neutralité) ? Comment faire évoluer la gouvernance mondiale du W3C, qui a toujours été multilatérale, et maintenir et renforcer la position de l’Europe dans ce contexte ? Ces 30 ans marquent le début d’une nouvelle phase pour le Web dans laquelle Inria jouera son rôle au service d’une ambition numérique pour la France et l’Europe.