La santé numérique a, ces dernières années, évolué de manière impressionnante. Nous n’avons d’ailleurs jamais eu autant d’informations disponibles et de puissance de calcul qu’à présent, et ce malgré les difficultés connues d’accès aux données. Cela nous a permis, notamment, d’aller plus loin dans la construction de modèles explicatifs voire prédictifs, du vivant, à plusieurs échelles mais aussi des organisations et systèmes de soin. Le Défi URGE, lancé avec l’AP-HP, en est l’illustration parfaite.
À côté de cela, quelques tendances émergentes sont particulièrement intéressantes. Je pense, par exemple, à la nécessité de travailler sur des méthodologies pour l’évaluation des dispositifs médicaux numériques.
Ce sujet est phare, d’autant plus que le marquage CE (communauté européenne) va devenir obligatoire.
Cette tendance crée davantage de dialogue entre les scientifiques et les acteurs du domaine, notamment autour du besoin de comprendre comment évaluer, à grande échelle, des dispositifs qui sont généralement développés par les chercheurs sur des populations plus restreintes, donc potentiellement différentes. L’explicabilité reste, également, un enjeu fort, et plus en médecine qu’ailleurs. Et au-delà de l’explicabilité, c’est l’auditabilité qui est importante : si le dispositif se trompe, il faut pouvoir l’auditer et comprendre pourquoi et où il s’est trompé, mais aussi qui est potentiellement fautif. C’est un sujet sur lequel beaucoup de scientifiques travaillent, sans résultats probants pour le moment.
Une autre tendance est également d’essayer de sortir des contraintes actuelles des algorithmes de machine learning, qui demandent d’énormes quantités de données de type Big Data dites “propres”, c’est-à-dire sans erreurs, alors que nous avons beaucoup de données de type Fat Data dites “sales”, c’est-à-dire avec des erreurs, des données manquantes, qui pourraient néanmoins être utilisées.
Côté données, nous assistons à un intérêt grandissant de la recherche pour les données de transcriptomique. L’idée étant de développer des méthodes permettant l’analyse des données issues du RNAseq, afin d’en tirer le maximum d’information pour avoir une vision toujours plus moléculaire. Ceci dit, les méthodologies d’analyse de ces données gagneraient à être plus matures, et leur hybridation avec des données d’autres types (images, données tabulées, catégorielles, etc.) n’est selon moi pas encore parfaitement maîtrisée.
Enfin, et malgré des cultures qui resteront nécessairement différentes car nos missions le resteront, l’envie et les possibilités de travaux pluridisciplinaires sont grandissantes.
L’Inserm et Inria ont à présent plusieurs équipes communes, et nous avons un laboratoire commun avec l’AP-HP et un autre avec les Hospices civils de Lyon. Ceci sans lister toutes les collaborations des équipes des centres de recherche Inria avec les CHU en région. La mise en place aussi des différents EDS (Entrepôts de données de santé) nous amène à réfléchir à la manière dont nous pourrions contribuer à faciliter l’échange de bonnes pratiques et d’outils pour en faciliter l’exploitation pour la recherche. Les travaux de nos collègues sur l’apprentissage fédéré pourraient aussi y contribuer.