ScikitEDS : un outil de visualisation de suivi des flux de patients malades

Date:
Mis à jour le 22/06/2020
Dans le contexte pandémique actuel, l’AP-HP doit assurer un suivi permanent des flux de patients Covid-19 transitant par un de ses 39 hôpitaux et ainsi enregistrés dans son EDS (entrepôt de données de santé). Le partenariat avec Inria a permis de développer un outil sur mesure permettant de visualiser et de suivre quotidiennement et automatiquement les données de plus de 100 000 patients.
Photo équipe scikit-learn

Quelle est la genèse de votre projet ?

Début mars, l’AP-HP via son “entrepôt de données de santé” (EDS) au sein de sa direction des systèmes d’information (DSI) lance un appel aux bonnes volontés dotées de solides compétences en sciences des données et machine learning. L’objectif ? Analyser, quantifier, prédire et visualiser les données cliniques quotidiennes liées au Covid-19 et remontées des 39 hôpitaux de l’AP-HP afin de fournir chaque jour des rapports automatiques sur les flux de patients malades (retour à domicile, guérison, hospitalisation, réanimation). La base de données EDS-COVID contient les données pseudonymisées de tous les patients ayant eu un test PCR au sein de l’AP-HP (parcours patient, biologie, historique médical, démographie, comptes rendus médicaux, imagerie...).

À ce jour, plus de 100 000 patients sont dans cette base.

Si l’EDS avait l’expertise IT pour collecter les données et l'expertise médicale pour les interpréter, il lui manquait par contre les experts en science des données (statistiques, visualisation, modélisation) pour en optimiser le traitement. Après une visite d’Alexandre Gramfort sur le site de la DSI afin de clarifier les enjeux et les besoins, des ingénieurs du consortium Scikit-Learn (Olivier Grisel, Guillaume Lemaitre), des ingénieurs et chercheurs des équipes Parietal (Inria Saclay -  Gael Varoquaux, Thomas Moreau, Demian Wassermann, Alexandre Gramfort), SequeL (Inria Lille - Jill-Jênn Vie), Zenith (Montpellier - Julien Champ), et du service expérimentation et développement du centre Inria de Paris (Loic Estève) se sont mobilisés pour appuyer l’AP-HP sur le volet du traitement des données de la crise.

Depuis le 20 mars, cette équipe de neuf scientifiques Inria développe du logiciel, principalement en Python, pour le pilotage opérationnel de crise au service des personnels de santé de l’AP-HP. Ce travail se situe vraiment à l’interface entre l’IT et la médecine avec beaucoup d’efforts d’explicitation des concepts et des codes informatiques médicaux pour le reporting.

Verbatim

Les équipes d’Inria nous ont rejoints très tôt et nous ont aidés à structurer la task force Data EDS COVID. Leur appui a été essentiel pour avoir des indicateurs et des tableaux de bord de qualité pour le pilotage de la crise. Ils sont désormais en appui aux projets de recherche qui ont commencé. Au-delà de l’aide dans la gestion de l’épidémie, leur apport nous servira dans la durée et montre l’intérêt de partenariats associant experts du traitement de l’information et médecins. 

Auteur

François Crémieux

Poste

Directeur général adjoint de l'AP-HP

Comment se développe-t-il aujourd'hui et quels sont ses objectifs ?

Porteurs : Alexandre Gramfort (EPC Parietal)

Partenaire : AP-HP

#MachineLearning #visualisaton #datascience

L’équipe développe une pile logicielle pour le déploiement d’un dashboard web, un tableau de bord permettant la visualisation des données de la base EDS-COVID : démographie, statistiques d’hospitalisations notamment des durées de séjour, facteurs de risques et comorbidités, impact des prescriptions médicamenteuses.

Ce dashboard généré automatiquement à partir des extractions de bases de données hospitalières quotidiennes est destiné à la direction de l’AP-HP et est disponible depuis le 17 mai à tous les personnels soignants de l’AP-HP.

Un des éléments que produit le logiciel est une table synthétique contenant pour chaque patient plus de 200 variables descriptives. Cette table peut alors être directement utilisée pour la recherche.

Comment travaillez-vous avec vos partenaires ?

L’AP-HP nous donne accès à toutes les données de la base EDS-COVID via son portail Jupyter qui rend possible l’accès distant et sécurisé. Nous mettons à disposition de l’EDS des briques logicielles : une bibliothèque Python qui facilite le travail sur les bases SQL et un outil de suivi de qualité de données qui simplifie la mise en évidence des problèmes de qualité (problèmes de saisie ou de croisement de données par exemple). Une des plus grandes difficultés de ce projet réside dans la gestion de l’hétérogénéité des sources de données (variabilité d’outils logiciels, formats de données différents, données manquantes).

Le gros challenge de ce projet fut de réussir à travailler dans l’urgence de façon collective, avec beaucoup d’acteurs ayant chacun des habitudes de travail et utilisant un langage de programmation différents. C’est pourquoi, dans la phase d’élaboration de la task force EDS-COVID, nous avions des échanges biquotidiens, puis quotidiens, avec les docteurs : nous pouvions ainsi vérifier presque en temps réel la qualité des visualisations et des données.

Par la suite, nous avons continué la discussion sous forme de groupes de travail plus spécifiques (modèles de survie pour estimer la durée médiane de séjour en réanimation, provenance géographique des patients, impact des comorbidités telles que l’obésité sur la progression de la maladie), avec toujours un dialogue constant entre médecins et scientifiques Inria.

ScikitEDS, fruit de ce travail de plusieurs semaines, sert aujourd’hui à des dizaines de projets de recherche au sein de l’AP-HP.

Verbatim

La capacité des chercheurs et ingénieurs d’Inria à développer des briques logicielles durables et innovantes sur nos infrastructures informatiques nous a permis de travailler avec eux dans des conditions de sécurité idéales. Ils ont su parfaitement s’adapter à nos outils et s’insérer dans notre DSI. Le défi sera de réussir à reprendre en main leurs développements et à les maintenir dans la durée.

 

Auteur

Laurent Treluyer

Poste

Directeur des Systèmes d’Information de l’AP-HP

Le travail de l’équipe utilise beaucoup de logiciels libres : Jupyter, PostgreSQL, l'écosystème PyData avec Pandas, Matplotlib, scikit-learn ou Plotly. La gestion de projet est faite via GitLab ainsi que l'intégration et le déploiement continu des résultats via GitLab CI/CD et GitLab Pages. Nous utilisons Zulip comme plate-forme de discussion pour les centaines de collaborateurs.