Vers une recherche plus reproductible en intelligence artificielle pour la médecine

Date:
Mis à jour le 08/04/2021
Pouvoir reproduire des résultats obtenus est un enjeu majeur en recherche notamment biomédicale et une étape essentielle pour tirer des conclusions durables de ceux-ci. L’équipe ARAMIS, d’Olivier Colliot et Stanley Durrleman est une équipe Inria (basée à l'ICM commune CNRS, Inserm, Sorbonne Université) ; elle a développé un ensemble d’outils logiciels permettant une reproductibilité dans les études d’évaluation de système d’aide à la prise de décision médicale. Les résultats sont publiés dans la revue Neuroimage.
Yet another ADNI machine learning paper
© Inria / Aramis

La reproductibilité des résultats est un enjeu important pour la fiabilité de la recherche, notamment biomédicale. Il y a à l’heure actuelle une réelle difficulté à reproduire les résultats des études, liée notamment aux méthodes de gestion et de traitement des données qui ne sont pas toujours suffisamment accessibles ou standardisées. Cet enjeu est présent dans de nombreux domaines, notamment le développement d’outils d’intelligence artificielle pour la médecine.

L’équipe ARAMIS s’est penchée sur cette problématique dans le cadre plus spécifique des systèmes d’aide à la décision médicale et notamment l’aide au diagnostic de la maladie d’Alzheimer. 

« C’est un domaine dans lequel il y a eu énormément de travaux depuis une dizaine d’années, avec de nombreuses d’approches dans les systèmes d’aide à la décision. La plupart de ces études utilisent une même base de données publique de patients, ADNI (Alzheimer's Disease Neuroimaging Initiative) et pourtant, impossible de les comparer entre elles », souligne Olivier Colliot.

Chaque étude dans ce domaine va en effet utiliser un sous-échantillon de patients différent issu de cette base, sur des critères qui ne sont pas toujours précisément définis. Ces données subissent ensuite des traitements variables d’une étude à l’autre. Résultat : il est souvent difficile de tirer des conclusions de ces études et le transfert vers la clinique reste faible. 

Pour tenter de répondre à cette difficulté, les chercheurs de l’ICM ont développé un ensemble d’outils logiciels open source pour standardiser et reproduire très facilement les résultats d’évaluation de ces systèmes d’aide au diagnostic. Il s’agit d’un workflow totalement automatisé, partant de la base de données et auquel il suffit d’ajouter l’algorithme d’intelligence artificielle développé, par exemple pour distinguer un patient atteint de la maladie d’Alzheimer d’autres pathologies, et qui va conduire à une décision. 

À l’heure actuelle, ce logiciel est prévu pour l’analyse de données d’IRM anatomiques et de TEP (tomographie par émission de positons), des outils importants dans le diagnostic de la maladie d’Alzheimer. Les chercheurs et chercheuses souhaitent poursuivre le développement de la plate-forme logicielle afin de l’étendre à d’autres types de données mais également à d’autres pathologies comme la maladie de Parkinson. Olivier Colliot conclut :

 

Nous souhaitons aller vers une meilleure standardisation des études de validation des systèmes d’aide à la décision médicale et une plus grande reproductibilité, donc des résultats plus fiables et transférables de manière plus efficace vers la clinique

 

 

Sources : Reproducible evaluation of classification methods in Alzheimer's disease: Framework and application to MRI and PET data. Samper-González J, Burgos N, Bottani S, Fontanella S, Lu P, Marcoux A, Routier A, Guillon J, Bacci M, Wen J, Bertrand A, Bertin H, Habert MO, Durrleman S, Evgeniou T, Colliot O; Alzheimer's Disease Neuroimaging Initiative; Australian Imaging Biomarkers and Lifestyle flagship study of ageing. Neuroimage. 2018 Aug 18;183:504-521.