Algorithme

Mieux comprendre l’IA pour une utilisation plus raisonnée

Date:
Mis à jour le 25/10/2022
Comment faire aussi bien, avec moins ? C’est la question que se posent aujourd’hui de nombreux chercheurs en intelligence artificielle. Retour avec Francis Bach, directeur de recherche Inria, sur la recherche d’une IA plus économe en données, en ressources machines et en énergie.
Portrait de Francis Bach
© Inria / Photo G. Scagnelli

 

L’intelligence artificielle (IA) est partout. De la santé à la mobilité, en passant par l’industrie, l’éducation, ou encore l’agriculture, elle s’est immiscée ces dernières années dans chaque secteur, devenant pour ses acteurs un enjeu fort.

Les progrès récents dans le domaine, toujours plus impressionnants (en particulier en vision artificielle et traitement du langage naturel), sont le fruit d’un effort humain d’ingénierie énorme, de ressources computationnelles (et donc énergétiques) colossales mais aussi d’une publicité considérable. C’est une voie importante, dans laquelle de nombreux acteurs industriels et académiques sont engagés. Mais est-ce la seule voie pour la recherche en IA ?

Derrière l’IA "commerciale" : une IA du quotidien

Il existe en effet deux types d’intelligence artificielle :

  • l’IA de la "frontière", très présente dans les congrès et les médias, qui fait toujours plus, toujours plus vite ;
  • l’IA du quotidien, éloignée des applications médiatisées, mais utilisée par tous les scientifiques et ingénieurs et souvent basée sur des méthodes plus rudimentaires, car stables, accompagnées d’algorithmes et de garanties bien établies, et moins gourmandes en données.

Les deux sont importantes, et vont de pair. Le passage de l’une à l’autre est un enjeu important, où "faire marcher l’algorithme" ou battre l’état de l’art sur un benchmark ne sont pas les seuls buts. « Il y a une différence entre écrire un article preuve de concept et avoir quelque chose de pratique. Passer de la recherche publiée à la recherche effective n’est pas facile. C’est moins sous les projecteurs car c’est plus minutieux, mais c’est tout aussi important, de comprendre ce qu’il se passe », explique Francis Bach, directeur de recherche Inria, avant de préciser :

Quand on applique l’IA à de la publicité, si on se trompe, ça n’est pas dramatique, mais ça l’est beaucoup plus si c’est appliqué à des problèmes complexes, des secteurs critiques comme l’aviation. Il faut alors revenir à des hypothèses, et aller plus loin que montrer de belles images. Il faut revenir à la science classique.

En d’autres termes, il est nécessaire de comprendre les phénomènes afin de mieux les maîtriser, et donner des garanties théoriques nécessaires à leur déploiement dans des domaines sensibles (avions, voitures, santé).

Le chemin vers une IA frugale

Comprendre l’IA donne également le pouvoir d’ajuster les ressources informatiques nécessaires à son bon fonctionnement, et permet, par conséquent, d’être moins gourmand en énergie.

Aujourd’hui, et pour obtenir des résultats probants en IA, on se base sur de la surparamétrisation, c’est-à-dire le fait de mettre un nombre de paramètres très grand pour obtenir de meilleures performances. Deux questions se posent ainsi : surparamétrer permet-il véritablement d’obtenir de meilleurs résultats ? Et peut-on reproduire des résultats similaires avec moins de ressources ?

« Qui dit beaucoup de paramètres dit grosses machines et grandes données. Surparamétrer demande des ressources gigantesques », précise Francis Bach, avant de se questionner : « En faisant des grands modèles d’IA, on sait que ça fonctionne. Mais pourquoi ne pas faire avec plus petit ? »

L’enjeu aujourd’hui est ainsi de savoir jusqu’à quel degré de surparamétrisation nous devons aller pour obtenir des résultats probants, dans l’objectif de pouvoir prédire les ressources nécessaires pour un problème donné. Et tout en espérant qu’elles soient moindres.

L’IA frugale passera également par notre capacité, une fois les ressources nécessaires à nos calculs analysées, à faire des compromis. En premier lieu, sur le temps de calcul : « Faire marcher 100 machines pour réduire le temps de calcul consomme beaucoup d’énergie. En acceptant que le temps de calcul soit un peu plus faible, nous pourrions gagner en énergie », explique Francis Bach.

Un autre compromis se trouve dans la performance de l’IA : « Aujourd’hui, il faut que ça fonctionne le mieux possible, le plus rapidement possible. Pourtant, il faudrait être prêt à ajuster et perdre en performance pour avoir quelque chose de moins coûteux. C’est le problème classique du rapport entre bénéfice et risque. On fait toujours des compromis, mais l’intérêt serait que le curseur ne soit plus uniquement bloqué sur la dépense en énergie », conclut-t-il.

Francis Bach, conférencier à l’ICM 2022

Francis Bach sera conférencier à l'International Congress of Mathematicians (ICM) 2022, qui se tiendra en ligne du 6 au 14 juillet.

Francis Bach
© Inria / photo C. Morel

Son intervention, programmée le 13 juillet de 14:15 à 15:00 (room 6), portera sur des travaux en collaboration avec Lénaïc Chizat, actuellement professeur à l’EPFL, dans lesquels ils ont montré que la descente de gradient, l’algorithme d’optimisation le plus couramment utilisé pour l’apprentissage des réseaux de neurones surparamétrés, atteignait le minimum global de la fonction objectif qu’elle cherche à minimiser, donnant ainsi une justification partielle au besoin de surparamétrisation.