Action Exploratoire

LearnToOpt

Au-delà de l'optimisation basée sur le gradient
Au-delà de l'optimisation basée sur le gradient

Le contexte général de ce projet est l’optimisation numérique de problèmes difficiles qui peuvent être non-convexes, mal conditionnés, avoir toutes sortes d’irrégularités. De tels problèmes se rencontrent souvent dans des applications réelles dans différents domaines. Traditionnellement, les algorithmes capables d’optimiser ce type de problèmes sont mis au point “à la main” en utilisant des équations de mise à jour des variables d’état que l’on peut interpréter et comprendre. Ce projet vise à explorer une approche radicalement différente où un algorithme d’apprentissage statistique apprendrait la mise à jour des variables d’états de l’algorithme et ainsi construirait automatiquement de nouveaux solvers. Il vise à exploiter les récents progrès en apprentissage par renforcement. Il s’inscrit dans la lignée de travaux appelés “Learn to optimize” qui ont pour le moment exploré l’apprentissage d’algorithmes à base de gradients.

Équipe(s) impliquée(s)
RANDOPT

Contacts

Nikolaus Hansen

Responsable scientifique

Dimo Brockhoff

Co-responsable scientifique