En quoi consiste votre projet ?
Dans le cadre de ce projet, baptisé VHIA (Vision and hearing in action ), je me suis fixé un double objectif. Premièrement, proposer une représentation mathématique d'objets audiovisuels, en l’occurrence le visage d’une personne qui parle. Il y a beaucoup à faire car les spécialistes de l’image et du son n’ont pas l’habitude de travailler ensemble. Les données, il est vrai, sont de natures très différentes. Par exemple, la propagation d’une onde acoustique et la réflexion de rayons de lumière sur des objets obéissent à des lois physiques différentes. Créer un modèle permettant d’unifier vision et audition est donc un véritable défi.
Dans un deuxième temps, nous allons faire en sorte que la perception et l’analyse des signaux sensoriels auditifs et visuels provoque une réaction chez une machine. Pour cela, nous allons nous appuyer sur le robot humanoïde NAO, d’Aldebaran Robotics, dont nous allons modifier les capteurs d’origines. Il devrait alors être capable d’interagir spontanément avec un groupe de personnes, en se déplaçant vers elles, s’il perçoit qu’il a attiré leur attention, et communiquer verbalement et par gestes. Le but final de ce projet : poser les bases d’un robot au comportement social évolué, à même de comprendre une situation et de communiquer avec des personnes qui l’entourent.
Qu’est ce qui vous donné envie de vous lancer dans cette aventure ?
À l’origine, je suis un spécialiste de la vision artificielle, un domaine passionnant, à la limite des sciences artificielles et expérimentales. Définir un processus permettant d’extraire d'une image une information utilisable est un challenge excitant. Progressivement, j’ai eu envie de m’ouvrir à la perception au sens large, car j’ai senti qu’il y avait un fort potentiel dans l’étude de la fusion audio-vidéo. Et puis, il y a cinq ans, j’ai pu rencontrer les fondateurs de la société Aldebaran Robotics avec lesquels j’ai collaboré dans le cadre du projet européen de robot social Humavips, terminé en mars 2013. Le projet VHIA s’inscrit dans la continuité de cette aventure ; il y a encore beaucoup à faire dans le domaine de l’interaction entre l’humain et le robot. Nous sommes au début d’une ère nouvelle, car je suis convaincu que ces robots pourront être beaucoup plus présents dans notre société, pour des fonctions d’accueils, mais aussi pour inciter les personnes à réapprendre à communiquer entre elles.
Qu’est ce que cette bourse représente pour vous ?
J’ai été très agréablement surpris car c’était la troisième fois que je présentais un dossier pour cette bourse. La plupart des chercheurs abandonnent généralement après deux refus, mais j’étais convaincu, à raison, que j’avais encore une marge de progression. Savoir rebondir après une déception fait partie de notre métier car la compétition est telle qu’on ne peut pas être toujours gagnant. C’est aussi une reconnaissance du travail que j’ai accompli ces dernières années.
Je suis heureux qu’un projet comme celui-ci, qui porte une part de rêve, ait pu recevoir une distinction aussi prestigieuse. Elle va me permettre de me projeter sur le long terme et de me concentrer sur les aspects scientifiques, sans avoir à rechercher des financements. C’est une chance unique pour mon équipe et pour moi-même.