Startups

La méthode Naimrod pour devenir bilingue

Date:
Mis à jour le 24/03/2022
Incubée à Inria Startup Studio, Naimrod entrera sur le marché de l'apprentissage en septembre 2022. Un secteur de plus de cinq milliards d'euros, en pleine expansion, dans lequel la startup compte bien se faire remarquer. Naimrod arrive avec une méthode, un algorithme et une technologie développés sur le campus nancéien.
Marc Dinh et Benedict O'Donnel, fondateurs de Naimrod
© Inria / Photo B. Fourrier

Je rends l'apprentissage addictif

Mon nom, Naimrod, vient de celui du mythique roi Nimrod. C'est lui qui entreprit la construction de la tour de Babel, provoquant la colère divine. La légende dit que l'humanité fut dispersée, que des milliers de langues apparurent afin que les humains cessent de se comprendre. Moi, Naimrod, Nimrod avec de l'intelligence artificielle (AI), je n'espère pas retrouver une langue unique pour l'humanité mais je vais pouvoir aider les Hommes à mieux maîtriser les langues. Il existe nombre d'applications, de programmes et de tutoriels promettant l'apprentissage facile d'une langue étrangère, la demande est forte dans notre société-monde. Pourtant, à l'école de ces outils numériques, qui est devenu bilingue ? Avec l'apprentissage en ligne, les décrochages des étudiants sont massifs. Il reste une méthode à imaginer et peut-être de nouvelles technologies à intégrer. En la matière, je suis un nouvel acteur sur le marché : j'apporte à l'apprentissage des langues de la deeptech.

L'équation de Naimrod

Mon secret tient dans une formule : NLP + FCA. Le NLP, pour Natural Language Processing ou traitement automatique des langues, c'est mon algorithme, développé par Marc Dinh, mon créateur technique. Ma technologie NLP permet de faire ce que fait chaque professeur de langue lorsqu'il propose un extrait de film ou de série à sa classe pour aborder un point d'apprentissage. Mon algorithme, lui, peut le faire à une très grande échelle, de façon automatique. La première partie de la méthode Naimrod est là : donner à l'apprenant des contenus natifs, contenus originaux issus de plates-formes de streaming et triés par niveau de vocabulaire, par structure grammaticale.

Mon responsable commercial et futur CEO, Benedict O'Donnell, parle ici d'un algorithme qui rend l'apprentissage addictif : « Avec ces contenus natifs, l'apprentissage est mis en contexte, on est baigné dans l'imaginaire culturel de la langue que l'on veut apprendre. Et puis Naimrod exploite le péché mignon des utilisateurs : leur addiction aux séries. Une fois le cours terminé, les utilisateurs ont envie de découvrir la fin de l'histoire, de continuer la série et ils restent immergés dans ces nouvelles langues, sans décrocher. » Quant à la deuxième partie de mon équation, Marc et Benedict l'ont trouvée dans une équipe de recherche liée à Inria.

Explorer la connaissance avec l'équipe Orpailleur

Mon modèle technologique a été trouvé en octobre 2020, quand Marc et Benedict ont fait la rencontre de Miguel Couceiro, enseignant-chercheur à l'Université de Lorraine et responsable de l'équipe Orpailleur au Loria. C'est la cellule de transfert technologique d'Inria qui a mis mes créateurs en contact avec ce chercheur. Benedict O'Donnell se souvient d'une belle séance de brainstorming : « Je venais présenter Naimrod devant plusieurs chercheurs mais nous nous sommes trouvés avec Miguel parce que nous avons eu la même idée en simultané : associer à notre algorithme leurs recherches mathématiques. Et cette combinaison donne d'immenses pouvoirs à Naimrod» Miguel Couceiro travaille sur l'analyse formelle de concept (FCA). Le concept, au sens mathématique, est une représentation mentale des attributs d'une donnée (ou instance). La FCA met en application la théorie mathématique dite des "treillis", qui permet d'établir des structures, dans mon cas des cartographies de la connaissance d'une langue. Les chercheurs d'Orpailleur m'ont donné un outil, le learning space ou espace de connaissances, une représentation en arborescence qui permet d'établir un parcours des connaissances nécessaires pour comprendre une langue. Miguel Couceiro se réjouit de cette collaboration : « Le learning space est encore très théorique. Avec Naimrod, nous avons pu l'appliquer à des cas concrets, comme l'apprentissage du russe et du mandarin. » Eduardo Calò, « étudiant brillant » de Miguel Couceiro, a fait le pont entre le Loria et Naimrod. Pour Benedict O'Donnell : « Eduardo était un stagiaire sensationnel, notre catalyseur ». Le jeune chercheur vient de soutenir sa thèse et évolue vers d'autres horizons en traitement automatique des langues mais, en 2021, il a réussi à prouver le concept de la FCA appliquée à la linguistique.

Capture d'écran de l'outil Naimrod
Benedict O'Donnel et Marc Dinh
Outil Naimrod

Naimrod "en mode sniper"

Pour Miguel Couceiro : « Entre l'écrit et le parler, un niveau de langue est toujours difficile à définir car très subjectif. En anglais, il existe le TOEFL, qui définit et décrit des niveaux mais, en Chine, le mandarin repose sur une toute autre classification des niveaux d'apprentissage. Ici, la FCA s'avère très utile. » Pour Benedict O'Donnell : « Nous avons commencé avec le mandarin et un groupe d'enseignants du mandarin aident beaucoup Naimrod à s'améliorer mais c'est le même casse-tête pour toutes les langues, les discussions avec les spécialistes de linguistique font toujours remonter cette difficulté à bien identifier le niveau de leurs apprenants. Quand la FCA sera bien intégrée, Naimrod permettra de progresser dans l'apprentissage "en mode sniper", avec une formidable précision. » Grâce à moi, les élèves pourront se repérer dans la forêt des connaissances à acquérir pour maîtriser une langue, et ils auront plaisir à travailler à partir d'une grande richesse de contenus natifs.

Vers une révolution de l'apprentissage des langues

Je suis une entreprise immatriculée depuis novembre 2021 et je travaille déjà avec l'Université Paris 3, des écoles d'ingénieurs et une école de commerce. En mars 2022, j'ai obtenu une bourse de French Tech Tremplin. Cela m'a permis de collaborer avec l'incubateur Deeptech Agoranov et m'a aidé à lancer mon premier produit sur le marché. Les tests menés avec Eduardo ont montré une preuve de concept : la FCA permet de révolutionner l'apprentissage des langues. Ces recherches pourront être valorisées et moi, Naimrod, je dois continuer à collecter des données pour pouvoir intégrer progressivement cette deep technologie dont j'ai déjà l'équation. Mon futur CEO y croit : « Il faut attendre quelques années avant le décollage mais nous avons déjà une bombe d'enthousiasme à portée de main. »

Ma naissance dans un bar de Las Vegas – Rencontre entre Marc Dinh et Benedict O'Donnell

Retour en 2014. Marc Dinh poursuit des recherches en machine learning à l’Université du Nevada, à Las Vegas, après des études de mathématique et d'informatique à l'Université Paris 13. Benedict O'Donnell a terminé ses études de physique et se lance dans une première aventure entrepreneuriale. De retour d'un voyage d'affaires en Californie, Benedict s'arrête dans le désert du Nevada pour rendre visite à un ami. C'est dans un bar de Las Vegas, pendant une soirée karaoké, que Benedict et Marc ont commencé à rêver ensemble de Naimrod : Marc sera le cerveau technique et Benedict le porte-parole. Le rêve prend forme et Benedict espère chevaucher un jour une licorne : « Aujourd'hui le traitement automatique des langues offre un ensemble de blocs technologiques très puissants mais qu’il est encore difficile d’assembler dans des produits accessibles au grand public, ce qui fait que les traducteurs automatiques montrent vite leurs limites. Marc est un très bon assembleur, Naimrod est une super aventure. Avec ce projet nous avons une opportunité exceptionnelle, ça donne une bonne dose d'adrénaline. »

Découvrez Naimrod en vidéo