Des technologies pour la protection de la vie privée
En hindi, Nijta signifie "intimité" et par extension "identité" et "vie privée". C’est aussi le nom qu’a choisi Brij Srivastava, jeune chercheur en informatique d’origine indienne, pour la startup dont il est le fondateur. Sa finalité : proposer des services dans le domaine des technologies pour la protection de la vie privée.
Le chercheur s’est intéressé aux interfaces vocales (du téléphone aux assistants intelligents) : comment protéger son identité et sa vie privée lorsqu’on les utilise ? Une question d’autant plus cruciale depuis la règlementation RGPD (Règlementation générale pour la protection des données) qui nécessite pour les entreprises de sécuriser les données personnelles de leurs clients et de leurs collaborateurs.
Nijta fournit une solution : un produit à même de protéger les données vocales, et donc l’identité et la vie privée, en exploitant une technologie de pointe en matière d'anonymisation de la voix, perfectionnée par Brij Srivastava à l’occasion de son doctorat. Il a mené ce travail au centre Inria de l'Université de Lille (équipe-projet Magnet) dans le cadre du projet européen COMPRISE, désormais clos, sous la direction de Marc Tommasi, professeur d’informatique à l’Université de Lille et responsable de Magnet, Aurélien Bellet, chercheur au centre Inria de l'Université de Lille, et Emmanuel Vincent, directeur de recherche au centre Nancy – Grand Est (équipe-projet Multispeech) et pilote du projet.
Une contribution au développement d’assistants vocaux
Comment cette aventure est-elle née ? Depuis ses premières recherches en informatique, entamées en Inde par un master recherche de l’Institut de technologie de l’information d’Hyderabad (état du Télangana), Brij Srivastava s’intéresse aux usages des nouvelles technologies en particulier dans le domaine de la reconnaissance vocale. Il a déjà développé plusieurs solutions concrètes améliorant la communication entre humains, un enjeu social majeur dans un pays où cohabitent des centaines de langues et dialectes. Par exemple, une application utilisant la reconnaissance vocale pour proposer un diagnostic médical, disponible sur smartphone dans trois langues maternelles (en plus de l’anglais et de l’hindi), qu’il a mise au point lors de son stage de master en 2016.
Avant de rejoindre les équipes Inria, Brij Srivastava a aussi contribué à d’autres projets, notamment chez Microsoft, où il a participé en 2017 à Adivasi Radio, une application permettant à certaines populations tribales indiennes d’accéder à de l’information diffusée en gondi. En 2018, il a travaillé dans un centre d’appel où il a pu expérimenter concrètement les applications de reconnaissance vocale et les enjeux de collecte de données. « Les algorithmes de traitement de la voix sont devenus aujourd’hui très performants et les services exploitant ces technologies sont en plein développement, offrant aux humains la possibilité de mieux communiquer », s’enthousiasme le chercheur, qui connaît aussi les limites et risques potentiels de ces techniques.
Garantir la confidentialité de données sensibles
« Les données vocales contiennent énormément d’informations que des algorithmes sophistiqués sont capables d’analyser avec une grande précision : via un enregistrement sonore, il leur est possible de déterminer l’état émotionnel d’une personne, d’extraire des informations sensibles (localisation, opinion, etc.) et même de détecter si le locuteur est atteint d’une pathologie (par exemple la maladie de Parkinson) ou s’il fume… Autant de données dont on peut imaginer les potentiels usages discriminatoires », explique-t-il.
Lors de son doctorat chez Inria, Brij Srivastava a approfondi encore cette question : il a contribué à mettre au point un algorithme performant à même de garantir la confidentialité des données, tout en préservant les informations utiles au développement de services exploitant les enregistrements de messages vocaux.
Verbatim
Avec mes encadrants de thèse, nous avons présenté nos résultats aux participants de la conférence internationale Interspeech 2020, en appelant la communauté scientifique à identifier des failles potentielles de notre approche. À notre grande surprise, personne n’a su hacker notre algorithme, ce qui nous a donné confiance dans nos développements.
Fondateur de la startup Nijta
Offrir un service personnalisé
En rédigeant sa thèse quelques mois plus tard, a germé l’idée de transformer cette innovation (améliorée depuis sa première version) en produit commercial. C’est ainsi que Nijta a vu le jour pour accompagner cette stratégie. Soutenu par Inria, notamment grâce au Startup Studio, le projet porté par Brij Srivastava se structure aujourd’hui. « Nous travaillons sur l’analyse du marché, l’écoute des besoins d’utilisateurs potentiels de notre produit, l’élaboration d’un business model et d’une stratégie de développement technico-économique », précise-t-il.
Centres d’appels et services publics comptent parmi les premiers prospects identifiés par Nijta, qui s’appuie depuis quelques mois sur le renfort de Nathalie Vauquier, ingénieure de recherche de l’équipe Magnet, Seyed Ahmad Hosseini, doctorant, et Emmanuel Vincent, conseiller scientifique.
Évaluer et certifier la technologie Nijta
À l’occasion du Forum International de la Cybersécurité, tenu à Lille l’année dernière, Brij Srivastava et ses collègues ont rencontré différents utilisateurs de technologies vocales, dont le SAMU ou la Gendarmerie nationale, qui se sont montrés très intéressés par le logiciel de Nijta. Ces organisations disposent en effet de milliers d’heures d’enregistrement vocaux, potentiellement utiles au développement d’applications fondées sur des technologies d’intelligence artificielle en vue d’apporter une meilleure assistance aux personnes en détresse. Toutefois, ces données ne pourront être utilisées qu'une fois la confidentialité des informations garantie. Les services de Nijta peuvent donc se révéler déterminants pour ces clients potentiels.
Si les mois qui viennent s’annoncent décisifs pour Nijta en termes de lancement, Brij Srivastava et son équipe se concentrent aussi sur le dossier de certification CNIL que le jeune entrepreneur espère obtenir dès l’été. « Cette certification sera un élément central de la confiance qu’accorderont les futurs clients à Nijta, et elle nous permettra d’envisager sereinement le développement futur de la startup et de ses services », conclut le jeune chercheur et, désormais, entrepreneur.
En savoir plus sur l'utilisation de vos données personnelles
- Confidentialité des données et assistants vocaux (avec Brij Srivastava), Hub France IA, 28/4/2022.
- Reconnaissance vocale : que deviennent nos données personnelles ? Entreprendre, 23/12/2021.
- Assistants vocaux : la voie des données, CNIL, 3/11/2020.
- Comprendre le RGPD en cinq questions, Le Monde, 23/5/2018.