Développé dans le cadre du programme Horizon 2020, COMPRISE vise à définir une méthodologie et des outils délibérément axés sur le respect de la vie privée dès leur conception, afin de réduire les coûts de développement et d’accroître l’inclusivité des interfaces vocales.

COMPRISE présente un intérêt pour toutes les entreprises ou administrations désireuses de déployer leur propre solution de technologies vocales et linguistiques ou de stocker des données vocales et linguistiques en respectant les exigences du RGPD.

Le projet vise plusieurs objectifs :

  • permettre la collecte pratiquement illimitée de données vocales et linguistiques concrètes en les anonymisant grâce à des transformations de données innovantes, de manière à ce que les données transformées puissent être utilisées pour entraîner des systèmes de conversion de la parole en texte (STT) et de compréhension du langage parlé (SLU) ;

  • donner accès aux citoyens en toute transparence aux contenus et services disponibles dans d'autres langues grâce à une interaction vocale dans leur propre langue ;

  • réduire les coûts, tant pour les fournisseurs que pour les utilisateurs des technologies vocales.

COMPRISE a atteint de nombreux jalons depuis 2018 ! L’exemple le plus parlant est les progrès réalisés au niveau des composants qui constituent la solution :

 

  • Le kit de développement logiciel (SDK) COMPRISE, conçu pour les applications de smartphone, est développé à l’aide du framework Ionic sur la plateforme Angular, ce qui permet aux développeurs de créer des applications multilingues et vocales de manière plus rapide, économique et respectueuse de la vie privée.

  • La plateforme Cloud COMPRISE recueille des données vocales anonymisées pour entraîner les modèles STT et SLU, et donne accès aux modèles obtenus.

  • Le COMPRISE Voice Transformer convertit la voix de chaque personne en une autre voix et veille à ce que toute information extraite de la voix transformée ne permette pas de remonter au locuteur d'origine.

  • Le COMPRISE Text Transformer permet aux utilisateurs dans différents domaines d'application de masquer des informations sensibles dans un texte afin d’en préserver le caractère confidentiel.

  • COMPRISE Weakly Supervised STT et Weakly Supervised NLU réduisent la nécessité de libeller manuellement les données, une tâche à la fois coûteuse et chronophage, lors de l’apprentissage des systèmes STT et NLU.

  • COMPRISE Speech-to-Text Translation associe le STT et la Traduction Automatique pour permettre à chaque utilisateur de parler sa propre langue lorsqu’il interagit avec un système de dialogue qui utilise une langue interne différente.

Suivez les grandes étapes de COMPRISE sur www.compriseh2020.eu