Euphonia : améliorer la reconnaissance vocale
Avec le projet Euphonia, l’intelligence artificielle aide à adapter les outils de reconnaissance vocale pour les personnes souffrant de troubles de la parole. Retour sur cette innovation portée par Julie Cattiau, chef de produit chez Google.
Des centaines de millions de personnes à travers le monde souffrent de troubles de la parole dus à des maladies ou handicaps tels que la maladie de Charcot, de Parkinson, ou la surdité. Pour eux, les outils de reconnaissance vocale peuvent se révéler inefficaces et peu adaptés à ces modèles de communication orale. « La principale raison est que ces technologies de reconnaissance vocale n’ont pas été entraînées avec un ensemble d’échantillons vocaux suffisamment variés, incluant des échantillons prononcés par des personnes souffrant de troubles de la parole », explique Julie Cattiau. Afin de répondre à cette problématique, Google travaille depuis 2019 sur le projet Euphonia.
Le plus grand ensemble de données vocales au monde
Le principe ? Améliorer ces outils de reconnaissance grâce à l’intelligence artificielle, en les exposant à d’autres types d’expression orale. Ainsi, selon Julie Cattiau, « près de 2 000 heures d’échantillons vocaux ont été fournies par plus de 2 200 volontaires, créant ainsi le plus grand ensemble au monde de données vocales avec troubles de la parole ». Dans un premier temps limités à l’anglais, ces enregistrements se sont ouverts à d’autres langues dès 2022, en commençant par le français, l’espagnol, le japonais et l’hindi. Ces échantillons ont ensuite été analysés et traduits sous forme de spectrogrammes (photographie d’un spectre lumineux obtenu au spectrographe), afin d’améliorer les algorithmes des outils de reconnaissance vocale. Résultat ? Les chercheurs de Google ont désormais accès à ces données et peuvent travailler sur l’amélioration de la reconnaissance vocale pour les personnes atteintes de troubles de la parole dans ces langues.
Un algorithme de reconnaissance vocale personnalisé
Atteinte de la maladie de Charcot, Andrea est une des premières “bêtatesteuses” du projet Euphonia. Ayant besoin d’un déambulateur pour se mouvoir, elle souhaite pouvoir allumer et éteindre les lumières, changer la température d’une pièce ou allumer la télévision sans avoir à se déplacer. Grâce à un algorithme de reconnaissance vocale entièrement personnalisé par l’équipe Euphonia de Google, Andrea peut aujourd’hui prononcer des commandes vocales à son Assistant Google, et être comprise.