Baidu a un nouveau système de réseau neuronal qui est étonnamment bon pour le clonage des voix.

Pour recréer une voix, l’AI a généralement besoin d’écouter des heures d’enregistrements de quelqu’un qui parle. Mais comme le rapporte the New Scientist, un nouveau processus pourrait réduire ce délai à une minute. Les chercheurs de Baidu ont dévoilé une version améliorée de Deep Voice, leur système de synthèse vocale texte-à-voix, qui peut désormais, une fois formé, cloner n’importe quelle voix après avoir écouté quelques extraits audio.

En détails: plus il y a d’échantillons que Deep Voice entend, meilleurs sont les résultats, mais seulement 10 échantillons de moins de cinq secondes chacun ont été suffisants pour produire une voix synthétique qui pourrait tromper un système de reconnaissance vocale plus de 95% du temps. Baidu a hébergé quelques uns des échantillons de clonage vocal ici pour que n’importe qui puisse écouter.

Bien sûr, il y a un inconvénient: une technologie comme celle-ci pourrait sérieusement compromettre la sécurité biométrique qui utilise la voix de quelqu’un comme élément de sécurité. Les gens sont déjà tombés amoureux des courriels de leurs amis, alors que se passe-t-il si on faisait croire que notre soeur appelle et nous demande de l’argent?

Publicités

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.