La célèbre entreprise OpenAI a récemment dévoilé le Voice Engine, une intelligence artificielle (IA) étonnante capable de reproduire des voix humaines avec réalisme et précision en se basant sur seulement 15 secondes d’échantillon audio. Bien que cette technologie puisse avoir d’importantes applications positives, elle soulève également des préoccupations quant à son potentiel usage abusif.
Un nouvel outil de synthèse vocale révolutionnaire
Le Voice Engine a été conçu pour offrir un rendu vocal très réaliste en s’appuyant sur un texte fourni et un court extrait audio de la voix à imiter. Dans certains cas, cette technologie pourrait être utilisée pour rendre plus accessible l’apprentissage de la lecture aux enfants ou à fournir une assistance linguistique, comme dans l’exemple cité par Age of Learning, une entreprise d’éducation qui a eu recours au Voice Engine pour générer des voix off scénarisées.
Potentiels usages bienveillants
Outre ses possibilités d’enseignement, le Voice Engine est également capable de produire des traductions fluides et naturelles en conservant la tonalité et l’accent du locuteur original, ce qu’ils ont présenté avec l’application de narration visuelle HeyGen développée par AI. De plus, il a permis à une jeune femme ayant perdu l’usage de sa parole à cause d’une tumeur cérébrale de retrouver « sa voix » en l’entraînant sur une courte séquence audio prélevée d’un ancien enregistrement.
Des questions éthiques et sécuritaires
Cependant, malgré ces applications prometteuses, OpenAI se montre particulièrement prudent quant à la démocratisation de cette technologie de clonage vocal, mettant en lumière les risques associés à son utilisation abusive. Dans un autre contexte, ils ont souligné la nécessité de commencer à construire une « résilience sociétale » contre les défis posés par ces technologies :
- Possibilité d’imposture et d’usurpation d’identité
- Diffusion de fausses informations
- Création de deepfakes audios convaincants
Mesures de protection mises en place
Pour assurer le bon usage du Voice Engine, OpenAI a institué plusieurs mesures de sécurité, notamment :
- L’exigence d’un consentement explicite et éclairé des personnes dont la voix est copiée
- La transparence pour les auditeurs, qui doivent savoir clairement que les voix qu’ils entendent sont générées par IA
- Le marquage numérique (watermarking) pour faciliter la traçabilité des sons générés par Voice Engine
- Un contrôle proactif de l’utilisation de l’outil et une collaboration étroite avec des partenaires issus de divers secteurs, tels que les médias, le gouvernement ou l’éducation
Les autres innovations d’OpenAI : GPT-4 et ChatGPT
Voice Engine n’est pas la seule avancée technologique notable d’OpenAI. En effet, ils ont également développé GPT-4, un modèle linguistique impressionnant au cœur du chatbot ChatGPT. Ce dernier est capable de décoder et de comprendre les requêtes des utilisateurs grâce à des technologies de deep learning, générant ainsi des réponses pertinentes et adaptées qui assurent une interaction fluide et optimisée.
ChatGPT pourra-t-il intégrer Voice Engine ?
Bien que rien n’ait été confirmé, il est possible d’envisager une future intégration de Voice Engine à ChatGPT, permettant ainsi aux utilisateurs de profiter d’une expérience conversationnelle totalement immersive et personnalisée. Toutefois, compte tenu des préoccupations éthiques entourant la technologie de clonage vocal, cette éventualité reste incertaine.
Le secteur de l’intelligence artificielle ne cesse d’évoluer, offrant toujours plus de possibilités et d’innovations. OpenAI est en première ligne de ce progrès avec son nouvel outil Voice Engine, redéfinissant le paysage de la synthèse vocale par IA. Bien que les améliorations apportées à cette technologie soient prometteuses, elles soulèvent également des questions éthiques importantes qui nécessitent une attention sérieuse avant de généraliser leur usage.