OpenAI présente Voice Engine, une IA capable d’imiter les voix à partir de 15 secondes d’enregistrement

Date:

La célèbre entreprise OpenAI a récemment dévoilé le Voice Engine, une intelligence artificielle (IA) étonnante capable de reproduire des voix humaines avec réalisme et précision en se basant sur seulement 15 secondes d’échantillon audio. Bien que cette technologie puisse avoir d’importantes applications positives, elle soulève également des préoccupations quant à son potentiel usage abusif.

Un nouvel outil de synthèse vocale révolutionnaire

Le Voice Engine a été conçu pour offrir un rendu vocal très réaliste en s’appuyant sur un texte fourni et un court extrait audio de la voix à imiter. Dans certains cas, cette technologie pourrait être utilisée pour rendre plus accessible l’apprentissage de la lecture aux enfants ou à fournir une assistance linguistique, comme dans l’exemple cité par Age of Learning, une entreprise d’éducation qui a eu recours au Voice Engine pour générer des voix off scénarisées.

Potentiels usages bienveillants

Outre ses possibilités d’enseignement, le Voice Engine est également capable de produire des traductions fluides et naturelles en conservant la tonalité et l’accent du locuteur original, ce qu’ils ont présenté avec l’application de narration visuelle HeyGen développée par AI. De plus, il a permis à une jeune femme ayant perdu l’usage de sa parole à cause d’une tumeur cérébrale de retrouver « sa voix » en l’entraînant sur une courte séquence audio prélevée d’un ancien enregistrement.

Des questions éthiques et sécuritaires

Cependant, malgré ces applications prometteuses, OpenAI se montre particulièrement prudent quant à la démocratisation de cette technologie de clonage vocal, mettant en lumière les risques associés à son utilisation abusive. Dans un autre contexte, ils ont souligné la nécessité de commencer à construire une « résilience sociétale » contre les défis posés par ces technologies :

  • Possibilité d’imposture et d’usurpation d’identité
  • Diffusion de fausses informations
  • Création de deepfakes audios convaincants

Mesures de protection mises en place

Pour assurer le bon usage du Voice Engine, OpenAI a institué plusieurs mesures de sécurité, notamment :

  • L’exigence d’un consentement explicite et éclairé des personnes dont la voix est copiée
  • La transparence pour les auditeurs, qui doivent savoir clairement que les voix qu’ils entendent sont générées par IA
  • Le marquage numérique (watermarking) pour faciliter la traçabilité des sons générés par Voice Engine
  • Un contrôle proactif de l’utilisation de l’outil et une collaboration étroite avec des partenaires issus de divers secteurs, tels que les médias, le gouvernement ou l’éducation

Les autres innovations d’OpenAI : GPT-4 et ChatGPT

Voice Engine n’est pas la seule avancée technologique notable d’OpenAI. En effet, ils ont également développé GPT-4, un modèle linguistique impressionnant au cœur du chatbot ChatGPT. Ce dernier est capable de décoder et de comprendre les requêtes des utilisateurs grâce à des technologies de deep learning, générant ainsi des réponses pertinentes et adaptées qui assurent une interaction fluide et optimisée.

ChatGPT pourra-t-il intégrer Voice Engine ?

Bien que rien n’ait été confirmé, il est possible d’envisager une future intégration de Voice Engine à ChatGPT, permettant ainsi aux utilisateurs de profiter d’une expérience conversationnelle totalement immersive et personnalisée. Toutefois, compte tenu des préoccupations éthiques entourant la technologie de clonage vocal, cette éventualité reste incertaine.

Le secteur de l’intelligence artificielle ne cesse d’évoluer, offrant toujours plus de possibilités et d’innovations. OpenAI est en première ligne de ce progrès avec son nouvel outil Voice Engine, redéfinissant le paysage de la synthèse vocale par IA. Bien que les améliorations apportées à cette technologie soient prometteuses, elles soulèvent également des questions éthiques importantes qui nécessitent une attention sérieuse avant de généraliser leur usage.

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

A lire également

Boston Dynamics dévoile son nouvel Atlas, un robot humanoïde plus performant

La société américaine Boston Dynamics a récemment présenté un nouveau modèle de son robot humanoïde Atlas, aux mouvements...

Orange dévoile son nouveau décodeur TV 6 : caractéristiques et prix

Le nouveau décodeur TV d'Orange est enfin là. Après des années d'attente, l'opérateur a officiellement présenté son dernier...

WhatsApp : Comment épingler plusieurs messages sur une seule conversation ?

WhatsApp continue de travailler sur l'amélioration de son application en proposant de nouvelles fonctionnalités. En plus de la...

Google étend les tests de l’IA générative dans les résultats de recherche

Les capacités de recherche assistées par l'intelligence artificielle (IA) de Google deviennent accessibles à davantage d'utilisateurs. En effet,...