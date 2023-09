OpenAI vient d'annoncer une évolution de taille pour ChatGPT, à savoir la vision et la parole. L'agent conversationnel d'IA générative pourra ainsi analyser et interpréter des images sur l'ensemble des plateformes, et il sera également capable de discuter oralement sur mobile.

En marge de cette annonce qui s'adresse d'abord à la version payante de ChatGPT (ChatGPT Plus) et dans le cadre de ChatGPT Enterprise pour les entreprises, OpenAI a glissé que Spotify utilise sa nouvelle technologie vocale pour une fonctionnalité Voice Translation.

Voice Translation doit permettre de traduire automatiquement des podcasts dans plusieurs langues, tout en conservant les voix des créateurs des podcasts. Une manière d'étendre rapidement une audience.

Au-delà du doublage traditionnel

La plateforme de streaming audio Spotify évoque une fonctionnalité révolutionnaire. Elle fait pour le moment l'objet d'un programme pilote. Une sélection de podcasts enregistrés en anglais sont disponibles en espagnol. Le français et l'allemand suivront dans les jours et les semaines à venir.

" Cet outil développé par Spotify s'appuie sur les dernières innovations, dont la toute nouvelle technologie de génération de voix d'OpenAI, pour reproduire le style de l'orateur d'origine, offrant ainsi une expérience d'écoute plus authentique, plus personnelle et plus naturelle que le doublage traditionnel ", écrit Spotify.

Le système de reconnaissance vocale Whisper d'OpenAI est à la manœuvre pour une transcription et une traduction. Une valeur ajoutée est une synthèse vocale avec la voix du podcasteur. Les podcasts traduits par une IA concernent les abonnés payants (Premium) et gratuits (Free) de Spotify.

De nouveaux risques en perspective

Via son annonce pour ChatGPT, OpenAI a mis en avant une technologie d'IA capable de créer des voix synthétiques réalistes à partir d'un simple texte et de quelques secondes d'échantillon de parole.

Elle est utilisée pour le cas spécifique des discussions vocales et par le biais d'une collaboration directe avec différents acteurs, comme Spotify.

" Cette capacité présente de nouveaux risques, tels que la possibilité pour des acteurs malveillants d'usurper l'identité de personnalités publiques ou de commettre des fraudes ", souligne OpenAI pour justifier une diffusion restreinte de son outil.