YouTube : un outil d'IA pour le doublage des vidéos

Patron de YouTube depuis le mois de février dernier, Neal Mohan avait mis en avant l'intelligence artificielle lors de sa prise de fonction. Avec des outils d'IA, il considère que les créateurs seront en mesure de " réinventer la vidéo. "

L'IA pourra également servir aux vidéastes afin d'étendre leur audience, notamment pour toucher un nouveau public, indépendamment de la langue dans les vidéos. À ce titre, YouTube évalue un outil d'IA visant à faciliter le doublage des vidéos dans d'autres langues.

Pour le moment, cet outil est testé auprès de centaines de créateurs et ne prend en charge qu'une poignée de langues. Des vidéos en anglais peuvent être doublées en espagnol et en portugais, mais d'autres langues seront prochainement ajoutées.

Avec un service Aloud

L'outil en question n'est pas un produit YouTube. C'est un service dénommé Aloud qui a été développé par Area 120, l'incubateur interne de Google pour de nouveaux produits et services qui sont voués à évoluer… ou abandonnés en cours de route.

Sous l'égide d'Area 120, le projet expérimental Aloud a été introduit l'année dernière. Ses cofondateurs expliquent que le doublage peut se faire en seulement quelques minutes et gratuitement pour le créateur.

" Nous utilisons les avancées en matière de séparation audio, de traduction automatique et de synthèse vocale pour réduire les étapes chronophages et coûteuses telles que la traduction, le montage vidéo et la production audio. "

Aloud ne crée par nouveau contenu

Pour un doublage avec Aloud, le vidéaste doit fournir la vidéo et les sous-titres de la langue d'origine. Le cas échéant, ces derniers peuvent être obtenus avec une transcription textuelle qui est générée. Le créateur contrôle le doublage en modifiant la transcription et la traduction.

Un exemple avec un doublage en espagnol à choisir dans les paramètres

Un travail est mené pour être en adéquation avec la possibilité pour les créateurs de vidéos YouTube d'ajouter plusieurs pistes audio.

À The Verge, Amjad Hanif, vice-président des produits pour les créateurs chez YouTube, précise qu'il est prévu à l'horizon 2024 de faire en sorte que les pistes audio traduites ressemblent à la voix du créateur, avec davantage d'expression et une synchronisation labiale.

Source : The Verge