La plate-forme de vidéos en ligne YouTube annonce le milliard de vidéos avec des sous-titres automatiques. De telles vidéos sont visionnées plus de 15 millions de fois par jour. Une dizaine de langues sont prises en charge : allemand, anglais, coréen, espagnol, français, italien, japonais, néerlandais, portugais et russe.

Les sous-titres sont apparus sur YouTube dès 2006. Cette fonctionnalité a bénéficie d'un certain niveau d'automatisation à partir de 2009. Des sous-titres automatiques qui n'ont pas encore atteint la perfection et sont parfois sujets à des incohérences. D'autant plus en y ajoutant des aléas de traduction en plus de la seule transcription.

YouTube affirme qu'en ce qui concerne les sous-titres automatiques en anglais, la justesse a pu être améliorée de 50 % au fil des ans. Cette optimisation a été enregistrée grâce à une évolution de la reconnaissance automatique de la parole, un affinement des algorithmes d'apprentissage automatique ou statistique, et un élargissement du jeu de données d'entraînement pour améliorer ce machine learning.

YouTube-sous-titres-automatiques-2009

La tâche est évidemment complexe dans la mesure où sur YouTube, le contenu proposé est riche d'une très grande diversité, sans compter la qualité audio qui peut faire obstacle à une bonne reconnaissance automatique de la parole. Cette dernière s'appuie sur une composante acoustique pour les sons de base dans une langue parlée, une analyse lexicale comme avec la prononciation des mots, et un modèle statistique de toutes les phrases pouvant être prononcées dans une langue.

Le cas échéant, les sous-titres automatiques peuvent être vérifiés et modifiés - voire annulés - par les créateurs de contenus.