OpenAI a officialisé la sortie de Sora 2, son nouveau modèle phare de génération de vidéo et d'audio, succédant à la première version de février 2024. Une surprise est le lancement simultané d'une application dite sociale sur iOS.

Pour l'instant sur invitation aux États-Unis et au Canada, cette plateforme s'inspire directement des flux de type TikTok et propose une fonctionnalité permettant aux utilisateurs de s'insérer dans des scènes générées par l'IA.

Un meilleur respect des lois de la physique

Sora 2 représente un saut qualitatif majeur, décrit par OpenAI comme le " moment GPT-3.5 pour la vidéo ". Le modèle se distingue par sa capacité à mieux respecter les lois de la physique.

Avec l'exemple d'un basketteur qui rate un tir, OpenAI souligne que les modèles précédents pouvaient téléporter spontanément un ballon dans le panier pour satisfaire une requête. Au contraire, Sora 2 modélise des échecs plus réalistes, comme un rebond sur le panneau.

Cette capacité à simuler l'échec est jugée " extrêmement importante " pour un simulateur de monde utile. Dans le même temps, OpenAI indique que Sora 2 excelle dans les style réaliste, cinématographique et animé en suivant des instructions complexes.

Une application sociale Sora

L'application Sora pour iPhone est conçue autour de la création collaborative et de la personnalisation. La fonctionnalité centrale " cameos " permet à un utilisateur, après une courte vérification vidéo et audio, d'injecter sa propre apparence et sa voix dans n'importe quelle scène générée.

Il est possible de donner l'autorisation à des amis d'utiliser un cameo dans leurs propres créations. " Nous pensons qu'une application sociale construite autour de cette fonctionnalité ' cameos ' est la meilleure façon de vivre la magie de Sora 2 ", écrit OpenAI.

L'interface propose un flux de vidéos personnalisable, des outils de remixage et le partage des créations. Les clips sont de 10 secondes en 9:16 avec audio synchronisé, à partir d'un simple texte ou d'une image. 

OpenAI tente de devancer les critiques

Pour anticiper des critiques, OpenAI affirme ne pas optimiser le temps passé dans le flux, mais plutôt " maximiser la création ". Des contrôles parentaux via ChatGPT sont intégrés pour limiter le défilement infini ou personnaliser l'algorithme.

Concernant l'utilisation des cameos, l'utilisateur garde le contrôle. Il peut révoquer les accès et supprimer toute vidéo contenant son image à tout moment.

En matière de monétisation, le modèle est pour l'instant gratuit, mais OpenAI envisage de " donner aux utilisateurs la possibilité de payer un certain montant pour générer une vidéo supplémentaire s'il y a trop de demande ".

Disponibilité de Sora 2

Si le déploiement de Sora 2 concerne d'abord les États-Unis et le Canada, OpenAI évoque son intention de l'étendre rapidement à d'autres pays. Après une invitation, pour l'application Sora sur iOS, c'est aussi l'accès à Sora 2 sur sora.com.

Via sora.com, les abonnés ChatGPT Pro pourront utiliser un modèle expérimental Sora 2 Pro pour une qualité accrue. Ultérieurement, Sora 2 sera disponible via l'API.