Google déploie Veo 3.1, une mise à niveau de son modèle d'IA spécialisé dans la création de vidéos. Cette itération, qui succède à Veo 3 présenté lors de la dernière conférence Google I/O, est désormais le moteur de l'outil de création Flow et promet des avancées en matière de réalisme, de contrôle créatif, d'édition et d'intégration audio.

Les principales nouveautés apportées par Veo 3.1

La mise à jour se concentre sur plusieurs axes. D'abord, Veo 3.1 offre une meilleure fidélité aux prompts, ce qui signifie que l'IA interprète avec plus de précision les instructions textuelles et visuelles des utilisateurs.

Le changement le plus notable est l'arrivée de l'audio généré dans des fonctionnalités déjà existantes.

Cela concerne " Ingredients to Video " qui crée une scène à partir de plusieurs images de référence, " Frames to Video " qui génère une transition fluide entre une image de début et de fin, et " Extend " pour prolonger une séquence existante.

Une transformation du processus de création vidéo

Les nouvelles capacités offrent un contrôle granulaire aux créateurs. L'outil Flow, propulsé par Veo 3.1, permet désormais d'éditer les scènes avec une grande précision.

La fonctionnalité " Insert " autorise l'ajout de n'importe quel élément dans une vidéo, en gérant de manière réaliste les ombres et l'éclairage.

Prochainement, une fonction de suppression permettra de retirer des objets ou des personnages d'une scène, l'IA se chargeant de reconstruire l'arrière-plan et les environs, " comme si l'élément n'avait jamais été là ".

L'accès à la technologie Veo 3.1

Le modèle Veo 3.1 est disponible pour les développeurs via l'API Gemini et pour les clients professionnels sur Vertex AI. Il est également intégré dans l'application Gemini.

Google précise que le coût de Veo 3.1 reste identique à celui de Veo 3, tandis qu'une variante Fast permet de réduire les coûts et les temps de calcul.

Avec Veo 3.1, les vidéos générées avec audio natif sont de 8 secondes en 720p ou 1080p. Veo 3.1 peut produire des vidéos 16:9 en mode paysage et portrait.