Développé par Google DeepMind et dévoilé lors de l'édition 2024 de la conférence Google I/O, Veo est le modèle de génération vidéo le plus abouti de Google. À partir d'instructions textuelles ou d'images, il permet de générer des vidéos 1080p dans des styles dits cinématographiques et visuels.

Lors de la présentation de Veo, Google avait mis en avant une compréhension avancée du langage naturel et de termes cinématographiques, ainsi que la création de vidéos pouvant dépasser une minute. L'intégration de Veo pour YouTube Shorts et les créateurs est notamment prévue.

Dans l'immédiat, Google Cloud annonce une disponibilité en avant-première de Veo pour les clients de Vertex AI. " Veo sur Vertex AI crée des séquences cohérentes et homogènes, de sorte que les personnes, les animaux et les objets se déplacent de manière réaliste tout au long des prises de vue. "

Disponibilité générale pour Imagen 3

En plus de Veo, la dernière version du modèle texte-image Imagen 3 - déjà connu avec Gemini - pour la création d'images photoréalistes et réalistes sera disponible pour tous les clients Google Cloud via la plateforme Vertex AI à partir de la semaine prochaine.

Tant pour Veo que pour Imagen 3, toutes les créations intègrent la technologie SynthID de DeepMind. Un filigrane (watermark) pour signaler une génération par l'IA.

" Les clients de Google utilisent ces modèles de génération de médias pour créer sans effort des vidéos de haute qualité à partir d'un simple texte ou d'une image, transformant ainsi les idées en visuels dynamiques. " Google met en avant un gain de temps et une réduction des coûts.

Un exemple est une vidéo promotionnelle de la marque Agoda avec Veo sur Vertex AI :