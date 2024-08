Durant l'événement Google I/O du mois de mai, la firme de Mountain View avait fait forte impression avec la démonstration du Project Astra, une interface permettant d'interagir avec l'intelligence artificielle Gemini sous la forme d'une simple conversation, l'utilisateur posant des questions et l'IA lui répondant en conséquence.

Cette initiative trouve une concrétisation avec la présentation de Gemini Live, une interface qui ajoute à l'application Gemini sur Android la possibilité de converser avec l'IA directement depuis son smartphone.

L'annonce a été réalisée durant la conférence Made by Google et elle prépare une nouvelle façon de communiquer avec l'intelligence artificielle selon des modalités simplifiées.

Gemini Live, l'IA à portée de voix sur smartphone

Plus besoin de rédiger des prompts, il suffit ici de poser une question comme on s'adresserait à un interlocuteur et l'IA répond de la même manière et en temps réel au fil d'une conversation.

On peut ainsi interrompre l'IA dans sa réponse et lui poser de nouvelles questions pour l'orienter plus précisément vers un sujet, comme on pourrait le faire avec une personne.

Cela fonctionne également avec ce que voit la caméra du smartphone, donnant à l'IA un vaste champ d'interprétation sans même avoir à besoin de lui décrire un objet ou une scène.

Gemini Live sera également intégré à certaines applications de Google comme Messages ou Google Agenda, ce qui permettra de caler un rendez-vous ou de rédiger une réponse simplement en l'énonçant.

Gemini Live répond à GPT-4o

Ce nouveau mode d'interaction est pour le moment réservé aux utilisateurs de Gemini Advanced et la conversation ne se fait qu'en anglais (avec 10 voix à disposition) mais Google indique que de nouvelles langues seront supportées prochainement. Les utilisateurs de l'application Gemini sur iOS ne seront pas oubliés mais il faudra patienter quelques semaines avant de voir débarquer ce mode conversationnel.

Google offre ainsi une réponse à OpenAI et son IA GPT-4o dont le mode d'interaction permet lui aussi de converser et de montrer des images ou des vidéos à l'intelligence artificielle pour en extraire des informations.