Lors de l'édition 2024 de la conférence Google I/O, le patron du groupe Sundar Pichai avait déclaré vouloir aller plus loin avec les agents IA.
" Je les considère comme des systèmes intelligents, capables de raisonner, de planifier, de mémoriser, d'anticiper plusieurs étapes à l'avance et de travailler avec des logiciels et des systèmes, tout cela pour accomplir quelque chose en votre nom et, surtout, sous votre supervision. "
Sundar Pichai avait donné l'exemple d'un travail de concert entre l'IA Gemini et le navigateur Google Chrome pour l'automatisation de tâches à la suite d'un déménagement (chercher des services à proximité, mettre à jour une adresse sur des sites...).
Une concrétisation avec Jarvis
Selon The Information, Google travaille sur un produit au nom de code... Jarvis et une intelligence artificielle qui prend le contrôle du navigateur web d'une personne dans le but d'effectuer pour elle des tâches comme la recherche, l'achat ou la réservation d'un vol.
Cette automatisation de tâches du quotidien sur le Web s'appuierait sur la prise fréquente de captures de l'affichage à l'écran et leur interprétation par un modèle d'IA, afin de réaliser des actions telles que cliquer sur des boutons ou saisir du texte dans un champ.
Google pourrait présenter un aperçu de Jarvis dès le mois de décembre prochain. Cela coïnciderait avec une possible publication du modèle Gemini 2.0. Jarvis servirait alors de démonstration technologique des capacités sous la houlette de Gemini 2.0.
Pour répondre à Anthropic et d'autres
Rien d'officiel pour le moment. Reste que le produit au nom de code Jarvis ne serait pas surprenant compte tenu des précédentes déclarations de Sundar Pichai au sujet des agents IA.
Et maintenant qu'Anthropic vient de prendre la main avec le développement d'un modèle d'utilisation de l'ordinateur pour Claude 3.5 Sonnet, la tentation sera grande de vouloir rapidement occuper le terrain.