L'agent ChatGPT prend les commandes et travaille pour vous

OpenAI vient de frapper un grand coup en dévoilant ChatGPT Agent. Oubliez le chatbot qui répond simplement à vos questions. C'est un véritable assistant proactif, capable de prendre les commandes d'un ordinateur virtuel pour exécuter des missions complexes de A à Z.

Demandez-lui de réserver un voyage, de remplir une série de formulaires, de faire vos courses en ligne ou de monter un diaporama, et il s'exécute. C'est une avancée majeure qui fusionne plusieurs technologies pour transformer une simple conversation en actions concrètes.

Un assistant qui agit à votre place

Le secret de cet assistant ChatGPT réside dans la fusion des capacités de deux outils précédents d'OpenAI : Operator pour cliquer et naviguer sur le Web, et Deep Research pour la synthèse d'information.

En les combinant et en y ajoutant de nouveaux outils comme un terminal ou un accès direct à des API, ChatGPT Agent devient un couteau suisse. Il peut consulter votre agenda via un connecteur, chercher des restaurants, puis réserver une table. Il peut aussi analyser des données financières dans un tableur et conserver la mise en forme.

Le système opère depuis son propre ordinateur isolé, ce qui signifie qu'il ne touche pas directement à votre appareil personnel. Vous suivez ses actions dans une fenêtre dédiée et gardez le contrôle total. Il est possible de l'interrompre à tout moment, de prendre la main sur son navigateur ou de stopper la tâche. Pour les actions importantes comme un achat, il demandera toujours votre permission.

Des capacités bluffantes, mais à tempérer

Sur le papier, les performances sont impressionnantes. L'agent ChatGPT établit des performances de pointe sur plusieurs benchmarks de référence, que ce soit pour répondre à des questions de niveau expert ou pour résoudre des problèmes mathématiques complexes. Sur un test évaluant des tâches de science des données (DSBench), ses résultats dépassent même significativement ceux des humains.

Pourtant, il ne faut pas s'attendre à une intelligence artificielle omnipotente. L'outil peut être parfois lent pour une tâche (entre 5 et 30 minutes selon la complexité), même s'il y aura un gain de temps indéniable par rapport au temps qu'il faudrait à un humain pour l'effectuer lui-même.

La création de présentations, par exemple, est encore en version bêta et OpenAI souligne que le résultat peut sembler rudimentaire dans certains cas. De même, face à des problèmes totalement nouveaux et en plusieurs étapes, l'agent ChatGPT peut échouer dans sa mission.

La sécurité, un défi majeur pour cet agent IA

Donner à une IA la capacité d'agir sur le Web introduit forcément de nouveaux risques. Le plus grand danger est celui de l'injection de prompt. Imaginez que l'agent consulte une page web pour votre compte. Un code malveillant caché sur cette page pourrait lui donner des ordres à votre insu, comme récupérer des données sensibles dans vos e-mails et les envoyer à un attaquant.

Pour parer à cette menace, OpenAI a mis en place de multiples garde-fous. ChatGPT Agent est entraîné à repérer et résister à ces manipulations. Un mode de surveillance spécial, le « Watch Mode », s'active pour les tâches sensibles comme l'envoi d'e-mails, exigeant votre supervision active.

De plus, l'outil est conçu pour refuser catégoriquement les tâches à haut risque, comme les transferts bancaires. OpenAI a même activé son plus haut niveau de protection contre les risques biologiques et chimiques, par pure précaution.

Pour les utilisateurs payants de ChatGPT

ChatGPT Agent est en cours de déploiement pour les abonnés Pro, Plus et Team de ChatGPT. Les utilisateurs Pro bénéficient de 400 messages par mois.

Pour l'instant, l'Espace économique européen et la Suisse ne sont pas concernés par le lancement, mais une disponibilité est attendue prochainement. « Nous finalisons actuellement la date de lancement de l'agent ChatGPT en France », indique OpenAI. Une date doit être révélée dans quelques jours.