Anthropic annonce une nouvelle version du Claude Opus 4. Une mouture 4.1 en guise de mise à jour qui s'adresse aux utilisateurs payants de Claude et dans Claude Code.

La disponibilité concerne également l'API, Amazon Bedrock et Vertex AI de Google Cloud, sans évolution tarifaire par rapport à Claude Opus 4.

Une performance qui surpasse la concurrence

D'après les chiffres publiés par Anthropic, Claude Opus 4.1 atteint un score de 74,5 % sur le benchmark SWE-bench Verified. Il met en valeur la capacité des IA à résoudre des problèmes concrets d'ingénierie logicielle.

Avec ce résultat, Claude Opus 4.1 distance ses principaux concurrents. Le modèle o3 d'OpenAI est à 69,1 %, tandis que Gemini 2.5 Pro de Google atteint 67,2 %.

anthropic-claude-opus-benchmarks

La position de leader d'Anthropic dans l'assistance au codage est ainsi solidement affirmée, du moins pour l'instant, sachant que Claude Opus 4 était à 72,5 % (et 72,7 % pour Claude Sonnet 4).

Plus qu'un simple codeur, un collaborateur virtuel

Au-delà des scores bruts, Claude Opus 4.1 n'est pas seulement un outil pour écrire du code. Il est aussi conçu pour fonctionner tel un véritable collaborateur virtuel. Le modèle peut planifier et exécuter de manière autonome des tâches de développement complexes, s'adapter au style du développeur.

Dans son annonce, Anthropic souligne que des partenaires comme GitHub ou Rakuten Group notent une grande précision de Claude Opus 4.1 pour corriger des bugs dans de vastes bases de code et sans introduire de nouvelles erreurs.

Un coup de pression avant GPT-5 ?

Le timing de cette sortie interroge. L'arrivée imminente de GPT-5 d'OpenAI semble quelque peu avoir précipité la sortie de Claude Opus 4.1, et simplement pour prendre les devants.

Il se murmure que GPT-5 surpasserait Claude Sonnet 4 sur le benchmark SWE-bench Verified. Et comme Claude Opus 4.1 fait désormais mieux que Claude Sonnet 4...