Afin d'obtenir plus rapidement des réponses avec le dernier modèle Claude Opus 4.6, Anthropic sort un Fast Mode accessible via la commande /fast dans l'interface de Claude Code. Il s'agit d'une configuration d'API spécifique qui privilégie la vitesse, tout en maintenant une qualité de réponse identique. Elle promet des réponses jusqu'à 2,5 fois plus rapides.

Quel est le coût de cette vitesse accrue ?

La différence de prix est considérable. Alors que le mode standard de Claude Opus 4.6 est facturé 5 $ par million de tokens en entrée et 25 $ en sortie, le mode rapide fait grimper la facture à 30 $ en entrée et 150 $ en sortie.

Pour les fenêtres de contexte dépassant 200 000 tokens, les tarifs s'envolent à 60 $ en entrée et 225 $ en sortie. Une multiplication par six qui positionne de fait l'option comme un outil premium .

À noter que pour adoucir la note, Anthropic propose une offre de lancement avec une réduction de 50 %, sachant par ailleurs que le statut du Fast Mode est en research preview.

À qui s'adresse ce mode rapide ?

Anthropic destine le Fast Mode à des cas d'usage bien précis où la latence est un facteur critique. Pour les tâches de fond plus longues, le mode standard reste la solution la plus économique et recommandée.

Le mode rapide n'est pas disponible sur les plateformes cloud tierces comme Amazon Bedrock, Google Vertex AI ou Microsoft Azure Foundry. Son accès est pour le moment limité à l'API Anthropic Console et aux abonnements Claude avec l'activation de l'usage supplémentaire.

Un déploiement en preview concerne aussi Claude Opus 4.6 pour GitHub Copilot (abonnements Copilot Pro+ et Enterprise).