Au sein de son outil Codex, OpenAI présente son nouveau modèle de codage agentique, GPT-5.1-Codex-Max. Disponible pour les abonnés ChatGPT Plus, Pro, Business, Edu et Enterprise, ce modèle fait suite à GPT-5.1-Codex pour les tâches de programmation assistée par agent.

Une version qui surmonte de précédentes limites

Le principal obstacle pour les IA de codage est la fenêtre de contexte, soit la quantité d'informations qu'un modèle peut gérer simultanément. Une fois cette limite atteinte, l'IA perd le fil.

GPT-5.1-Codex-Max résout ce problème avec un processus nommé compaction. Cette technique permet au modèle de compresser son historique de travail, tout en préservant les éléments essentiels, lui offrant une fenêtre de contexte quasi illimitée pour une tâche donnée.

OpenAI affirme que le modèle peut ainsi travailler de manière cohérente sur des millions de tokens dans une seule tâche. En interne, des tests ont montré que le modèle pouvait travailler sur un projet pendant plus de 24 heures sans interruption.

Des gains en performance et en coût

Sur le benchmark SWE-Bench Verified, GPT-5.1-Codex-Max atteint des performances supérieures à son prédécesseur, et en utilisant environ 30 % de tokens de réflexion en moins.

Cette optimisation se traduit par des gains de vitesse sur des tâches de codage. En conséquence, ce sont des coûts réduits pour les développeurs et un temps d'attente moindre.

De plus, le modèle produit souvent un code plus concis. Dans un exemple fourni par OpenAI, il a généré 707 lignes de code là où l'ancienne version en nécessitait 864. Une amélioration qui permettra de faciliter la maintenance du code.

D'autres évolutions notables

Une avancée est la compatibilité native avec Windows. OpenAI précise qu'il s'agit du " premier modèle que nous avons entraîné pour fonctionner efficacement dans les environnements Windows ". De quoi le rendre plus pertinent pour une large base de développeurs.

En matière de cybersécurité, Codex opère par défaut dans un environnement de sandbox. OpenAI insiste par ailleurs sur le fait que l'outil ne doit pas être considéré comme un remplacement des humains pour les révisions de code.