C'est une première pour OpenAI depuis 2019 et la publication de GPT-2. Autant dire une éternité en la matière. Après une longue absence sur ce terrain et un report de dernière minute pour effectuer davantage de tests de sécurité, le créateur de ChatGPT lance deux nouveaux modèles open-weight (poids ouverts).

Il s'agit des modèles de raisonnement gpt‑oss‑120b et gpt‑oss‑20b sous licence Apache 2.0 pour lesquels les fichiers contenant les paramètres appris pendant l'entraînement sont librement à disposition.

Mieux que o4-mini et o3-mini

La version 120b (120 milliards de paramètres) de gpt-oss rivalise avec le modèle propriétaire o4-mini d'OpenAI, affichant des résultats impressionnants sur des tâches de raisonnement, de codage et même sur des domaines complexes comme la santé ou les mathématiques de compétition. Plus compacte, la version 20b de gpt-oss fait jeu égal, voire dépasse les performances d'o3-mini.

OpenAI met en avant une architecture de type Mixture-of-Experts (MoE) qui réduit le nombre de paramètres actifs, rendant ces modèles open-weight beaucoup plus agiles. Une architecture MoE n'est pas une surprise et devient la norme. Son rôle est d'améliorer l'efficacité pour l'entraînement et l'inférence en déléguant les tâches de traitement de données à des modèles experts plus petits et spécialisés.

Les modèles intègrent des capacités avancées d'utilisation d'outils, comme la recherche web ou l'exécution de code, et permettent d'ajuster l'effort de raisonnement pour trouver l'équilibre entre vitesse et performance. En soulignant toutefois que les modèles ne sont pas proposés dans ChatGPT ou via l'API d'OpenAI.

Une IA accessible, même sur votre ordinateur portable

L'un des plus gros atouts de cette annonce est la possibilité de télécharger gratuitement les modèles et de les faire tourner sur sa propre infrastructure.

gpt-oss-20b peut fonctionner avec seulement 16 Go de mémoire vive, ce qui le rend compatible avec de nombreux ordinateurs portables. Plus gourmand en ressources, gpt-oss-120b nécessite une machine dotée de 80 Go de mémoire, comme celles équipées d'un GPU spécialisé.

Cette flexibilité répond à une demande forte des entreprises et des développeurs soucieux de la confidentialité de leurs données ou désireux de personnaliser finement une IA pour leurs besoins spécifiques. Ils avaient ainsi tendance à aller voir ailleurs.

Sécurité et géopolitique : les vrais enjeux ?

Face aux craintes que suscite la diffusion de tels modèles, OpenAI assure avoir mis le paquet sur la sécurité. Les modèles ont été testés dans des scénarios extrêmes, où des versions ont été délibérément modifiées pour des usages malveillants. Même dans ces conditions, l'IA n'aurait jamais atteint un niveau de dangerosité élevé.

La démarche d'OpenAI s'inscrit également dans un contexte géopolitique tendu, où les modèles open source chinois gagnent en popularité. « Le large accès à nos modèles open-weight performants créés aux États-Unis contribue à étendre les rails démocratiques de l'IA », écrit avec emphase OpenAI.

Pour stimuler la recherche sur la sécurité et mettre au jour des failles inédites, un concours doté d'un demi-milliard de dollars est en outre lancé. Les modèles gpt-oss peuvent être testés ici.