OpenAI a annoncé qu'un de ses modèles d'IA expérimentaux a atteint un niveau de performance équivalent à une médaille d'or aux Olympiades Internationales de Mathématiques (IMO), l'une des compétitions les plus prestigieuses du genre.

Une performance qui semblait encore du domaine du rêve il y a quelques mois à peine et qui montre une accélération fulgurante des capacités de l'intelligence artificielle.

Un exploit qui défie les pronostics

Dans les mêmes conditions qu'un candidat humain avec deux sessions d'examen de 4,5 heures, sans accès à internet ou à des outils, le modèle d'OpenAI a résolu correctement 5 des 6 problèmes de l'édition 2025. En lisant les énoncés officiels des problèmes et en écrivant des preuves en langage naturel, il a obtenu 35 points sur 42. Un score qui lui aurait confortablement valu une médaille d'or.

Pour mettre les choses en perspective, les IMO, créées en 1959, sont réputées pour leurs problèmes particulièrement complexes qui exigent non seulement une technique impeccable, mais aussi une grande créativité. Pour l'édition 2025, seulement 67 des 630 meilleurs étudiants du monde ont décroché la médaille d'or.

L'exploit a pris de court toute la communauté, y compris les experts les plus éminents. En juin dernier, le mathématicien et lauréat de la médaille Fields, Terence Tao, prédisait qu'une IA ne parviendrait pas à un tel niveau de sitôt. L'annonce d'OpenAI vient bouleverser ces prévisions, marquant potentiellement un jalon majeur pour l'intelligence artificielle.

openai-modele-experimental-equivalent-or-imo Source image : OpenAI

Plus qu'une calculatrice, une IA qui raisonne

La vraie révolution ne se trouve pas seulement dans le score, mais dans la manière dont il a été obtenu. Contrairement à des systèmes spécialisés comme AlphaGeometry de DeepMind, le modèle d'OpenAI est une IA généraliste.

Patron d'OpenAI, Sam Altman insiste sur ce point : « Il s'agit d'un LLM (ndlr : grand modèle de langage) qui fait des mathématiques et non d'un système mathématique formel spécifique. Cela fait partie de notre effort principal vers l'intelligence générale. »

Cette IA ne se contente pas de calculer, elle pense et longtemps. D'après les chercheurs, le modèle peut réfléchir pendant des heures sur un problème, une endurance mentale totalement nouvelle. « Les problèmes des IMO exigent un nouveau niveau de pensée créative soutenue par rapport aux précédents benchmarks », souligne Alexander Wei d'OpenAI.

Tout repose sur une avancée majeure en apprentissage par renforcement qui permet à l'IA de construire des preuves complexes et des arguments solides en langage naturel, comme le ferait un mathématicien humain.

imo-2025-premier-probleme

Et maintenant ? Ce que cet exploit signifie pour l'avenir

Alors, à quand cette technologie pour le grand public ? Pas tout de suite. OpenAI a précisé que son modèle de raisonnement est une version de recherche expérimentale. Il ne faut pas s'attendre à voir ce niveau de compétence en mathématiques dans une version publique avant de nombreux mois, et ce ne sera donc pas intégré dans le futur GPT-5.

Cela donne en tout cas une idée de la vitesse à laquelle la frontière de l'IA recule. Il y a à peine un an, les laboratoires testaient leurs modèles sur des problèmes de niveau collège.

Bien que la performance soit saluée, même par des critiques comme Gary Marcus, des questions demeurent. Ce dernier s'interroge sur les données d'entraînement, la portée réelle de cette intelligence générale et l'absence de vérification indépendante par le comité des IMO.

Pour OpenAI, le chercheur Jerry Tworek indique que le modèle avait reçu très peu de travail spécifique à l'IMO. Une publication du modèle serait envisageable d'ici la fin de cette année. Les preuves produites par le modèle sont partagées sur GitHub.