Sous le nom de o1, OpenAI dévoile une nouvelle série de modèles d'IA. Le créateur de ChatGPT annonce qu'ils sont capables de raisonner sur des tâches complexes et de résoudre des problèmes plus difficiles que les modèles précédents.

OpenAI évoque en particulier des capacités de raisonnement utiles dans le domaine des mathématiques, des sciences et du codage. Parmi des exemples cités, l'annotation des données de séquençage cellulaire, la génération de formules mathématiques pour l'optique quantique, la conception et l'exécution de workflows à plusieurs étapes pour les développeurs.

Une contrepartie est une certaine lenteur par rapport à d'autres modèles. Elle peut se traduire par plusieurs dizaines de secondes pour répondre à des questions, tandis que o1 détaille ensuite sa progression pour l'obtention d'une solution.

Une chaîne de pensée privée

" Nous avons entraîné ces modèles pour qu'ils passent plus de temps à réfléchir aux problèmes avant de répondre, comme le ferait une personne. Grâce à cet entraînement, ils apprennent à affiner leur processus de réflexion, à essayer différentes stratégies et à reconnaître leurs erreurs ", ose dire OpenAI avec peut-être un excès d'anthropomorphisme.

Chercheur chez OpenAI, Noam Brown explique autrement que o1 est entraîné avec apprentissage par renforcement à réfléchir avant de répondre via une chaîne de pensée privée. " Plus il réfléchit longtemps, meilleurs sont ses résultats dans les tâches de raisonnement. […] Nous ne sommes plus bloqués par le pré-entraînement. "

Le modèle o1 a obtenu un taux de réussite de 83 % à un examen qualificatif pour les Olympiades internationales de mathématiques concernant les élèves à la fin de leurs études secondaires (contre 13 % pour GPT-4o), tandis que ses compétences de codage le classent à un niveau de performance supérieur à celui de 89 % des participants aux concours CodeForces.

Pour une prochaine mise à jour, OpenAI fait également une comparaison avec un comportement similaire à celui de doctorants (physique, chimie et biologie).

Très onéreux avec l'API

Actuellement, OpenAI propose des modèles o1 en phase préliminaire. Les utilisateurs de ChatGPT Plus et Team ont un accès à o1-preview et o1-mini. Ce dernier est un modèle plus rapide pour répondre aux questions en sciences, technologie, ingénierie et mathématiques.

Les comptes ChatGPT Plus et Team bénéficient de 30 messages par semaine avec o1-preview et 50 messages par semaine avec o1-mini. La fenêtre de contexte est de 32 000 tokens. L'accès sera étendu la semaine prochaine à ChatGPT Enterprise et Edu. Pour o1-mini, il est aussi prévu à l'avenir un accès à tous les utilisateurs gratuits de ChatGPT.

openai-o1-preview-chatgpt

Dans l'API (Tier 5), o1-preview est particulièrement onéreux à raison de 15 $ par million de tokens d'entrée et 60 $ par million de tokens de sortie. Avec GPT-4o, c'est un prix de 5 $ par million de tokens d'entrée et 15 $ par million de tokens de sortie.

Pas toujours meilleur que GPT-4o

OpenAI précise qu'à ce stade, GPT-4o demeure la meilleure option pour la plupart de prompts. Contrairement à GPT-4o, les modèles o1-preview et o1 mini ne disposent pas pour l'instant de fonctionnalités comme la mémoire, l'analyse des données, les téléchargements de fichiers, la navigation sur le Web, la vision ou encore la voix.

Tout comme GPT-4o, la base de connaissances s'arrête à octobre 2023 pour o1-preview et o1-mini. Un point à souligner est que le problème des hallucinations de l'IA n'est pas résolu, même si " o1-preview hallucine moins souvent que GPT-4o, et o1-mini hallucine moins souvent que GPT-4o mini. "