Un modèle d'IA conçu pour aborder des problèmes de plus en plus complexes en raisonnant avant de répondre, ce qui améliore la performance et la précision. Google annonce les modèles Gemini 2.5 avec comme premier représentant Gemini 2.5 Pro (Experimental).

Foi de benchmarks pour Gemini 2.5 Pro

Les benchmarks sont inévitablement de sortie afin de mettre en avant la supériorité globale de Gemini 2.5 Pro par rapport à o3-mini et GPT-4.5 d'OpenAI, ou encore Claude 3.7 Sonnet d'Anthropic, Grok 3 Beta (xAI) et DeepSeek R1.

Patron de Google DeepMind, Demis Hassabis vante Gemini 2.5 Pro comme un « modèle de pointe impressionnant » et souligne sa première place sur la plateforme Chatbot Arena en tant que LLM, avec une confortable avance basée sur le système de classement Elo.

La préférence exprimée par les utilisateurs conserve une certaine part de subjectivité, mais les améliorations sont jugées significatives pour l'ensemble des domaines du raisonnement multimodal, le codage, les mathématiques et les sciences.

Le codage à l'honneur avec Gemini 2.5 Pro

« Nous avons mis l'accent sur les performances de codage, et avec Gemini 2.5, nous avons réalisé un grand bond par rapport à Gemini 2.0, avec d'autres améliorations à venir. » Google ajoute que Gemini 2.5 Pro excelle dans la création d'applications web et avec des capacités d'agent IA.

Gemini 2.5 Pro dispose d'une fenêtre contextuelle de 1 million de tokens et il est prévu une extension à 2 millions de tokens. De quoi lui permettre de comprendre de vastes ensembles de données et de traiter des problèmes complexes à partir de diverses sources (texte, images, audio, vidéo, dépôts de code).

Le modèle Gemini 2.5 Pro Experimental est disponible dans Google AI Studio et dans l'application Gemini pour les abonnés Gemini Advanced. Une disponibilité sur Vertex AI interviendra au cours des prochaines semaines.

Du raisonnement natif pour tous les modèles

« À l'avenir, nous intégrerons les capacités de raisonnement directement dans tous nos modèles, afin qu'ils puissent traiter des problèmes plus complexes et prendre en charge des agents encore plus performants et conscients du contexte », précise Google. Manifestement, Gemini 2.0 Flash Thinking n'était qu'un galop d'essai.