À peine quelques jours après l'annonce de Google DeepMind pour ses modèles d'IA légers et ouverts Gemma 3, Mistral AI introduit une riposte avec Mistral Small 3.1 qui est présenté comme le meilleur modèle de sa catégorie.
Sous licence Apache 2.0, ce nouveau modèle surpasse des modèles comparables tels que Gemma 3 et GPT-4o Mini d'OpenAI, et en offrant des vitesses d'inférence de 150 tokens par seconde. D'après les benchmarks publiés par Mistral AI, il est d'une grande efficacité avec 24 milliards de paramètres.
Par rapport à Mistral Small 3 sur lequel il s'appuie, Mistral Small 3.1 propose des performances textuelles améliorées, une compréhension multimodale et une fenêtre contextuelle de jusqu'à 128 000 tokens.
Des performances améliorées et une capacité multimodale
Pour les cas d'utilisation, la start-up française souligne un modèle polyvalent capable de gérer un large éventail de tâches d'IA générative, dont le suivi d'instructions, l'assistance conversationnelle rapide, la compréhension d'images et l'appel de fonctions.
Avec sa rapidité d'inférence qui est un atout, Mistral Small 3 est suffisamment petit pour fonctionner en local sur un seul GPU RTX 4090 ou un Mac disposant de 32 Go de RAM.
Mistral Small 3 peut servir de socle pour des applications d'IA d'entreprise et grand public comme la vérification de documents, les diagnostics, le traitement d'images sur l'appareil, l'inspection visuelle, la détection d'objets, le support client s'appuyant sur l'image et l'assistance généraliste.
Un modèle accessible et personnalisable pour tous
Pour Mistral Small 3.1 sous licence Apache 2.0, Mistral AI publie à la fois le modèle de base pré-entraîné et les points de contrôle (instruct checkpoints).
Cela permet à la communauté de le télécharger, de l'utiliser et de le personnaliser pour des domaines spécialisés grâce au fine-tuning. Du reste, Mistral AI encourage la création de modèles plus avancés basés sur Mistral Small 3.1.
Hormis le téléchargement sur Hugging Face, Mistral Small 3.1 est accessible via l'API sur La Plateforme de Mistral AI, ainsi que sur Google Cloud Vertex AI. Il sera ultérieurement disponible sur NVIDIA NIM.