Le géant technologique chinois confirme ses ambitions dévorantes. Dans le cadre de sa stratégie d'investissement massif en recherche et développement, chiffrée à 200 milliards de yuans (24,2 milliards d'euros) sur cinq ans, Xiaomi franchit une étape décisive dans le domaine de l'intelligence artificielle.

Ce mouvement s'inscrit dans sa vision d'un écosystème intégré « Human–Car–Home », où l'IA joue un rôle de liant.

Qu'est-ce que MiMo-V2-Flash ?

MiMo-V2-Flash est un grand modèle de langage de type Mixture of Experts (MoE). Il totalise 309 milliards de paramètres, mais n'en active que 15 milliards lors de l'inférence, une architecture conçue pour maximiser l'efficacité sans sacrifier la puissance.

Rendu disponible mondialement sur des plateformes comme Hugging Face, ce modèle est présenté comme la deuxième étape sur la feuille de route de l'entreprise vers l'intelligence artificielle générale (AGI).

L'un des principaux arguments de Xiaomi réside dans le rapport performance/coût. Le modèle atteint une vitesse d'inférence de 150 tokens par seconde pour un coût annoncé comme l'un des plus bas du marché : 0,1 dollar par million de tokens en entrée et 0,3 dollar en sortie.

Xiaomi MiMo V2 Flash cout performance

Cette accessibilité économique pourrait séduire une large communauté de développeurs.

Des performances comparables aux ténors du marché ?

Xiaomi positionne son nouveau-né face aux modèles les plus performants. Selon les benchmarks communiqués, MiMo-V2-Flash rivalise avec Kimi K2 Thinking de Moonshot AI et DeepSeek V3.2 Thinking sur la plupart des tâches de raisonnement. Il surpasserait même Kimi dans les évaluations de contexte long.

Xiaomi MiMo V2 Flash performances

Dans le domaine du codage, les résultats sont particulièrement notables. Le modèle se hisse au niveau de Claude 4.5 Sonnet d'Anthropic, considéré comme une référence, tout en affichant un coût d'inférence qui ne représente que 2,5 % de celui de son concurrent.

Sur le test SWE-Bench, il surpasse tous les modèles open-source et s'approche des performances d'un certain GPT-5-High d'OpenAI.

Au-delà des chiffres, quelles capacités concrètes ?

Le modèle brille par sa polyvalence. Il est capable de générer des pages web fonctionnelles en un clic, comme un système d'exploitation simulé macOS ou un explorateur de système solaire interactif.

Les tests menés par des tiers montrent des résultats parfois impressionnants, bien que la stabilité ne soit pas toujours parfaite.

Avec une fenêtre de contexte de 256k, MiMo-V2-Flash peut gérer des conversations complexes et des tâches d'agent nécessitant des centaines d'interactions.

L'entreprise met également en avant ses capacités de rédaction longue et créative, de la nouvelle à l'analyse de société. Cette offensive logicielle, saluée par des analystes comme Morgan Stanley, renforce la crédibilité de Xiaomi comme acteur technologique global, bien au-delà du simple matériel.