Face à la démonstration de force des Etats-Unis sur l'intelligence artificielle à coups de milliards de dollars, l'irruption de l'IA chinoise DeepSeek R1 au même moment a produit un énorme effet sur le secteur.
Proposé à une fraction du prix des grands modèles d'IA américains et profitant d'optimisations algorithmiques améliorant son efficacité, des MoE (Mixture of Experts, approche privilégiée aussi par le français Mistral AI) au MLA (Multihead Latent Attention), l'IA chinoise a été la sensation du moment, malgré les zones d'ombre entourant son entraînement, son fonctionnement et le traitement des données qui lui sont fournies, sans parler du mystérieux et très discret fondateur de DeepSeek, Liang Wenfeng.
Malgré tout, DeepSeek offre une alternative bienvenue sur laquelle se ruent les entreprises chinoises, géants high-tech comme plus petites sociétés cherchant à se doter d'un modèle d'IA moins onéreux.
DeepSeek R2, la prochaine génération déjà dans les starting-blocks
Cela fait les affaires de Nvidia qui voit s'envoler ses ventes d'accélérateurs IA Nvidia H20, autorisés à l'exportation en Chine...mais peut-être plus pour très longtemps, l'administration Trump ne voyant pas d'un bon oeil la frénésie chinoise pour ces composants IA.
Profitant de cet espace ouvert face aux grands modèles d'IA américains (OpenAI, Anthropic, Google, Meta, Microsoft...) et de la forte demande chinoise, DeepSeek veut profiter de son avantage en accélérant la sortie de la génération suivante de son intelligence artificielle.
Selon Reuters, l'IA DeepSeek R2 pourrait arriver plus tôt que la sortie prévue initialement au mois de mai, avec un lancement qui doit désormais se jouer "aussi rapidement que possible".
D'après les premières informations, la nouvelle version devrait encore s'améliorer sur le codage et proposer des capacités de raisonnement dans d'autres langues que l'anglais.
DeepSeek R2 est attendue au tournant du point de vue des performances mais aussi de sa capacité à tourner sur des matériels moins performants que les modèles d'IA développés aux Etats-Unis, ainsi que sur son modèle économique.
Une riposte à GPT-5 d'OpenAI
L'arrivée de DeepSeek R1 a été vue comme une rupture sur un marché de l'IA qui semblait joué d'avance et aux mains de quelques grands groupes aux immenses moyens financiers.
Pour la Chine, c'est aussi une démonstration de son savoir-faire et d'un succès pouvant émerger malgré les restrictions américaines sur les puces et les technologies.
L'accélération du lancement pour DeepSeek R2 pourrait aussi être liée à l'arrivée imminente de GPT-5, le prochain modèle d'IA d'OpenAI, et qui promet un nouveau saut de performances.
Même sans battre la nouvelle IA en performances pures, DeepSeek R2 pourrait de nouveau avoir l'avantage sur les coûts et continuer d'attirer les entreprises, en Chine et ailleurs.