Au cœur de l’écosystème chinois de l’intelligence artificielle, DeepSeek trébuche face à l’obstacle technologique majeur que constitue l'alternative des puces Huawei Ascend par rapport aux GPU de Nvidia.

Prévu pour mai, le lancement du modèle DeepSeek R2 de la société a été suspendu, mettant en lumière les difficultés de la Chine à s’émanciper des solutions américaines et les limites auxquelles elle se heurte.

Cette situation soulève des questions cruciales sur la stratégie technologique du pays, sa capacité à innover localement, et les répercussions pour le secteur mondial de l’IA.

Une ambition contrariée : DeepSeek et le pari des puces Made in China

Le modèle R2 de DeepSeek devait incarner la montée en puissance de la Chine sur la scène mondiale de l’intelligence artificielle après l'irruption du modèle d'IA à un moment où les Etats-Unis faisaient étalage de leur avance.

À la demande des autorités, la start-up a tenté de s’affranchir des accélérateurs IA Nvidia, massivement utilisés dans le secteur, pour baser son entraînement sur les puces Ascend de Huawei.

Or, cette transition s’est avérée bien plus complexe que prévu, entraînant une série de problèmes techniques jugés insurmontables par l’équipe de DeepSeek. 

L’entreprise a sollicité l’aide des ingénieurs de Huawei pour adapter son modèle d’IA à l’environnement Ascend mais, malgré ce soutien, aucun entraînement complet du R2 n’a pu être réalisé sur les puces maison.

Jusqu’à récemment, DeepSeek avait bénéficié d’un accès privilégié aux cartes Nvidia H20, pilier des solutions IA chez ses concurrents ByteDance, Tencent ou Alibaba. Aujourd’hui, la pression réglementaire s’accroît pour justifier d’un usage plus local, ce qui complique la stratégie et nuit à l’efficacité.

Des défis techniques et humains : l’épreuve de l’entraînement

Le passage aux puces Ascend pose des problèmes concrets de compatibilité et d’efficacité. Selon des témoignages internes relayés par le Financial Times, l’équipe de DeepSeek n’a jamais pu mener à terme une session d’entraînement complète avec le R2 sur le matériel de Huawei.

Les raisons ? Un manque de puissance de calcul adaptée à la volumétrie de données exigée par la nouvelle mouture, mais aussi une intégration logiciel /hardware encore immature

La qualité des données d’entraînement locales est également remise en cause. Là où le précédent modèle, le R1, avait pu exploiter des bases mondiales certifiées et diverses, R2 dépend fortement de ressources nationales jugées non optimales.

L’efficacité du développement s’en voit sérieusement réduite et le taux d’utilisation de DeepSeek est en chute libre alors que l'IA était vue il y a peu comme l'alternative de choix aux modèles d'IA venus des Etats-Unis.

La start-up, autrefois au sommet du secteur au lancement du modèle R1, subit donc une perte de confiance de la part de ses utilisateurs et ouvre la porte à une compétition accrue sur le marché local et international.

Les retombées sectorielles : fragilité ou rebond pour la Chine ?

Avec l’utilisation forcée des puces locales, la Chine poursuit inlassablement son objectif de souveraineté technologique. « Cette situation met en lumière la dépendance persistante vis-à-vis des composants américains, surtout Nvidia, malgré les efforts de Pékin pour imposer des alternatives comme Huawei » analyse un expert du secteur.

L’affaire DeepSeek exemplifie les difficultés des entreprises chinoises face à la pénurie de GPU haut de gamme, élément stratégique pour l’entraînement des modèles IA.

En parallèle, les autorités multiplient les contrôles et exigences sur les commandes de cartes Nvidia, tout en exhortant les développeurs à adopter les solutions de Huawei. Ce bras de fer technologique impacte les perspectives de croissance et pourrait freiner la compétitivité des géants locaux.

La situation alimente l’incertitude et amène les acteurs du secteur à s’interroger sur la viabilité à long terme des investissements dans les puces « maison ». Pour DeepSeek, l’enjeu est désormais de retrouver sa place, soit en misant sur une hybridation des composants, soit en attendant de nouvelles avancées sur le front national.

Vers un nouveau modèle de collaboration et d’innovation ?

Face à ces revers, Huawei et DeepSeek renforcent leur partenariat. Une équipe d’ingénieurs Huawei travaille main dans la main avec DeepSeek pour adapter le modèle R2 à l’environnement Ascend, une collaboration qui pourrait ouvrir de nouveaux horizons...ou au moins corriger les gros défauts.

Mais la réussite reste incertaine : « Le R2 est toujours en phase de développement actif avec une date de sortie inconnue, le PDG souhaitant attendre des performances à la hauteur des attentes » révèle la presse spécialisée.

Différents autres acteurs majeurs du secteur IA sont aussi concernés par ces défis et doivent justifier chaque décision d’achat de matériel à l’État. La transition vers une indépendance technologique dans l’IA chinoise semble encore longue et semée d’embûches, mais la mobilisation générale des équipes et la pression des autorités pourraient, à terme, façonner une dynamique nouvelle d’innovation.