En début d'année, les géants américains de l'IA rivalisaient d'annonces promettant des dizaines de milliards de dollars d'investissement pour bâtir des infrastructures devant répondre à l'essor des capacités d'intelligence artificielle.
Au même moment a surgi DeepSeek R1, une IA d'origine chinoise affirmant faire aussi bien que les grands modèles d'IA américains avec beaucoup moins de ressources matérielles et pour une fraction de leur coût.
La réalité est sans doute plus prosaïque mais elle a levé un vent d'espoir face à l'écrasante stratégie américaine en soulignant l'intérêt d'intelligences artificielles peut-être un peu moins généralistes mais efficaces dans leur domaine et beaucoup moins consommatrices de ressources.
DeepSeek R2 toujours dans les limbes
Profitant de sa mise en lumière et de l'intérêt marqué des entreprises chinoises, tandis que le monde occidental est resté un peu circonspect face aux conditions de fonctionnement du modèle d'IA chinois et de sa collecte de données, l'entreprise DeepSeek avait annoncé l'arrivée rapide d'une évolution DeepSeek R2.
Elle était espérée dès le printemps pour maintenir l'intérêt autour de cette plate-forme dans un secteur très concurrentiel et ne pas se laisser distancer par d'autres modèles.
Toutefois, DeepSeek R2 n'a toujours pas été lancé et le média The Information croit savoir pourquoi. Cela viendrait tout simplement d'une pénurie de composants IA Nvidia H20 dont l'exportation vers le marché chinois a été remise en cause par l'administration Trump.
L'IA DeepSeek R1 aurait été entraînée grâce à un ensemble de 50 000 GPU Hopper répartis en :
- 30 000 Nvidia H20
- 10 000 Nvidia H800
- 10 000 Nvidia H100
Les composants ont été apportés par High Flyer Capital Management, le fonds investisseur de DeepSeek, mais le cluster n'est sans doute pas suffisant pour pré-entraîner DeepSeek R2.
DeepSeek, le fantasme de l'IA chinoise supérieure
The Information relève que DeepSeek travaille activement sur la nouvelle version mais que son CEO, Liang Wenfeng, ne serait pas encore satisfait du résultat et pousserait les équipes à optimiser le modèle d'IA.
Les restrictions sur les composants Nvidia H20, jusqu'à alors autorisés en Chine, ne facilitent pas les choses, que ce soit pour finaliser DeepSeek R2 ou même pour faire tourner DeepSeek R1 au sein des entreprises chinoises, puisque des systèmes à base de GPU Nvidia H20 sont souvent utilisées.
La situation pourrait partiellement se débloquer à partir de juillet avec l'arrivée d'un nouvel accélérateur IA de Nvidia dont la puissance de traitement sera adaptée aux nouvelles exigences du gouvernement américain.
Le site Tom's Hardware relève que DeepSeek a été optimisé pour le matériel de Nvidia et son écosystème logiciel, ce qui rend compliqué le recours à des alternatives comme les puces Ascend du groupe chinois Huawei.
Cela illustre la dépendance d'une bonne partie du marché IA chinois aux technologies occidentales et aux mesures de restriction imposées. Récemment, des officiels américains ont accusé DeepSeek de transmettre les données des utilisateurs aux services de renseignement chinois mais aussi de s'équiper en GPU IA interdits en passant par des sociétés-écran.