Microsoft dégaine son processeur ARM Cobalt 200 et muscle son cloud Azure

Microsoft vient de lever le voile sur sa nouvelle puce serveur, l'Azure Cobalt 200. Gravée en 3 nm par TSMC et dotée de 132 cœurs ARM, elle promet une hausse de performance de plus de 50 % par rapport à son aînée, marquant une accélération stratégique de la firme dans la conception de son propre silicium pour ses centres de données.

La tendance n'est pas nouvelle : les hyperscalers cherchent à reprendre la main sur leur matériel pour mieux maîtriser les coûts, la consommation énergétique et les performances.

Amazon a ouvert la voie avec ses puces Graviton, et Microsoft lui emboîte le pas avec une ambition renouvelée. L'arrivée du Cobalt 200 s'inscrit dans cette logique de souveraineté technologique, où chaque composant de l'infrastructure est taillé sur mesure pour les besoins spécifiques du cloud.

Une architecture musclée gravée en 3 nm

Derrière l'appellation Cobalt 200 se cache un processeur qui ne fait pas dans la demi-mesure. La puce embarque un total de 132 cœurs actifs, basés sur la toute dernière architecture Neoverse CSS V3 d’ARM.

Ces cœurs sont répartis sur deux chiplets de 66 cœurs chacun, interconnectés pour fonctionner comme une seule unité. Chaque cœur dispose de son propre cache L2 de 3 Mo, complété par un cache L3 partagé de 192 Mo, une configuration pensée pour le traitement massif de données.

Le véritable saut technologique réside dans la finesse de gravure. Le Cobalt 200 est le premier processeur de Microsoft à bénéficier du procédé de fabrication en 3 nm de TSMC.

Cette avancée permet non seulement d'augmenter la densité de transistors, mais aussi d'améliorer significativement l'efficacité énergétique, un enjeu capital pour les centres de données. L'ensemble est soutenu par une interface mémoire à 12 canaux, garantissant une bande passante élevée pour alimenter les très nombreux cœurs.

Plus de puissance, moins d'énergie ?

Microsoft annonce un gain de performance pouvant atteindre 50 % par rapport à la génération précédente, le Cobalt 100. La firme de Redmond a intégré des accélérateurs matériels dédiés directement sur le SoC.

Des tâches courantes mais gourmandes en calcul, comme la compression de données et le chiffrement cryptographique, sont désormais déchargées sur ces unités spécialisées.

Cette approche libère les cœurs du processeur, qui peuvent alors se consacrer entièrement aux charges de travail applicatives. Des services comme SQL Server bénéficient directement de cette optimisation.

De plus, une innovation notable réside dans la gestion de l'alimentation : chaque cœur peut ajuster dynamiquement sa tension et sa fréquence (DVFS), permettant une optimisation fine de la consommation électrique en fonction de la charge de travail réelle.

Le Cobalt 200 est également conçu pour s'intégrer avec Azure Boost, le DPU de Microsoft qui gère le réseau et le stockage, isolant encore davantage le CPU des tâches d'infrastructure.

Une puce généraliste à l'ère de l'intelligence artificielle

Face aux mastodontes de l'IA comme les GPU H200 de NVIDIA ou les TPU de Google, le positionnement du Cobalt 200 est différent. Il ne s'agit pas d'un accélérateur pour l'entraînement de grands modèles de langage.

Son rôle est de constituer l'épine dorsale des services fondamentaux d'Azure : serveurs web, microservices, bases de données transactionnelles et, de plus en plus, l'inférence IA qui s'exécute sur des CPU. Pour ces usages, le nombre de cœurs et la bande passante mémoire sont les critères les plus importants.

La stratégie de Microsoft vise à renforcer son offre de "confidential computing" grâce au support natif de l'architecture CCA d'ARM, permettant d'isoler les données des utilisateurs même de l'hyperviseur.

Déjà en production pour les besoins internes de Microsoft, notamment pour des services comme Office ou Teams, les serveurs équipés du Cobalt 200 seront accessibles au grand public sur Azure courant 2026.