Le groupe Amazon est peut-être moins visible que d'autres en ce qui concerne les développements d'intelligence artificielle mais cela ne l'empêche pas de poser les briques d'un véritable écosystème organisé autour de son infrastructure cloud AWS et de composants IA développés en interne.

Certes dépendante vis à vis des accélérateurs IA des grands fournisseurs comme Nvidia, la firme développe également ses propres solutions matérielles sous la forme des processeurs Graviton et des accélérateurs pour machine learning et inférence Trainium.

La conférence Re:Invent est l'occasion de dévoiler ses derniers projets en matière d'intelligence artificielle, qu'il s'agissse de ses propres modèles d'IA Amazon Nova pour AWS, ce qui va lui permettre de réduire sa dépendance à d'autres modèles comme Claude d'Anthropic, mais aussi d'en dire plus sur ses composants matériels.

Trainium2 débarque sur la scène IA

L'accélérateur IA Trainium2 gravé en 5 nm selon le procédé avancé CoWoS (chip-on-wafer-on-substrate) de TSMC, annoncé l'an dernier, équipé de 96 Go de mémoire HBM pour 2,9 To/s de bande passante et offrant une capacité de traitement IA de 1,3 petaFLOPS en précision FP8, arrive enfin dans des instances AWS Trn2 sous forme d'assemblages de 64 composants Trainium2.

Amazon AWS Graviton4 Trainium2

Amazon Graviton4 et Trainium2, les composants IA custom avec Annapurna Labs

Ils servent de base à des configurations Ultraserver Trn2 offrant des capacités de traitement IA de 83,2 petaFLOPS (en FP8) mais ils peuvent également être utilisés en configurations plus légères de 16 trainium2 pour 20,8 petaFLOPS de capacité IA.

Les accélérateurs Trainium2 seront également utilisés pour l'entraînement de grands modèles d'IA comme ceux d'Anthropic en rassemblant plus de 100 000 composants dans le cadre d'un Project Rainier, indique le site The Register.

Trainium3, la prochaine étape

Et si Amazon continue de s'équiper en accélérateurs IA divers chez Nvidia, dont les futurs superpuces Grace Blackwell, la firme prépare également ses propres accélérateurs IA Trainium3 de prochaine génération.

Amazon AWS instance EC2 Trn2 Trainium2

Toujours conçus par Annapurna Labs, ils sont encore peu détaillés mais ils profiteront d'une gravure en 3 nm et ils devraient profiter de performances de traitement 4 fois supérieures en configuration UltraServer par rapport à Trainium2...qui lui-même apportait 4 fois plus de performances que Trainium 1.

La gravure plus fine permettra en outre une efficacité énergétique renforcée (+40%). Mais comme Trainium2 arrive seulement sur le marché un an après son annonce officielle et que Trainium3 n'est pas encore officiellement présentée, il faudra sans doute du temps avant de profiter d'instances AWS Trn3.

Source : The Register