La nouvelle architecture Turing de Nvidia est au coeur des nouvelles cartes graphiques gaming RTX 2000 et l'un des ses atouts repose sur ses capacités de traitement pour les intelligences artificielles.

A côté des GPU gaming, Nvida annonce donc un accélérateur GPU Tesla T4 également sous architecture Turing mais tourné vers les applications IA dans les datacenters et capable de gérer les processus d'inférence pour l'analyse d'image et de vidéo, les traitements des requêtes vocales des assistants numériques ou les moteurs de recommandation.

Nvidia Tesla T4

Le Tesla T4 embarque 2560 cores CUDA et 320 cores Tensor, avec la promesse de traitements 40 fois plus rapides qu'en passant par un CPU. L'accélérateur est épaulé par une couche logicielle TensorRT (Nvidia TensorRT Hyperscale Platform) intégrant les algorithmes d'optimisation d'inférence.

Nvidia annonce une une puissance de traitement de 65 TFLOPS en FP16 et des possibilités de calculs en INT8 et INT4.

Le composant Tesla T4 est annoncé comme 5 fois plus rapide en inférence pour la reconnaissance vocale et 3 fois plus rapide en inférence pour les traitements vidéos que la génération précédente, le Tesla P4 sous architecture Pascal.

L'accélérateur Tesla T4 est associé à 16 Go de RAM GDDR6 et utilise un format PCIe avec une consommation annoncée de 75 Watts.