Le groupe Nvidia travaille depuis plusieurs années sur les composants destinés au deep learning et aux intelligences artificielles, profitant des avantages des architectures GPU dans ces domaines pour proposer des solutions adaptées.

Le spécialiste des GPU a sans doute été quelque peu agacé de voir le groupe Intel s'inviter sur ce terrain avec une gamme Xeon Phi Knights Mill voulant s'inviter sur ce terrain et cherchant justement à se positionner face aux offres de Nvidia en valorisant une approche CPU à laquelle Nvidia ne croit pas.

Le groupe annonce donc à son tour de nouveaux produits avec les accélérateurs GPU Nvidia Tesla P4 et P40 destinés à alimenter les services d'intelligences artificielles. Reposant sur une architecture Pascal, ils doivent fournir les performances requises pour ce type d'activité et que les CPU ne parviennent qu'à grand-peine à atteindre.

Nvidia Tesla

Les nouveaux accélérateurs GPU sont spécialisés dans le traitement des inférences, qui exploite des réseaux neuronaux déjà entraînés et permet de générer des réponses face aux éléments introduits pour analyse dans ces réseaux.

Les accélérateurs Nvidia Tesla P4 et P40 seront ainsi particulièrement utiles pour la reconnaissance vocale et le computer vision avec reconnaissance d'images ou de texte, en réponse aux requêtes d'utilisateurs.

Nvidia précise que les accélérateurs GPU exploitent des instructions d'inférence 8-bit (INT8) et fournissent des temps de réponse 45 fois supérieurs à des solutions CPU, tout en consommant beaucoup moins d'énergie.

Nvidia Tesla P4 P40 specs

L'accélérateur Nvidia Tesla P4 profite d'un form factor réduit et d'une basse consommation démarrant à 50 Watts qui le rend 40 fois plus efficace qu'une solution CPU pour une même charge de traitement d'inférences.

De son côté, l'accélérateur Nvidia Tesla P40 joue la carte des performances avec une capacité de traitement d'inférences INT8 de 47 TOPS (47 000 milliards d'opérations par seconde).

Nvidia a également intégré des optimisations logicielles telles que la librairie TensorRT qui optimise le traitement des applications de deep learning et améliore les temps de réponse, et le SDK DeepStream exploitant les caractéristiques de l'architecture Pascal pour décoder et analyser jusqu'à 93 flux vidéo HD simultanément et en temps réel, ouvrant la voie à des applications comme les véhicules autonomes ou les robots interactifs capables d'analyser leur environnement et de produire une réponse dans des délais courts.

Les accélérateurs GPU Nvidia Tesla P4 et P40 seront disponibles à partir des mois de novembre et d'octobre 2016 respectivement chez les partenaires de Nvidia.