L'intelligence artificielle est omniprésente, avec filigrane son coût écologique qui peut constituer une zone d'ombre. La start-up et pépite française Mistral AI se plie à un exercice de transparence en publiant une première analyse pour le cycle de vie de son modèle Mistral Large 2.

En collaboration avec des experts comme Carbone 4 et l'agence française de la transition écologique Ademe, Mistral AI met des chiffres précis sur une réalité finalement connue de tous et ne pouvant pas être ignorée. L'impact environnemental de l'industrie de l'IA.

Un entraînement qui coûte cher à la planète

Afin d'entraîner un grand modèle de langage, les données révélées pour Mistral Large 2 après 18 mois d'existence sont éloquents. L'entraînement du modèle a généré 20 400 tonnes d'équivalent CO2. D'après le calculateur de l'Ademe, cela correspond à l'équivalent des émissions de CO2 de 94 millions de kilomètres en voiture thermique.

Le bilan de la consommation en eau est tout aussi frappant, soit 281 000 mètres cubes. À titre de comparaison, le volume d'eau d'une piscine olympique est de 2 500 m³. Il s'agit ainsi de l'équivalent pour remplir un peu plus de 112 piscines olympiques.

Ces chiffres astronomiques s'expliquent par l'immense puissance de calcul nécessaire, mobilisant des milliers de processeurs graphiques très énergivores. Les serveurs tournent souvent dans des zones où l'électricité est fortement carbonée.

L'étude montre que l'impact chuterait de 73 % si les serveurs utilisaient le mix énergétique français, beaucoup moins carboné. La fabrication des puces et des serveurs représente aussi une part non négligeable de l'empreinte carbone, notamment sur l'épuisement des ressources naturelles.

L'impact d'une simple question posée à l'IA

Après le choc des chiffres de l'entraînement, quel est le coût d'une simple interaction avec l'IA ? Pour générer une réponse d'environ une page (400 tokens), Mistral Large 2 génère 1,14 gramme de CO2 et consomme 45 ml d'eau. C'est peu, et même moins que certaines de nos actions quotidiennes, mais le piège est de sous-estimer cet impact.

Si chaque requête est une goutte d'eau, les milliards de requêtes effectuées chaque jour à travers le monde finissent par créer un véritable déluge. L’effet d'échelle est le véritable enjeu.

La grande majorité des impacts (plus de 85 % pour le CO2 et 90 % pour l'eau) provient bien de l'usage combiné de l'entraînement et les requêtes des utilisateurs.

mistral-ai-infographie-cycle-vie-mistral-large-2 Source image : Mistral AI

Le bon modèle pour le bon usage

En publiant un tel rapport, Mistral AI ne fait pas que son autocritique et appelle à la création d'un système global de scoring, pour aider les utilisateurs à identifier et choisir les modèles moins gourmands en carbone, en eau et en matériaux.

L'étude confirme une règle simple voulant qu'un modèle dix fois plus grand aura un impact environnemental d'un ordre de grandeur supérieur à celui d'un modèle plus petit pour la même quantité de jetons générés.

En plus de pousser à privilégier le bon modèle pour le bon usage, Mistral AI encourage à regrouper les requêtes pour limiter les calculs inutiles.

Source : Mistral AI