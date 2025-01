La mise en service de l'IA DeepSeek R1 a fait l'effet d'une bombe en offrant des performances similaires à celles de modèles d'IA pour une fraction de leur coût. Si la startup chinoise n'est pas une inconnue dans le domaine de l'IA, elle a ébranlé les certitudes autour d'une domination américaine dans le secteur de l'intelligence artificielle et créé un doute sur la nécessité d'investissements massifs tels qu'ils sont programmés actuellement par les grand groupes high-tech et les startups dans les petits papiers de Donald Trump.

Les principaux acteurs du marché et leurs fournisseurs ont été durement touchés en Bourse, créant un repli de capitalisation jamais vu, et la résistance a commencé à s'organiser.

Tout le monde se veut rassurant sur les perspectives et tente de faire passer l'irruption de DeepSeek sur la scène mondiale comme une chance qui ne modifiera pas nécessairement les stratégies, ce qui peut sembler pour le moins curieux pour un modèle d'IA qui n'aurait demandé que 6 millions de dollars pour obtenir des performances se rapprochant de modèles coûtant au moins dix fois plus d'argent.

DeepSeek aurait pris certains raccourcis

Pendant que certains expliquent son succès par la démonstration des possibilités du renforcement d'apprentissage (le fameux test-time scaling), bien des mystères entourent la firme DeepSeek, ses moyens d'action et les capacités matérielles à sa disposition, même si son modèle d'IA est proposé en open source.

OpenAI, premier visé par l'arrivée de DeepSeek R1 et dont la toute récente stratégie Stargate à 500 milliards de dollars mise en avant par Donald Trump il y a quelques jours est logiquement questionnée, n'a pas tardé à réagir.

Si son dirigeant Sam Altman a salué les performances impressionnantes de DeepSeek tout en indiquant que l'augmentation des capacités matérielles pour l'IA restait une priorité, les piques commencent à fuser.

Plus précisément, DeepSeek est soupçonnée d'avoir entraîné ses modèles d'IA en utilisant ceux, propriétaires, d'OpenAI, selon une technique dite de distillation utilisant les résultats de grands modèles pour optimiser ceux de plus petits modèles pour en réduire les coûts.

OpenAI prétend avoir des trace d'une telle distillation, ce qui correspond à une infraction à l'utilisation de son modèle d'IA, l'accord d'utilisation ne permettant pas de copier ses services ni d'utiliser les résultats de son IA pour développer des modèles concurrents, ce qui ouvre la voie à une problématique de violation de propriété intellectuelle.

Une distillation qui ne date pas d'hier

OpenAI et son fournisseur d'infrastructures Microsoft auraient ainsi déjà bloqué l'an dernier des comptes de DeepSeek utilisant l'API OpenAI pour des soupçons d'usage de cette technique de distillation, indique le Financial Times d'après des informations initialement publiées par Bloomberg.

Officiellement, l'IA DeepSeek V3 a été entraînée avec 2048 accélérateurs Nvidia H800 et un modèle de 671 milliards de paramètres mais certaines de ses réponses ont rapidement fait penser que l'IA avait pu utiliser des données issues du modèle GPT-4 d'OpenAI.

Le principe de distillation serait couramment utilisé par les startups et les instituts de recherche qui n'ont pas les moyens financiers colossaux des géants high-tech pour disposer de puissantes infrastructures. Cette méthode permet de gagner du temps et d'économiser des ressources, permettant de fournir des réponses dans un style plus humain.

Pour une entreprise elle-même aux prises avec de multiples accusations de récupération de masses des contenus sur Internet sans autorisation, accuser d'autres acteurs de violation de propriété intellectuelle a sans doute quelque chose de cocasse mais il s'agira sans doute ici de l'argument-massue (OpenAI n'a pour le moment apporté aucune preuve) qui donnera tous les droits pour tenter d'éteindre rapidement cette concurrence dérangeante.