Le week-end dernier, la polémique a pris une tournure inattendue. Une entité nommée HonestAGI a publié une analyse technique détonante sur GitHub, affirmant une "corrélation extraordinaire" entre Pangu Pro Mixture of Experts (MoE) de Huawei et Qwen 2.5 14B d'Alibaba. Pour HonestAGI, il ne s'agirait pas d'un entraînement original, mais plutôt d'un "upcycling", c'est-à-dire un recyclage. Rapidement, un membre anonyme de l'équipe Pangu de Huawei a corroboré ces dires, décrivant un clonage systématique de modèles d'Alibaba et de la startup DeepSeek. Ces révélations explosives remettent en question la course à l'innovation en Chine et la crédibilité de certains acteurs.

Huawei a-t-il vraiment plagié les modèles d'IA ?

Les accusations sont lourdes : selon les lanceurs d'alerte, le modèle Pangu 135B V2 de Huawei serait une copie du Qwen 1.5 110B d'Alibaba. On parle même de références à "Qwen" encore présentes dans le code de Pangu, signe d'une intégration rapide, pour ne pas dire bâclée. L'analyse technique d'HonestAGI, bien que depuis disparue de GitHub, affirmait une corrélation de 0,927 entre les deux modèles. Des similitudes troublantes ont été relevées dans les matrices, les réseaux de neurones, et même les biais d'attention, s'apparentant à des empreintes digitales quasi identiques. Ces méthodes de "clonage" auraient même touché DeepSeek v3 pour créer le Pangu Pro MoE 72B. Une audace qui interroge sur l'intégrité de la recherche chez Huawei, malgré les dénégations formelles du laboratoire Noah Ark Lab, qui insiste sur un développement "entièrement construit sur les puces Ascend de Huawei" et des "innovations clés".

Quelles sont les conséquences de ces révélations sur l'IA chinoise ?

Ce scandale marque une fracture nette au sein de l'écosystème chinois de l'IA, jusqu'ici réputé pour sa façade collaborative face aux géants occidentaux comme OpenAI ou Google DeepMind. Pour Neil Shah, de Counterpoint Research, ces luttes intestines pourraient affaiblir la Chine sur la scène internationale. La crédibilité de toutes les parties est en jeu. L'analyse d'HonestAGI elle-même a été critiquée pour ses failles méthodologiques, des corrélations similaires ayant été trouvées entre des modèles non liés, et des références de recherche inventées. Mais l'impact est là : un climat de méfiance s'installe. Ce différend met en lumière les défis de l'industrie : les coûts de développement des modèles montent en flèche, et la réutilisation devient monnaie courante. Vershita Srivastava, d'Everest Group, souligne l'urgence de nouveaux outils et cadres pour gérer ces litiges, notamment des techniques d'empreinte digitale fiables et des cadres juridiques clairs pour la propriété intellectuelle des grands modèles linguistiques (LLM).

Comment la compétition interne fragilise-t-elle le secteur ?

Cette querelle illustre une compétition féroce où la rapidité prime souvent sur la transparence. Alors qu'Alibaba, avec sa famille Qwen, vise le grand public et les applications conversationnelles, Huawei cible davantage les entreprises dans les secteurs public, financier et manufacturier avec ses modèles Pangu. Malgré une entrée précoce sur le marché en 2021, Huawei semble peiner à suivre le rythme. La société a d'ailleurs mis en open source ses modèles Pangu Pro MoE en juin, espérant dynamiser leur adoption. Ce qui était autrefois une stratégie alignée sur les objectifs de l'État se transforme en une course effrénée dictée par le marché. L'ingénieur lanceur d'alerte évoque un environnement de travail toxique, où la triche était récompensée au détriment de l'innovation, poussant les talents à fuir vers d'autres entreprises comme ByteDance ou Tencent. Sanchit Vir Gogia, analyste chez Greyhound Research, avertit que toute érosion de la confiance pourrait avoir des conséquences géopolitiques et commerciales durables, incitant des régions comme l'Asie du Sud-Est ou le Moyen-Orient à reconsidérer leurs partenariats avec les fournisseurs chinois. Le dénouement de cette affaire créera des précédents importants pour l'avenir de l'IA mondiale.

Foire Aux Questions (FAQ)

Pourquoi Huawei est-il accusé de plagiat d'IA ?

Huawei est accusé d'avoir copié des éléments des modèles linguistiques d'Alibaba (Qwen 2.5) et de DeepSeek pour créer son propre modèle Pangu Pro, sans un entraînement initial "from scratch". Ces allégations proviennent d'une analyse technique et d'un lanceur d'alerte interne.

Quelles sont les preuves avancées contre Huawei ?

Une analyse a montré une très forte corrélation (0,927) entre Pangu Pro MoE et Qwen 2.5 14B. Des références aux modèles originaux ("Qwen", "deepseekv3") auraient même été retrouvées dans le code de Huawei, selon le lanceur d'alerte.

Comment Huawei a-t-il réagi à ces accusations ?

Le laboratoire Noah Ark Lab de Huawei a fermement rejeté les accusations, affirmant que son modèle Pangu Pro n'était pas basé sur l'entraînement incrémental d'autres modèles et qu'il intégrait des innovations architecturales clés, étant entièrement construit sur les puces Ascend de Huawei.