La bataille juridique entre les créateurs de contenu et les géants de l'intelligence artificielle vient de franchir une nouvelle étape. Lundi 22 décembre, six auteurs américains, parmi lesquels figure le journaliste du New York Times John Carreyrou, ont déposé une plainte devant la cour fédérale de Californie. Dans leur viseur, six des plus grandes sociétés du secteur : xAI, Anthropic, Google, OpenAI, Meta et Perplexity AI. L'accusation est directe : leurs œuvres auraient été massivement utilisées, sans aucune autorisation, pour entraîner les grands modèles de langage qui font aujourd'hui la fortune de ces entreprises.
Comment des bibliothèques pirates se sont-elles retrouvées au cœur des modèles d'IA ?
Selon les plaignants, la méthode employée par ces sociétés relève d'une appropriation à grande échelle. Plutôt que de négocier des licences, elles auraient délibérément téléchargé des copies illégales de leurs livres depuis des « bibliothèques parallèles ». Des noms comme LibGen, Z-Library ou encore OceanofPDF sont explicitement cités dans la plainte, des plateformes bien connues pour distribuer des contenus protégés par le droit d'auteur.
Ces œuvres auraient ensuite été ingérées et analysées pour « accélérer le développement commercial et gagner la course à l'intelligence artificielle ». Une pratique qui, selon les auteurs, a permis de « construire des systèmes qui valent aujourd'hui plusieurs centaines de milliards de dollars ». Cette accusation n'est pas isolée et fait écho à des révélations concernant d'autres acteurs, comme l'entreprise française Mistral AI, également suspectée d'avoir puisé dans la bibliothèque LibGen.
Cette plainte est-elle un cas isolé dans le secteur ?
Loin de là. Cette action en justice vient s'ajouter à une vague de litiges qui déferle sur l'industrie technologique. D'après le décompte du site spécialisé AI Watchdog, plus de 70 procédures similaires sont déjà en cours rien qu'aux États-Unis. Des artistes visuels aux éditeurs de presse comme le New York Times, en passant par les musiciens et les développeurs, de nombreux créateurs estiment que leurs droits ont été bafoués.
Les entreprises visées sont systématiquement les mêmes, d'OpenAI à Meta, en passant par Microsoft ou Stability AI. Les accusations se ressemblent : entraînement des modèles sur des données protégées sans consentement ni compensation. Cette multiplication des plaintes témoigne d'un conflit grandissant sur la valeur de la création et pose la question fondamentale du respect de la propriété intellectuelle face à une technologie comme l'IA générative, particulièrement gourmande en données.
Crédits : ThankYouFantasyPictures / Pixabay
Pourquoi ces auteurs refusent-ils l'action collective ?
La stratégie juridique adoptée par les six auteurs est particulièrement notable. Contrairement à de nombreuses autres procédures, ils ont délibérément choisi de ne pas se regrouper dans une action collective. Selon eux, ce type de procès favorise les entreprises d'IA, leur permettant de négocier un accord unique et souvent modeste avec un grand nombre de plaignants à la fois.
Leur objectif est clair : « conserver le contrôle total de leur affaire et éviter que leurs droits ne soient dilués ». Ils refusent que leurs réclamations, qu'ils estiment de grande valeur, soient réglées « pour quelques centimes seulement ». En agissant de manière individuelle, ils espèrent obtenir une réparation plus juste et créer un précédent qui pourrait forcer les entreprises à revoir leur modèle, qui s'apparente selon eux à une forme de plagiat à l'échelle industrielle.