Accusée d'avoir bâti son succès sur le "vol" de millions d'œuvres protégées, la société d'IA Anthropic, concurrente d'OpenAI, vient d'éviter le pire. Elle a conclu un accord préliminaire, dont les termes ne sont pas encore connus, avec les auteurs qui avaient lancé une action collective contre elle. Prévu pour être finalisé début septembre, ce règlement à l'amiable met fin à une procédure judiciaire qui menaçait l'existence même de l'entreprise, dont la valorisation se chiffre en milliards de dollars.
Un accord pour échapper à une amende colossale
Le procès, qui devait se tenir en décembre, s'annonçait désastreux pour Anthropic. La start-up risquait une amende potentiellement abyssale, estimée à près de 900 milliards de dollars. Un montant calculé sur la base des 750 dollars de dommages et intérêts par œuvre piratée prévus par la loi américaine, multipliés par les millions de livres concernés. Face à ce risque existentiel, l'entreprise a préféré négocier. L'avocat des auteurs, Justin Nelson, a qualifié l'issue de positive : « Cet accord historique profitera à tous les membres du groupe ».
La nuance juridique qui a tout déclenché
Le tournant de l'affaire a eu lieu en juin dernier, lors d'un jugement préliminaire. Le juge californien William Alsup a établi une distinction capitale qui a mis Anthropic en grande difficulté. Il a en effet estimé que l'entraînement d'une IA sur des livres achetés légalement, même sans l'accord des auteurs, relevait du fair use (usage loyal), une exception au droit d'auteur américain.
En revanche, le juge a considéré que le fait pour Anthropic d'avoir acquis des millions de livres via des bibliothèques "fantômes" comme Libgen, Books3 ou PiLiMi constituait un acte de piratage pur et simple.
C'est cette seconde partie qui a ouvert la voie à un procès pour violation de copyright à grande échelle, la méthode d'acquisition des œuvres étant jugée illicite.
Des millions de livres piratés au cœur des accusations
L'action collective, initiée par plusieurs auteurs américains, accusait Anthropic d'avoir « bâti une entreprise de plusieurs milliards de dollars en volant des centaines de milliers de livres protégés par le droit d’auteur ». Les documents du tribunal ont révélé que les cofondateurs de l'entreprise avaient personnellement téléchargé près de 7 millions d'ouvrages depuis des plateformes de piratage connues entre 2021 et 2022. Ces livres ont ensuite servi à entraîner les modèles de langage de l'IA Claude, sans aucune compensation pour les créateurs.
Le débat sur les droits d'auteur et l'IA est loin d'être clos
Si Anthropic a évité le pire, cet accord ne résout pas la question de fond qui agite tout le secteur de l'intelligence artificielle. De l'aveu même d'OpenAI, il est aujourd'hui « impossible d'entraîner les meilleurs modèles d'IA actuels sans utiliser des documents protégés par le droit d'auteur ». D'autres géants, comme Meta, ont fait face à des plaintes similaires, parfois avec des issues différentes. Ce règlement à l'amiable montre que la pression juridique s'accentue et pourrait pousser les entreprises d'IA à revoir leurs méthodes d'entraînement et à trouver des accords de licence avec les créateurs de contenu.