Microsoft, le géant technologique, se retrouve une fois de plus au cœur d'une controverse juridique majeure. Ce 25 juin 2025, un collectif d'auteurs de renom, dont Kai Bird, Jia Tolentino et Daniel Okrent, a déposé une plainte devant un tribunal fédéral de New York. Ils y accusent l'entreprise d'avoir illégalement exploité leurs œuvres littéraires, sous forme de versions numériques piratées, pour entraîner son modèle d'intelligence artificielle générative baptisé Megatron. Cette action en justice marque une escalade significative dans le débat croissant autour de l'utilisation de contenus protégés par le droit d'auteur pour le développement des systèmes d'IA.

Pourquoi Microsoft est-il poursuivi en justice ?

La plainte déposée par Kai Bird, Jia Tolentino, Daniel Okrent et plusieurs autres auteurs allègue que Microsoft a sciemment utilisé une vaste collection de livres numériques obtenus illégalement pour former son algorithme d'intelligence artificielle, Megatron. Ce modèle est conçu pour générer des réponses textuelles à des requêtes humaines, et sa capacité à imiter la syntaxe, la voix et les thèmes d'œuvres protégées serait directement liée à l'absorption de ces contenus piratés. Les auteurs affirment que l'entreprise a non seulement bâti son modèle sur le travail acharné de milliers de créateurs, mais qu'elle l'a également entraîné à produire du contenu qui imite, voire concurrence, leurs propres styles d'écriture. Cette utilisation non autorisée est au cœur de l'accusation, les plaignants recherchant une injonction pour bloquer cette infraction et des dommages-intérêts substantiels pour chaque œuvre prétendument utilisée à mauvais escient.

Microsoft Surface Pro (11e?me e?dition)

Quelles sont les accusations précises portées contre Microsoft ?

Les plaignants ont précisé dans leur dossier que l'entraînement de Megatron aurait impliqué l'utilisation de près de 200 000 livres piratés. Ce "jeu de données piraté" aurait permis à l'IA de développer une capacité à générer un large éventail d'expressions qui "imitent la syntaxe, la voix et les thèmes des œuvres protégées par le droit d'auteur sur lesquelles elle a été formée". L'argument central des auteurs est que leur production créative a été exploitée sans leur consentement ni compensation, afin de construire un produit qui entre directement en concurrence avec eux sur le marché. Ils cherchent à obtenir jusqu'à 150 000 dollars de dommages-intérêts légaux pour chaque œuvre prétendument utilisée illégalement. Ce montant, multiplié par le nombre élevé d'œuvres citées, pourrait représenter une somme colossale pour Microsoft, soulignant l'ampleur potentielle de cette violation des droits de propriété intellectuelle.

intelligence artificielle 02

Ce procès s'inscrit-il dans une tendance plus large ?

Absolument. La plainte contre Microsoft n'est pas un cas isolé, mais s'inscrit dans une vague croissante de litiges de grande envergure opposant des créateurs et des entreprises technologiques. Des géants comme Meta Platforms, Anthropic et OpenAI (soutenue par Microsoft) ont tous fait face à des accusations similaires concernant l'utilisation de matériel protégé par le droit d'auteur pour l'entraînement de leurs systèmes d'IA générative. Ce procès survient d'ailleurs juste un jour après une décision importante d'un juge fédéral californien, qui a statué qu'Anthropic avait pu faire un "fair use" du matériel d'auteurs pour l'entraînement, mais restait potentiellement responsable d'avoir piraté leurs livres. Cette première décision américaine sur la légalité de l'utilisation de matériaux protégés sans permission pour l'entraînement d'IA génératives a mis en lumière la complexité juridique du problème et la nécessité de définir des frontières claires.

Intelligence artificielle écrivain 2

Quelles sont les implications de cette affaire pour l'avenir de l'IA ?

Le procès intenté à Microsoft représente un moment charnière pour l'industrie de l'intelligence artificielle et l'avenir de la propriété intellectuelle. Les entreprises technologiques soutiennent que l'utilisation de matériel protégé par le droit d'auteur pour entraîner leurs IA relève du "fair use" en vertu de la loi américaine, arguant que cela permet de créer du contenu nouveau et transformateur, et que les obliger à payer pour chaque œuvre freinerait l'essor de cette industrie naissante. À l'opposé, les détenteurs de droits d'auteur estiment que cette approche porte atteinte à leur contrôle sur leurs œuvres et en dévalue le travail créatif. L'issue de cette affaire pourrait établir un précédent juridique majeur, non seulement pour Microsoft, mais aussi pour toutes les autres entreprises développant des IA génératives. Les tribunaux sont désormais chargés de définir des limites claires quant à ce qui constitue une utilisation éthique et légale des données dans l'entraînement des modèles d'IA, un enjeu qui aura des répercussions profondes sur l'innovation, la rémunération des créateurs et la régulation du secteur.

FAQ

  • Qu'est-ce que le modèle d'IA "Megatron" de Microsoft ?


    Megatron est un modèle d'intelligence artificielle développé par Microsoft, conçu pour générer des réponses textuelles à partir de requêtes humaines. Les auteurs l'accusent d'avoir été entraîné avec des livres piratés.
  • Qu'est-ce que le "fair use" dans le contexte de l'IA et du droit d'auteur ?


    Le "fair use" est une doctrine du droit d'auteur américain qui permet l'utilisation limitée de matériel protégé sans permission à des fins telles que la critique, le commentaire, les reportages, l'enseignement ou la recherche. Les entreprises d'IA l'invoquent pour justifier l'entraînement de leurs modèles avec de vastes quantités de données, y compris du contenu protégé.
  • Quelles sont les sommes réclamées par les auteurs ?


    Les auteurs réclament une injonction pour bloquer l'infraction de Microsoft et des dommages-intérêts légaux pouvant atteindre 150 000 dollars pour chaque œuvre que Microsoft aurait utilisée sans autorisation.