Cofondateur de DeepMind et d'Inflection AI, Mustafa Suleyman est à la tête de la division Microsoft AI depuis le mois de mars dernier. Lors de l'Aspen Ideas Festival, il a été interrogé par un journaliste de CNBC sur l'entraînement des modèles d'IA grâce à des contenus provenant du Web, avec en filigrane la question de la propriété intellectuelle.

En ce qui concerne le contenu déjà présent sur le Web, et entrant dans le cadre d'un internet ouvert et accessible à tous, le patron de l'IA chez Microsoft ose une comparaison avec un freeware (ou logiciel gratuit).

" Le contrat social de ce contenu depuis les années 90 est le fair use. Tout le monde peut le copier, le recréer, le reproduire. " La politique de fair use pour un usage acceptable ou équitable ne relevant pas d'une infraction du droit d'auteur est souvent brandie par des entreprises d'IA pour légitimer l'exploitation de certaines données d'entraînement.

Une navigation en zone grise

Mustafa Suleyman reconnaît par contre qu'il existe " une zone grise " nécessitant une évaluation par les tribunaux. Il fait ainsi allusion à une catégorie distincte avec des contenus pour lesquels un site web, un éditeur ou un organe de presse ont déclaré de manière explicite qu'ils refusent une indexation par des moteurs de recherche.

Le chercheur britannique en intelligence artificielle semble plutôt à l'aise sur le sujet et serein. Pourtant, OpenAI et son principal investisseur Microsoft ont maille à partir aux États-Unis avec une série de plaintes de médias leur reprochant des violations de droits d'auteur.

La commercialisation de produits comme ChatGPT d'OpenAI et Copilot de Microsoft est pointée du doigt par des éditeurs de grands journaux américains. Ceux-ci estiment qu'elle a pour origine " le vol de millions d'articles protégés par droit d'auteur, sans autorisation ni paiement. "

En marge de la signature d'accords

Les déclarations de Mustafa Suleyman ne sont pas de nature à apaiser le débat. Dans le même temps, OpenAI multiplie les accords avec des groupes de médias. Pour l'entraînement des modèles d'IA et pour répondre aux questions d'utilisateurs avec ChatGPT, de tels accords donnent accès à des contenus actuels et archivés de divers titres de presse.