Pour les éditeurs de sites web, Google annonce la mise en place d'un outil et nouveau contrôle Google-Extended. " En utilisant Google-Extended pour contrôler l'accès au contenu d'un site, l'administrateur du site peut choisir d'aider nos modèles d'IA à devenir plus précis et plus performants au fil du temps. "

Via les API, cette contribution à l'entraînement des modèles d'IA générative de Google concerne Bard et la plateforme de machine learning Vertex AI. Google souligne que le contrôle proposé comprend les futures générations de modèles.

À placer dans les fichiers robots.txt

Google-Extended est proposé par l'intermédiaire des fichiers robots.txt. Ils sont surtout connus pour la gestion de l'indexation par le moteur de recherche Google. En l'occurrence, un site pourra donc refuser que son contenu serve à l'entraînement des modèles d'IA de Google.

" Rendre des contrôles simples et évolutifs, comme Google-Extended, disponibles via robots.txt est une étape importante vers la transparence et le contrôle que tous les fournisseurs de modèles d'IA devraient, selon nous, mettre à disposition ", écrit Google.

Sans entrer dans les détails, le groupe ajoute qu'il s'engage à collaborer avec les divers acteurs concernés, afin d'explorer d'autres approches en matière de choix et de contrôle pour les éditeurs de sites web.

Probablement à améliorer

En filigrane, c'est l'aveu que la solution actuellement proposée avec Google-Extended nécessite d'être améliorée. La situation est susceptible de paraître inconfortable pour certains sites, avec l'impression de jouer avec le feu, au risque de se priver d'une exploration et indexation par les robots de Google.

Ce n'est pas tout à fait la même chose de vouloir seulement écarter des contenus de l'entraînement des modèles d'IA. Par ailleurs, il est à souligner que c'est une option de retrait qui ne reflète pas le comportement par défaut.

google-bard

Récemment, Google a reconnu un problème d'indexation par son moteur de recherche d'échanges avec Bard ayant fait l'objet d'un partage par le biais d'un lien public. Il vient d'être corrigé.