En début de mois, Google a intégré la possibilité de générer des images photoréalistes par IA dans son chatbot Gemini (anciennement Bard). Une capacité qui s'appuie sur le modèle Imagen 2 de Google DeepMind et qui se retrouve également dans l'outil ImageFX.

Via un simple prompt textuel, cette création d'images dans Gemini est actuellement réservée à l'anglais (et pas en Europe). Sur un aspect particulier, elle connaît un soudain coup d'arrêt. En l'occurrence, pour la génération d'images de personnes qui vient d'être suspendue.

" La génération d'images par l'IA de Gemini donne lieu à un large éventail de personnes. Et c'est généralement une bonne chose, parce que des gens du monde entier l'utilisent. Mais nous avons raté notre coup ici. "

Elon Musk s'empare de la polémique

Hier, Google a été contraint de s'excuser pour des erreurs notamment historiques avec certaines images générées à l'aide de Gemini. Des soldats allemands de 1943, des vikings ou encore les Pères fondateurs des États-Unis ont pu être représentés par des personnes noires ou d'origine asiatique, par exemple.

Plus globalement, Gemini s'est emmêlé les pinceaux pour tout ce qui touche à la diversité et au genre. Cela a donné du grain à moudre à Elon Musk qui a sauté sur l'occasion pour pointer une énième fois du doigt un " virus woke "… et faire la promotion de son IA Grok sur X.

Avec l'objectif louable de mieux refléter la diversité du monde dans l'entraînement de son modèle, Google a eu maille à partir avec des incohérences historiques et planche sur un correctif pour éviter des écueils.

Bientôt de retour en version améliorée

" Dans le cadre de nos principes d'IA, nous concevons nos capacités de génération d'images de manière à refléter notre base d'utilisateurs mondiale, et nous prenons au sérieux la représentation et les préjugés ", écrit Jack Krawczyk.

Le directeur de produit chez Google en charge de Gemini (Bard) ajoute que si " les images d'une personne promenant un chien sont universelles ", les " contextes historiques sont plus nuancés. " Davantage d'adaptation à ces contextes est annoncée.