En marge de l'introduction de Bing Chat Enterprise pour les professionnels, Microsoft annonce le déploiement de capacités multimodales pour Bing Chat qui est accessible gratuitement pour le commun des utilisateurs. Il s'agit en l'occurrence de l'ajout de la recherche visuelle.
La recherche visuelle s'appuie sur le modèle GPT-4 d'OpenAI. Rappelons que l'agent conversationnel animé par l'IA est basé sur GPT-4, avec des techniques d'apprentissage supervisé et par renforcement pour un affinement. Bing Chat dispose d'un accès à internet pour des réponses récentes.
Il est désormais possible avec Bing Chat de soumettre des images depuis un appareil ou à partir d'une URL, puis de rechercher sur le Web des contenus connexes. Microsoft souligne que Bing Chat est en mesure de comprendre le contexte d'une image, l'interpréter et répondre à des questions en rapport.
La concurrence avec Bard de Google
Le déploiement de la recherche visuelle avec Bing Chat est en cours, à la fois sur ordinateur et avec l'application mobile Bing. Ultérieurement, la recherche visuelle dans Bing Chat sera également proposée avec Bing Chat Enterprise.
Now you can upload images to Bing Chat and harness the power of the web. Learn more: https://t.co/2RE9Wsmyav pic.twitter.com/YXpmB7XT9N
— Bing (@bing) July 18, 2023
Un tel déploiement à grande échelle pour Bing Chat intervient alors que Google permet depuis peu d'utiliser et analyser des images pour les requêtes avec Bard, mais uniquement en anglais pour le moment.
Fonctionnant sur le modèle de langage PaLM 2, le service d'IA conversationnelle de Google est disponible en France et en Europe depuis seulement la semaine dernière.