Pour Microsoft, NLWeb (Natural Language Web) sera ce que HTML est au Web traditionnel. L'ambition est ainsi que ce nouveau projet open source joue un rôle similaire à celui du HTML pour un Web devenu agentique.
« NLWeb permet aux sites web de proposer facilement une interface conversationnelle aux utilisateurs, en utilisant le modèle de leur choix et leurs propres données. Cela permet aux utilisateurs d'interagir directement avec le contenu web de manière riche et sémantique. »
Autrement dit, NLWeb structure les contenus pour qu'ils soient compréhensibles et utilisables par des agents conversationnels animés par l'IA. Les utilisateurs peuvent alors poser des questions ou donner des instructions directement en langage naturel à des chatbots IA, et recevoir des réponses contextualisées, précises et pertinentes, basées sur le contenu du site.
Transformer un site web en application IA
Microsoft souligne que chaque instance NLWeb est également un serveur ayant recours au protocole MCP (Model Context Protocol). Ce protocole ouvert soutenu par Anthropic permet une intégration transparente entre des applications utilisant de grands modèles de langage, des sources de données ou des outils externes.
S'il le souhaite, un site peut alors rendre son contenu découvrable et exploitable par des agents IA, ainsi qu'à d'autres participants de l'écosystème MCP.
« Notre objectif est que NLWeb soit le moyen le plus rapide et le plus simple de transformer efficacement un site web en une application IA, permettant aux utilisateurs d'interroger le contenu du site en langage naturel, tout comme avec un assistant IA ou Copilot », résume encore Microsoft.
Un projet agnostique technologiquement
NLWeb s'appuie sur des formats de données semi-structurés comme Schema.org, RSS et d'autres données que les sites web publient déjà. Ils sont combinés à la puissance de modèles de langage pour créer des interfaces en langage naturel à la fois utilisables par les humains et les agents IA.
Le système va plus loin en enrichissant les données structurées avec des connaissances externes fournies par les modèles de langage sous-jacents. Un exemple cité est l'ajout d'informations géographiques à une requête concernant un restaurant.
En tant que projet ouvert, NLWeb est présenté profondément agnostique technologiquement parlant, que ce soit en matière de plateformes, de bases de données vectorielles, de LLM. Il n'y a pas de favoritisme et le choix est laissé aux développeurs selon leurs préférences et contraintes. NLWeb peut aussi être perçu comme un moyen de « décentraliser » la nouvelle interaction avec les contenus.
Le niveau d'adoption fera loi
Le code source et la documentation pour NLWeb sont disponibles sur le dépôt GitHub du projet qui va bien au-delà du cas de Microsoft… même si le groupe de Redmond aura évidemment beau jeu de faire la promotion de ses propres solutions IA.
Le niveau d'adoption de NLWeb décidera s'il a réellement le potentiel de démocratiser le Web agentique. Microsoft dresse une liste d'acteurs qui participent au lancement de NLWeb : Chicago Public Media, Common Sense Media, DDM (Allrecipes/Serious Eats), Eventbrite, Hearst (Delish), Inception Labs, Milvus, O'Reilly Media, Qdrant, Shopify, Snowflake et Tripadvisor.
« Nous considérons NLWeb comme un élément essentiel d'un écosystème ouvert de protocoles et d'outils qui façonneront la prochaine évolution d'internet. […] En implémentant cette technologie dès le début, nous rappelons à notre public averti qu'il n'est pas nécessaire d'abandonner la promesse originelle du Web décentralisé pour bénéficier des avantages de l'IA conversationnelle », déclare le patron et fondateur d'O'Reilly.