Protocol Buffers : le format de données de Google est ouvert

Publié le 11 juillet 2008 à 14:15 par Fabien B.

Lire sur mobile

Google ouvre à nouveau un de ses outils utilisé en interne : Protocol Buffers. Sous ce nom se cache rien de moins que la langage mis au point et utilisé par Google pour l'échange et l'indexation d'Internet par le moteur de recherche. Un langage simple, compilé en classes Java, C++ et Python, avec des performances 20 à 100 supérieures au XML : voilà ce que propose Google avec PB.

Google continue de tendre la main vers le Libre. Si récemment, nous vous parlions du Google Summer Of Code 2008, regroupant toujours plus de participants financés par la firme de Mountain View, nous avions également évoqué le cas de RatProxy, un outil développé en interne et publié sous la permissive licence Apache.

C'est à nouveau un outil interne qui est aujourd'hui publié par Google, et c'est toujours la licence Apache qui a été choisie. Troisième point commun avec RatProxy : il s'agit d'un outil destiné avant tout aux développeurs. Néanmoins, la portée est potentiellement très importante. Google propose son Protocol Buffers, un format de données présenté comme une alternative au standard XML. Ce dernier est aujourd'hui très utilisé et ce, dans presque tous les domaines (échange de données, balisage, formats de documents comme OpenDocument, SVG, MathML et même langages dérivés...) et Google n'entend pas forcément le remplacer mais proposer une solution plus adaptée à l'échange de gros volumes de données.

Des données compilées pour des performances élevées
Le code est présenté comme simple à utiliser et à mettre en place. Google annonce une compacité de 3 à 10 fois supérieure à celle du XML, et surtout un langage de 20 à 100 plus rapide. La société fournit des outils pour compiler des données générées dans le format Protocol Buffers en classes Java, C++ et Python. Une bibliothèque est proposée pour les traitements les plus courants : parcours des données, transmission de messages... Notons également qu'il est possible de convertir du PB vers du XML ou du JSON et inversement.

L'outil semble mâture, puisqu'il est utilisé en interne par Google pour organiser ses données, notamment celles qu'il indexe. Des exemples et explications détaillées sont disponibles sur le site du projet. Si la solution est très alléchante, il est encore très tôt pour prédire ses possibles retombées.

Source : Google OpenSource