Comme nous le montre le récent partenariat entre la NARA et Google, l'archivage est à la mode. L'occasion de vous présenter ou rappeler l'existence d'un projet dédié à la sauvegarde d'une partie du patrimoine du Web.

PetaboxFondée en 1996, l' Internet Archive est une association à but non lucratif basée à San Francisco dont l'objectif est, comme son nom l'indique, l'archivage d' Internet.

Pour se faire, l'association a mis le paquet. Si pour l'instant le stockage est à la charge de centaines de serveurs qui tournent sous Linux, l'association compte utiliser rapidement une machine du nom de PetaBox pour sauvegarder et traiter un pétaoctet d'information, soit environ 1 million de Go ( un cluster de 800 PCs qui turbinent à fond ).

En 6 ans, l'association a classé près de 55 milliards de pages Web que l'on peut consulter via une interface, la Wayback Machine. Dès lors, vous embarquez sur une véritable machine à remonter le temps et accrochez vous bien, les découvertes risquent d'être cocasses.

Pour se faire, il faut entrer l' URL d'un site dont vous souhaitez retracer l'historique ( pas de recherche par mots clés ). Ainsi, il est possible de retrouver des pages qui ont totalement disparues du Web ou encore de visualiser les anciennes versions de certains sites ( le vôtre y est peut-être ) et c'est là que l'on s'aperçoit des progrès de la conception Web et de l'infographie.

Naissance google

Oh ! Bébé Google ( il a bien grandi depuis )


Petit bémol, la Wayback Machine est assez lente et ne donne pas les résultats escomptés à tous les coups.

Un autre aspect intéressant du site est la possibilté de récupérer certains logiciels dans des versions antérieures à celles disponibles aujourd'hui. Utile notamment lorsqu'un soft est passé du statut de freeware à celui de shareware, ou qu'une fonctionnalité ou carrément le logiciel a disparu.

En outre, l' Internet Archive propose des enregistrements vidéos, audios, des captures d'écran, ... .

Combiné avec le cache de Google, cet outil peut s'avérer pratique pour partir à la recherche d'un passé somme toute pas si éloigné.
Si le projet est enthousiasmant, il nécessiterait cependant quelques arrangements ( un peu fouilli ).

Consulter le site
Les débuts de GNT (Le Doc : euh, j'ai jamais dit que j'étais doué côté graphismes !!)

Internet archive