Le 21 avril dernier, le cloud d'Amazon a fait le coup de la panne aux États-Unis. Cette panne d'Amazon Web Services a duré plusieurs jours. Les conséquences les plus visibles ont été des problèmes de lenteur et des erreurs observés avec certains services populaires à l'instar de Foursquare ( géolocalisation ), Quora ( questions-réponses ) ou encore du site communautaire  Reddit.

La durée de cette panne peut être constatée sur le tableau de bord d'Amazon Web Services. Seule la région Amérique du Nord a été touchée. Jusqu'au 24 avril, on parlait d'une interruption de service localisée dans un centre de données dans l'État de Virginie. Puis, la situation a commencé à s'améliorer pour laisser place à des problèmes de performances le 25 avril.

Pas d'attaque informatique ou de problème de sécurité, selon les longues explications d'Amazon la source du problème est un changement de configuration qui avait été initié afin d'étendre la capacité du réseau primaire. De nombreux processus sont certes mis en jeu, mais il est finalement assez " rassurant " d'entendre que l'erreur est surtout humaine plutôt qu'autre chose.

Bien évidemment, Amazon va tirer les conséquences de cette panne afin de procéder à diverses améliorations. Cette panne est intervenue dans un contexte de grande promotion du cloud computing et sonne comme un rappel sur les risques de cette technologie, d'autant que certaines données ont été définitivement perdues en dépit de mécanismes de réplication.

En l'occurrence, même des tentatives de restauration manuelle de certaines données ont échoué. Le volume de données concernées serait toutefois très faible et les clients ont été avertis. Pour tous les clients qui utilisent les serveurs de l'Est des USA, Amazon va offrir un crédit de dix jours d'utilisation.

" Nous présentons nos excuses. Nous savons à quel point nos services sont essentiels pour nos clients et nous ferons tout ce que nous pouvons afin de tirer les enseignements de cet événement et améliorer nos services "

, déclare Amazon.