Une panne majeure au sein d'Amazon Web Services (AWS), localisée dans sa région stratégique US-EAST-1, a provoqué une onde de choc sur l'internet mondial.

Des plateformes comme Snapchat et Fortnite aux services bancaires, l'incident a mis en lumière la dépendance critique de l'écosystème numérique envers une poignée d'acteurs de l'infrastructure cloud.

L'alerte a été donnée aux premières heures de la journée, lorsque le site de suivi Downdetector a vu ses graphiques virer au rouge pour des centaines de services en ligne.

panne AWS Downdetector

Les services en rouge sur Downdetector après la panne AWS

L'épicentre du problème a rapidement été identifié : une défaillance opérationnelle au sein de la région US-EAST-1 d'AWS, située en Virginie du Nord, l'un des plus importants centres de données au monde.

Qu'est-ce qu'AWS et pourquoi sa stabilité est-elle si cruciale ?

Pour beaucoup, Amazon est avant tout un géant du e-commerce. Pourtant, sa division la plus rentable est Amazon Web Services, le leader incontesté du marché de l'infrastructure cloud.

logo-amazon-web-services

AWS ne vend pas de produits physiques, mais loue de la puissance de calcul, du stockage et des bases de données à des millions d'entreprises, des start-ups aux multinationales.

Cette offre permet aux entreprises de ne pas avoir à construire et maintenir leurs propres centres de données, un investissement colossal. En s'appuyant sur l'infrastructure d'Amazon, elles bénéficient d'une flexibilité et d'une puissance quasi illimitées.

Le revers de la médaille est une centralisation massive : quand un pilier comme AWS vacille, c'est une large partie de l'édifice internet qui tremble avec lui.

Un effet domino paralysant l'écosystème numérique

La liste des victimes de cet incident donne le vertige et illustre parfaitement cet effet domino. Les premiers touchés ont été les services de divertissement : les joueurs de Fortnite et Roblox se sont retrouvés dans l'incapacité de se connecter, tandis que les utilisateurs de Snapchat ne pouvaient plus envoyer de messages.

Fortnite 01

Les outils de productivité comme Canva ou Airtable ont également subi d'importantes perturbations, impactant des milliers de professionnels.

L'onde de choc ne s'est pas arrêtée là. Des services aussi variés que la plateforme d'échange de cryptomonnaies Coinbase, l'application du New York Times ou même les sonnettes connectées Ring d'Amazon ont été mis hors service.

Plus inquiétant encore, des institutions financières comme Lloyds et Halifax au Royaume-Uni ont signalé des difficultés d'accès à leurs services bancaires en ligne, confirmant que le problème était de nature globale.

La course contre la montre pour un retour à la normale

Face à la crise, les ingénieurs d'Amazon ont été immédiatement mobilisés. Les premières communications faisaient état de "taux d'erreur élevés et de latences" affectant plusieurs services dans la région US-EAST-1.

Le coupable a été identifié comme étant DynamoDB, un service de base de données NoSQL essentiel au fonctionnement de nombreuses applications.

Amazon a communiqué sur sa page de statut, expliquant avoir identifié une "cause racine potentielle" liée à un problème de résolution DNS. La firme a précisé travailler sur "plusieurs pistes parallèles pour accélérer la reprise".

Après plusieurs heures d'incertitude, les services ont progressivement montré des "signes significatifs de rétablissement", bien qu'un important retard dans le traitement des requêtes ait dû être résorbé.

Cet incident, loin d'être le premier du genre pour AWS, repose une nouvelle fois la question de la résilience de l'internet. Si la rapidité de la reprise témoigne de l'expertise technique des équipes, la panne initiale met en évidence le talon d'Achille d'un web de plus en plus centralisé.

Pour de nombreuses entreprises, la diversification des fournisseurs cloud pourrait devenir plus qu'une option, mais une nécessité stratégique pour l'avenir.