Outlook.com et Hotmail : panne de 16 heures pour une surchauffe

Le par  |  10 commentaire(s) Source : Blog Outlook
Outlook

Une surchauffe dans l'un des datacenters de Microsoft est à l'origine de l'impossibilité d'accès à Outlook.com et Hotmail pour des utilisateurs. Une panne qui a duré près de 16 heures.

En présentant ses excuses les plus sincères, Microsoft revient sur l'incident qui a touché Outlook.com et Hotmail, et que nous avions signalé dans nos colonnes. Une interruption de service prolongée qui a débuté le mardi 12 mars à 21h35 pour un retour complet à la normale daté au mercredi 13 mars à 13h43.

Cet incident de plus de 16 heures - une durée rare - tombe plutôt mal dans la mesure où Microsoft opère la grande migration des utilisateurs depuis Hotmail vers Outlook.com. Dans ses explications, Arthur de Haan de Microsoft ne précise toutefois pas un ordre de grandeur pour le nombre d'utilisateurs réellement impactés.

Il est ainsi à souligner que si des utilisateurs ont connu des soucis pour la consultation de leurs emails, d'autres n'ont constaté aucun problème particulier pendant ces 16 heures.

Microsoft-etat-servicesL'incident a pour origine une mise à jour firmware qui a été déployée dans un centre de données. Elle avait déjà été déployée précédemment avec succès mais a causé un " pic de température rapide et important " dans le datacenter.

Cette surchauffe a entraîné l'activation de mesures de protection pour un grand nombre de serveurs et pour conséquence d'empêcher l'accès à certaines boîtes emails. Le service SkyDrive a également été touché.

Microsoft indique qu'une intervention humaine a été nécessaire pour le retour en ligne des services, ce qui a évidemment retardé la procédure de restauration. " La nécessité de ce genre d'intervention humaine n'est pas la norme pour nos services. "

Comme c'est toujours le cas après un tel pépin, Microsoft déclare faire tout le nécessaire afin que cela ne se reproduise plus à l'avenir. L'état de ses services peuvent être consultés sur cette page.


Consulter notre présentation d'Outlook.com

Complément d'information

Vos commentaires

Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Le #1226062
Si tout le monde s'y met en même temps c'est sûr que ça va coincer....
ça chauffe Marcel...;
Le #1226142

Ah ben il a fallu faire ça à l'ancienne ... à la main ... le temps de trouver un technicien

Les cols blancs de chez Microsoft ne savent même plus rebooter un serveur ?
Anonyme
Le #1226182
Une mise à jour qui crée une surchauffe ?
Le #1226252
16 heures sans mon hotmail! J'ai failli mourir!
Le #1226342
ignace72 a écrit :

Une mise à jour qui crée une surchauffe ?


Je vois pas du tout ce qu'il y a d'improbable...

Si le codage est mauvais, non optimisé, ça peut faire mouliner le CPU, lui faire faire de grandes quantités d'opérations inutiles (d'où la nécessité d'optimiser le code) et donc créer une surchauffe.

Installe Intel Burn Test, tu vas voir qu'un logiciel peut faire chauffer un CPU ! (sauf que pour ce logiciel c'est volontaire, alors que pour le firmware en question c'était involontaire !).

Il y a aussi l'exemple de certains jeux qui trouvent le moyen de ramer sur des PC très puissants (comme GTA 4), preuve qu'un code mal optimisé peut faire mouliner (donc chauffer) un ordi.
Anonyme
Le #1226372
Arnaud78 a écrit :

ignace72 a écrit :

Une mise à jour qui crée une surchauffe ?


Je vois pas du tout ce qu'il y a d'improbable...

Si le codage est mauvais, non optimisé, ça peut faire mouliner le CPU, lui faire faire de grandes quantités d'opérations inutiles (d'où la nécessité d'optimiser le code) et donc créer une surchauffe.

Installe Intel Burn Test, tu vas voir qu'un logiciel peut faire chauffer un CPU ! (sauf que pour ce logiciel c'est volontaire, alors que pour le firmware en question c'était involontaire !).

Il y a aussi l'exemple de certains jeux qui trouvent le moyen de ramer sur des PC très puissants (comme GTA 4), preuve qu'un code mal optimisé peut faire mouliner (donc chauffer) un ordi.


Qu'un logiciel fasse chauffer un CPU, Boinc le fait bien aussi mais sur un serveur M$, n'ont-il pas testé le truc avant ?
Le #1226412
ignace72 a écrit :

Arnaud78 a écrit :

ignace72 a écrit :

Une mise à jour qui crée une surchauffe ?


Je vois pas du tout ce qu'il y a d'improbable...

Si le codage est mauvais, non optimisé, ça peut faire mouliner le CPU, lui faire faire de grandes quantités d'opérations inutiles (d'où la nécessité d'optimiser le code) et donc créer une surchauffe.

Installe Intel Burn Test, tu vas voir qu'un logiciel peut faire chauffer un CPU ! (sauf que pour ce logiciel c'est volontaire, alors que pour le firmware en question c'était involontaire !).

Il y a aussi l'exemple de certains jeux qui trouvent le moyen de ramer sur des PC très puissants (comme GTA 4), preuve qu'un code mal optimisé peut faire mouliner (donc chauffer) un ordi.


Qu'un logiciel fasse chauffer un CPU, Boinc le fait bien aussi mais sur un serveur M$, n'ont-il pas testé le truc avant ?


Ah bah ça c'est l'éternelle question qu'on se pose dès qu'un produit informatique (pas seulement les ordis) sort buggé !

On pourrait poser la même question à Apple quand ils sortent une mise à jour d'iOS qui fait fondre l'autonomie de l'iPhone et qu'ils sont obligés de sortir un correctif en urgence quelques jours après...
Le #1226482
ca veut donc dire que le datacenter n'est pas dimensionné suffisamment ? Il me semblait que l'interet du cloud et vm etait en partie de sauvegarder de l'nrj en utilisant au max les capa des serveurs
Si pour pas que le datacenter explose tout doit tourner à 50% y'a comme un soucis
Le #1226502
tiseult a écrit :

ca veut donc dire que le datacenter n'est pas dimensionné suffisamment ? Il me semblait que l'interet du cloud et vm etait en partie de sauvegarder de l'nrj en utilisant au max les capa des serveurs
Si pour pas que le datacenter explose tout doit tourner à 50% y'a comme un soucis


Sauf que généralement maintenant, grâce à la virtualisation, on crée des "pools" de serveurs hébergeant des hyperviseurs, permettant de répartir la charge sur des "blade masters" (contenant des serveurs "lames") pour faire bosser de façon équilibrée toutes les blades du parc.
Si un firmware a été mal conçu et que la répartition de charge ne se fait pas bien, il se peut très bien que certaines baies surchauffent quand d'autres sont utilisées à 10%, on ne sait pas (en tout cas dans cet article) de quel firmware il est question.
Il faut savoir qu'un serveur seul, dans de bonnes conditions, ne surchauffera pas. Des centaines de serveurs empilés dans un endroit confiné, même étudié pour, auront la fâcheuse habitude de tendre vers une surchauffe

Si ça se trouve c'est juste le firmware du système de climatisation hein
Le #1227132
Nerthazrim a écrit :

tiseult a écrit :

ca veut donc dire que le datacenter n'est pas dimensionné suffisamment ? Il me semblait que l'interet du cloud et vm etait en partie de sauvegarder de l'nrj en utilisant au max les capa des serveurs
Si pour pas que le datacenter explose tout doit tourner à 50% y'a comme un soucis


Sauf que généralement maintenant, grâce à la virtualisation, on crée des "pools" de serveurs hébergeant des hyperviseurs, permettant de répartir la charge sur des "blade masters" (contenant des serveurs "lames") pour faire bosser de façon équilibrée toutes les blades du parc.
Si un firmware a été mal conçu et que la répartition de charge ne se fait pas bien, il se peut très bien que certaines baies surchauffent quand d'autres sont utilisées à 10%, on ne sait pas (en tout cas dans cet article) de quel firmware il est question.
Il faut savoir qu'un serveur seul, dans de bonnes conditions, ne surchauffera pas. Des centaines de serveurs empilés dans un endroit confiné, même étudié pour, auront la fâcheuse habitude de tendre vers une surchauffe

Si ça se trouve c'est juste le firmware du système de climatisation hein


oui je sais bien tout ca,
mais les blades étant faites pour bosser à 100% de charge et donc de chauffe en cas de besoin.

Ce que je veux dire c que si leur infra est utilisé à 100% pour le vrai fonctionnement ca va chauffer pareil qu'à 100% à cause d'une merde.
Et donc le datacenter est mal dimensionné (son refroidissement en tout cas)

Suivre les commentaires
Poster un commentaire
Anonyme
:) ;) :D ^^ 8) :| :lol: :p :-/ :o :w00t: :roll: :( :cry: :facepalm:
:andy: :annoyed: :bandit: :alien: :ninja: :agent: :doh: :@ :sick: :kiss: :love: :sleep: :whistle: =]