OVH Cloud OVH Cloud

Plantage sans raison apparente

2 réponses
Avatar
Nicolas BERNE
Bonjour à tous,

J'ai mon athlon 600 (kernel 2.4.21) qui a planté aujourd'hui 2 fois sans
raison apparente.
Rien dans les logs : j'ai un fichier log "spécial" /var/log/all qui
enregistre tout (ligne *.* /var/log/all dans /etc/sylog.conf) et syslogd
est lancé avec l'option -m 1 (une marque toutes les minutes).

1er plantage (qui a eu lieu entre 10:08:35 et 10:09:35) :
Jul 14 10:07:35 melkor -- MARK --
Jul 14 10:08:35 melkor -- MARK --
Jul 14 12:11:41 melkor syslogd 1.4.1: restart.
Jul 14 12:11:42 melkor kernel: klogd 1.4.1, log source = /proc/kmsg started.
Jul 14 12:11:42 melkor kernel: Linux version 2.4.21 (root@melkor) (version gcc 3.2.2) #1 sam jun 14 11:19:36 RET 2003

2d plantage (entre 15:47:45 et 15:48:45) :
Jul 14 15:46:45 melkor -- MARK --
Jul 14 15:47:45 melkor -- MARK --
Jul 14 16:17:34 melkor syslogd 1.4.1: restart.
Jul 14 16:17:35 melkor kernel: klogd 1.4.1, log source = /proc/kmsg started.
Jul 14 16:17:35 melkor kernel: Linux version 2.4.21 (root@melkor) (version gcc 3.2.2) #1 sam jun 14 11:19:36 RET 2003

Je n'étais pas devant la machine lors de 2 plantages mais il n'y avait
rien de vraiment spécial de lancé (juste un transcode). Les 2 ventilos
du processeur tournent bien (~ 7000 rpm) donc je ne pense pas que ça
vienne d'une surchauffe du CPU.
J'ai lancé un memtest (une seule passe), ainsi que badblocks sur mes
disques et aucune erreur.

J'ai cette machine depuis 1 an (une occasion) et ce genre de plantage
sans raison ne s'était jamais produit.

Si quelqu'un a une idée.

A+

--
"Why stand on a silent platform - Fight the war, Fuck the norm" - RATM, 1992

2 réponses

Avatar
Nicolas BERNE
Thus Spoke Sébastien Cottalorda :
Salut,

J'ai eu exactement le même problème avec 4 de mes ordinateurs.
Un arrêt brutal (écran figé), les ventilos tournent, mais rien.
Tout juste le ctrl-alt-supp (et encore si tu ne l'as pas détourné).
Au niveau des logs => rien.

Cela venait du disque dur. Lorsqu'il se plante, il est anormalement
silencieux. D'habitude, on l'entend toujours un petit peu, mais là, rien.

Je ne sais pas quoi te conseiller d'autre.
Moi j'ai du changer de disque dur à chaque fois => cela a réglé mon
problème.
Salut,


La prochaine fois, je regarderai (ou plutot j'écouterai) mes disques.
Mais j'espere que ça ne vient pas d'eux car ils sont tous les 2 neufs (-
de 2 mois) !!
Il s'agit un Maxtor de 40Go (6E040L0) et d'un WesternDigital de 80 Go
(WD800BB-00CAA1).

Est-ce que chez toi, un smartctl -a /dev/hdX donne des "Errors Logged".
Pour mes 2 disques, aucune erreur :
# smartctl -a /dev/hda|grep Errors
No Errors Logged

# smartctl -a /dev/hdb|grep Errors
No Errors Logged

A+

--
"Why stand on a silent platform - Fight the war, Fuck the norm" - RATM, 1992

Avatar
ballen
La prochaine fois, je regarderai (ou plutot j'écouterai) mes disques.
Mais j'espere que ça ne vient pas d'eux car ils sont tous les 2 neufs (-
de 2 mois) !!
Il s'agit un Maxtor de 40Go (6E040L0) et d'un WesternDigital de 80 Go
(WD800BB-00CAA1).

Est-ce que chez toi, un smartctl -a /dev/hdX donne des "Errors Logged".
Pour mes 2 disques, aucune erreur :
# smartctl -a /dev/hda|grep Errors
No Errors Logged

# smartctl -a /dev/hdb|grep Errors
No Errors Logged


I suggest you download smartmontools:
http://smartmontools.sourceforge.net/
and then run some self-tests:
smartctl -t long /dev/hda
wait until it finishes, then
smartctl -a /dev/hda
to see the results.