Reboot intempestifs

Le
Vincent H.
Bonjour la liste,

Suite une installation Vendredi de munin et munin-node sur mon
serveur, ce dernier est devenu extremement instable :
- Connexion ssh fermes
- plus de passerelle internet, bref le neant.
je reboot je reprends la main et je dsinstalle munin en me disant que
le problme vient surement de ce nouveau logiciel.

La dsinstallation se passe moyennement bien car suite un
aptitude remove munin munin-node
j'avais encore des executions par /usr/sbin/cron dans mes log (syslog)
je finis de tout virer coup de
dpkg --purge et de locate munin

Cependant, depuis ces operations, mon serveur reboot sans arrt
Peut-tre que munin n'tait pas la cause et que les reboot sont
arrivs en mme temps par pure coincidence alors?

Nanmoins voici mon syslog de l'instant, juste avant un reboot:

Oct 22 09:49:13 thargos ntpd[2774]: synchronized to 88.191.12.184, stratum =
2
Oct 22 09:49:13 thargos ntpd[2774]: kernel time sync enabled 0001
Oct 22 09:58:47 thargos ntpd[2774]: synchronized to 88.191.14.223, stratum =
2
Oct 22 10:12:38 thargos syslogd 1.4.1#18: restart.

un autre

Oct 22 10:13:00 thargos ntpd[4157]: synchronized to 88.191.19.23, stratum 2
Oct 22 10:13:00 thargos ntpd[4157]: kernel time sync enabled 0001
Oct 22 10:17:01 thargos /USR/SBIN/CRON[4297]: (root) CMD ( cd / &&
run-parts --report /etc/cron.hourly)
Oct 22 10:19:05 thargos syslogd 1.4.1#18: restart.

Clairement, je manque d'info.

Je ne sais pas trop o chercher ce qui fait rebooter mon serveur.
Mais c'est souvent suite un /USR/SBIN/CRON

Or j'ai regard dans le crontab du root et je n'ai rien de planifi
qui fasse rebooter la machine toutes les 5 minutes.
D'ailleurs je n'ai pas touch au crontab du root depuis des mois.

Quelqu'un aurait-il une piste s'il vous plait?

Dernire info sur munin. Aprs un updatedb, locate munin me donne a:

[vincent][0]~$ locate munin
/var/cache/apt/archives/munin_1.2.5-1_all.deb
/var/cache/apt/archives/munin-node_1.2.5-1_all.deb
[vincent][0]~$

Donc je pense que de ce ct c'est clean (?)

Merci d'avance!
--
Vincent H
Vos réponses Page 2 / 3
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Vincent H.
Le #9617451
On 10/22/07, Dominique Arpin
reformater la swap avec l'option -c?

mkswap -c /dev/partition




Bon je viens de reformater ma swap

[root][0]/dev$ mkswap -c /dev/hda5
Setting up swapspace version 1, size = 386551 kB
no label, UUID…ba1363-2bf4-4e6a-92a9-9f14a195cf1e

Aucun block defectueux ...

Je vais tester la ram en entier je pense....

--
Vincent H
"Early Optimization is the root of all evil" - Donald Knuth


--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Jean-Michel OLTRA
Le #9617431
Bonjour,


Le lundi 22 octobre 2007, Vincent H. a écrit...


Je vais tester la ram en entier je pense....



Si tu as plusieurs barettes, essaie de les retirer une à une. J'ai déjà
eu ce problème de reboot intempestif. C'était tout bonnement une barette
mémoire défectueuse.

--
jm

A.E.L. Sarl (R.C.S CASTRES 490843240)
http://www.spidboutic.fr



--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Vincent H.
Le #9617381
On 10/23/07, Jean-Michel OLTRA

Bonjour,



Bonjour et merci de ta réponse,

Si tu as plusieurs barettes, essaie de les retirer une à une. J'ai dé jà
eu ce problème de reboot intempestif. C'était tout bonnement une bare tte
mémoire défectueuse.



Alors en fait j'ai vérifié hier soir et je n'ai bien qu'une seule
barrete de 128 Mo.

J'ai éxecuté memtest86+ toute la nuit:

8h30 de tests, 17 passes éxecutées avec succès : 0 erreur.

Que faire?
J'ai regardé un peu les logs de webmin qui m'avait l'air un peu
suspect, je l'ai donc purement et simplement desinstallé lui aussi car
je ne m'en sers plus depuis des mois.

J'ai éteint les autres machines de mon réseau local, mais cela ne chang e rien.
Est-il possible de faire rebooter une machine en la spammant sur le
net? Ai-je un moyen de vérifier cela?

D'autres log peuvent-ils m'aider à comprendre ces reboots?

Je ne sais plus trop où chercher là :-/

Pour rappel, au niveau du hardware, j'ai refait mon swap avec
vérification des blocs défectueux (résultat: aucun bloc défectueux) ,
testé ma ram toute la nuit (0 erreur), et j'ai fait également de la
place sur / (~ 3Go).

Niveau software: désinstallation de munin et de ses dépendances.
désinstallation de webmin.

Je suis un peu perdu là...

Merci encore pour toute votre aide.

--
Vincent H
"Early Optimization is the root of all evil" - Donald Knuth
Jean-Michel OLTRA
Le #9617351
Bonjour,


Le mardi 23 octobre 2007, Vincent H. a écrit...


J'ai éxecuté memtest86+ toute la nuit:



8h30 de tests, 17 passes éxecutées avec succès : 0 erreur.



Ce n'est pas beaucoup, 8h30

Que faire?



Remplace ta barette, et profite en pour en mettre une de plus grande
capacité.

--
jm

A.E.L. Sarl (R.C.S CASTRES 490843240)
http://www.spidboutic.fr



--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Hugues LARRIVE
Le #9617291
This is an OpenPGP/MIME signed message (RFC 2440 and 3156)
--------------enig879F948639B929F56F86D7B9
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: quoted-printable

Jean-Michel OLTRA a écrit :
Bonjour,


Le mardi 23 octobre 2007, Vincent H. a écrit...



J'ai éxecuté memtest86+ toute la nuit:





8h30 de tests, 17 passes éxecutées avec succès : 0 erre ur.




Ce n'est pas beaucoup, 8h30



En même temps c'est beaucoup par rapport au reboot qui survient au b out
de 7 minutes, non ? à mon avis le problème de ram est une fauss e piste.
De plus j'ai vu des machines planter (kernel panic) suite à un probl ème
de ram mais jamais rebooter... (sauf sous winxp où c'est le comporte ment
par défaut en cas de plantage).

Que faire?





Essayer une autre alimentation ! ben oui, on y pense jamais à celle- là
tant qu'elle ne fume pas, mais il arrive qu'elle ne crame pas d'un
coup... Quel est le comportement de ce PC en cas de coupure ? il reste
éteint ou il reboot ? Ça me semble quand même le premier p oint à
vérifier en cas d'extinction / reboot intempestif.




--------------enig879F948639B929F56F86D7B9
Content-Type: application/pgp-signature; name="signature.asc"
Content-Description: OpenPGP digital signature
Content-Disposition: attachment; filename="signature.asc"

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.6 (GNU/Linux)

iD8DBQFHHgCINdTZuHWpgVIRAqMiAJkB4iWktTnb+eUC22fnp42YaUKJPQCfUdKY
Gkf+T7z+VIBIuaB+xWo8QtE =qPvM
-----END PGP SIGNATURE-----

--------------enig879F948639B929F56F86D7B9--


--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Vincent H.
Le #9617271
On 10/23/07, Hugues LARRIVE
> Ce n'est pas beaucoup, 8h30
>
En même temps c'est beaucoup par rapport au reboot qui survient au bout
de 7 minutes, non ?



C'est juste.

>> Que faire?
>>
Essayer une autre alimentation ! ben oui, on y pense jamais à celle-l à
tant qu'elle ne fume pas, mais il arrive qu'elle ne crame pas d'un
coup... Quel est le comportement de ce PC en cas de coupure ? il reste
éteint ou il reboot ? Ça me semble quand même le premier point à
vérifier en cas d'extinction / reboot intempestif.




Oui l'idée est bonne, je vais m'y résigner, même si l'alimentation de
ce serveur est récente (moins d'un an) et de bonne qualité (Fortron
green)

Cependant, j'ai pu remarquer la chose suivante:
Lorsque je lance une tâche qui prend 99% du cpu (type memtester), la
machine ne reboot plus! Je peux ouvrir d'autre sessions ssh et faire
trop choses (lentement cependant...)

Peut-etre devrais-je regarder du côté des priorités d'execution de
certains processus?

--
Vincent H
"Early Optimization is the root of all evil" - Donald Knuth
Sylvain Sauvage
Le #9617261
Hugues LARRIVE, mardi 23 octobre 2007, 16:09:08 CEST
[…]
De plus j'ai vu des machines planter
(kernel panic) suite à un problème de ram mais jamais
rebooter... (sauf sous winxp où c'est le comportement par
défaut en cas de plantage).


^^^^^^^^^^^^^^^^^^
C’est pas le comportement par défaut « tout court  » ;oP

>> Que faire?
>>
Essayer une autre alimentation ! ben oui, on y pense jamais à
celle-là tant qu'elle ne fume pas, mais il arrive qu'elle ne
crame pas d'un coup... Quel est le comportement de ce PC en
cas de coupure ? il reste éteint ou il reboot ? Ça me semble
quand même le premier point à vérifier en cas d'extinction /
reboot intempestif.



Oui, il suffit aussi parfois d’une légère faiblesse sur le
mauvais brin. La plupart du temps, ce sont les disques qui
trinquent mais pourquoi pas le CPU…
D’ailleurs, si le CPU fait du speedstep/trucmuche, il peut
changer de tension (c’est le cas pour le Cool’n’qui et d’AMD,
je n’ai pas les senseurs de tension avec mon Intel).

--
Sylvain Sauvage
damelo
Le #9617221
Sylvain Sauvage a écrit :
Hugues LARRIVE, mardi 23 octobre 2007, 16:09:08 CEST
[…]
De plus j'ai vu des machines planter
(kernel panic) suite à un problème de ram mais jamais
rebooter... (sauf sous winxp où c'est le comportement par
défaut en cas de plantage).


^^^^^^^^^^^^^^^^^^
C’est pas le comportement par défaut « tout court » ;oP

Que faire?





Essayer une autre alimentation ! ben oui, on y pense jamais à
celle-là tant qu'elle ne fume pas, mais il arrive qu'elle ne
crame pas d'un coup... Quel est le comportement de ce PC en
cas de coupure ? il reste éteint ou il reboot ? Ça me semble
quand même le premier point à vérifier en cas d'extinction /
reboot intempestif.



Oui, il suffit aussi parfois d’une légère faiblesse sur le
mauvais brin. La plupart du temps, ce sont les disques qui
trinquent mais pourquoi pas le CPU…
D’ailleurs, si le CPU fait du speedstep/trucmuche, il peut
changer de tension (c’est le cas pour le Cool’n’quiet d’AMD,
je n’ai pas les senseurs de tension avec mon Intel).



Bonjour.
Je me suis battu avec une carte mère pour le même problème. J'ai changé
celle là, puis réinstaller + tard et elle refonctionne 24/24 sans pb.
(???). Peut-être le fait de tout débrancher et rebrancher peut régler le pb.
Bonne chance...


--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs "From" et
"Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Jean-Yves F. Barbier
Le #9616691
j'ai aussi ce type de PB sur une CM ECS, et je ne suis pas loin de me
dire que, puisque toutes les RAMs ont été changées, il ne reste plu s que
les HDs ou la CM (j'ai régulièrement un ou deux caractères qui merd ouillent
dans /var/lib/dpkg/available (et/ou status))

ça arrive dès fois après une pêche électrique

Vincent H. a écrit :
On 10/23/07, Jean-Michel OLTRA
Bonjour,



Bonjour et merci de ta réponse,

Si tu as plusieurs barettes, essaie de les retirer une à une. J'ai d éjà
eu ce problème de reboot intempestif. C'était tout bonnement une b arette
mémoire défectueuse.



Alors en fait j'ai vérifié hier soir et je n'ai bien qu'une seule
barrete de 128 Mo.

J'ai éxecuté memtest86+ toute la nuit:

8h30 de tests, 17 passes éxecutées avec succès : 0 erreur.

Que faire?
J'ai regardé un peu les logs de webmin qui m'avait l'air un peu
suspect, je l'ai donc purement et simplement desinstallé lui aussi ca r
je ne m'en sers plus depuis des mois.

J'ai éteint les autres machines de mon réseau local, mais cela ne c hange rien.
Est-il possible de faire rebooter une machine en la spammant sur le
net? Ai-je un moyen de vérifier cela?

D'autres log peuvent-ils m'aider à comprendre ces reboots?

Je ne sais plus trop où chercher là :-/

Pour rappel, au niveau du hardware, j'ai refait mon swap avec
vérification des blocs défectueux (résultat: aucun bloc défectu eux),
testé ma ram toute la nuit (0 erreur), et j'ai fait également de la
place sur / (~ 3Go).

Niveau software: désinstallation de munin et de ses dépendances.
désinstallation de webmin.

Je suis un peu perdu là...

Merci encore pour toute votre aide.




--
It is now quite lawful for a Catholic woman to avoid pregnancy by a resor t to
mathematics, though she is still forbidden to resort to physics and chemi stry.
-- H. L. Mencken
Jean-Yves F. Barbier
Le #9616561
c'est memtest86+ qu'il faut installer; par ailleurs, il existe en
image iso bootable pour tests (mais il ne découvre pas tout: il
a fallu que je pousse la RAM au maximum pour découvrir que la corruptio n
du fs venait de la barette#2, qui ne faisait pas d'erreurs à vitesse no rmale)

Vincent H. a écrit :
On 10/22/07, Gilles Mocellin
Un petit coup de memtest86++ permettrait d'en savoir plus.





Est-il possible de booter sur memtest86, faire une serie de test (qui
log le tout quelque part) et ensuite rebooter automatiquement le
serveur pour me permettre d'avoir à nouveau la main et finalement
étudier les logs?

J'ai installé memtest86, il s'est à priori rajouté tout seul dans grub
(j'ai pas eu le temps de lire le fichier menu.lst en entier mais j'ai
pu trouver un memtest86 dedans)




--
#if _FP_W_TYPE_SIZE < 32
#error "Here's a nickel kid. Go buy yourself a real computer."
#endif
-- linux/arch/sparc64/double.h
Publicité
Poster une réponse
Anonyme