OVH Cloud OVH Cloud

traquer un probleme

5 réponses
Avatar
Non Compos Mentis
Meow les gens,

Je travaille sur un pc sous debian/unstable sans problèmes et repondant
globalement à mes besoins (simulations... stabilité pas trop pourrie
mais rien d'excessif)
J'ai franchi le pas et mis trois jolis postes en reseau :
- un pseudo serveur avec nis/nfs (ldap j'ai un peu de mal à implementer)
et samba pour monter aussi les partages sur des windows
- deux machines en client de la bete au dessus.

Il arrive regulierement que mon serveur plante : gel total et pas moyen de
redemarrer hormis en rebootant. Je ne pense pas avoir fait de conneries
particulieres dans l'installation. Seul point suspect mon lien avec le
reseau est un peu vieux et je le soupçonne de perturber le reseau mais
est-ce suffisant pour planter ma bebette ?

Sinon pas de trace de quoique ce soit sur /var/log/messages (-- MARK -- toutes les 20 (?) mins et d'un coup plus
rien et puis après les lignes relatives au reboot)
Bref, ma question est la suivante :Quelle est la methode magique pour
traquer la raison de mes problemes ?

Merci d'avance pour vos informations
Mederick

5 réponses

Avatar
Alain Labarthe
Le 08-09-2004, Non Compos Mentis écrivait:

Il arrive regulierement que mon serveur plante : gel total et pas moyen de
redemarrer hormis en rebootant. Je ne pense pas avoir fait de conneries
particulieres dans l'installation. Seul point suspect mon lien avec le
reseau est un peu vieux et je le soupçonne de perturber le reseau mais
est-ce suffisant pour planter ma bebette ?

Sinon pas de trace de quoique ce soit sur /var/log/messages (-- MARK -- toutes les 20 (?) mins et d'un coup plus
rien et puis après les lignes relatives au reboot)
Bref, ma question est la suivante :Quelle est la methode magique pour
traquer la raison de mes problemes ?

Dans le cas d''un serveur qui "gèle" tout seul au point de devoir le

re-démarrer, il y a plusieurs pistes:

- Problèmes matériels: mémoire défaillante, disque en fin de vie,
etc.
- Problèmes logiciels: Un process qui part en vrille.

--
apt-get --purge remove Bush

Avatar
GERBIER Eric
Alain Labarthe wrote:
Le 08-09-2004, Non Compos Mentis écrivait:

Dans le cas d''un serveur qui "gèle" tout seul au point de devoir le
re-démarrer, il y a plusieurs pistes:

- Problèmes matériels: mémoire défaillante, disque en fin de vie,
etc.
- Problèmes logiciels: Un process qui part en vrille.


je rajouterais bien : probleme (vecu) de surchauffe du processeur : verifier la
ventilation, surveiller la temperature (lm_sensors)

Avatar
Rakotomandimby Mihamina
wrote:
Alain Labarthe wrote:


[...]

moi aussi je soupçonne le materiel:

Je faisais par periode regulieres des transcodages mp3->ogg (tres
consommateur de CPU). A un moment la machine gele. Je change de
distribution. La machine gele toujours. Je regarde dedans (materiel) les
ailettes du radiateur sont plein de poussieres. Je passe un coup
d'aspirateur et ca repart sans plus de plantages.

Voila.

PS : de toutes facon c'est reconnu que la poussiere et toutes les
saletes en general tiennent au chaud ...
--
ASPO - http://aspo.rktmb.org/
Unofficial FAQ fcolc - http://faq.fcolc.eu.org/
Linux User Group sur Orléans et alentours.
Tél: + 33 2 38 76 43 65 (France)

Avatar
g.patel
On Wed, 08 Sep 2004 23:27:30 +0200, Non Compos Mentis
wrote:

(...gel machine...)
Bref, ma question est la suivante :Quelle est la methode magique pour
traquer la raison de mes problemes ?


je crois que la seule manière d'espérer différencier matériel/logiciel
est de repérer les circonstances du plantage. S'il y a des régularités
dans les plantages, ça peut etre un problème de logiciel. Du genre,
quand un programme donné se lance ou fait quelque chose de
particulier. On peut essayer d'invalider un serveur, ou de changer
de noyau. Mais en général c'est intermittent et c'est causé par le
matériel, comme indiqué par d'autres.

Gérard Patel

Avatar
sans_flotus_spam
Alain Labarthe wrote:

Le 08-09-2004, Non Compos Mentis écrivait:

Il arrive regulierement que mon serveur plante : gel total et pas
moyen de redemarrer hormis en rebootant. Je ne pense pas avoir fait
de conneries particulieres dans l'installation. Seul point suspect
mon lien avec le reseau est un peu vieux et je le soupçonne de
perturber le reseau mais est-ce suffisant pour planter ma bebette ?

Sinon pas de trace de quoique ce soit sur /var/log/messages (--
MARK -- toutes les 20 (?) mins et d'un coup plus rien et puis après
les lignes relatives au reboot) Bref, ma question est la suivante
:Quelle est la methode magique pour traquer la raison de mes
problemes ?

Dans le cas d''un serveur qui "gèle" tout seul au point de devoir le

re-démarrer, il y a plusieurs pistes:

- Problèmes matériels: mémoire défaillante, disque en fin de vie,
etc.
- Problèmes logiciels: Un process qui part en vrille.



j'ajouterai aussi : les câbles ! essaye avec des RJ45 neufs.
1° principe de Latinger : ça marche mieux quand c'est branché.
cependant, même avis (d'expérience) que les collègues, une bécane qui
plante sous linux, c'est d'abord un problème matériel, mémoire en
premier.
A+