OVH Cloud OVH Cloud

Machine qui se semi-bloque mysterieusement

4 réponses
Avatar
Alain Montfranc
Bonjour à tous

Je n'arrive pas a me depatouiller d'une machine Linux qui a les
symptomes suivants.

Il s'agit d'une machine RedHat 7.1 (je sais ca date mais on ne peut pas
trop y toucher) dont les applications sensibles (ie: ouvertes au public)
sont régulièrement mises a jour (apache, bind, sendmail).

C'est un bipro compaq, DL380 (G1), avec 1 Go de mémoire et 3 disques de
18 Go en Raid5.

De temps en temps (1 fois tous les 6 mois en moyenne mais c'est déjà
trop), la machhine se retrouve dans un état bancal :

- les process existants continuent à tourner sans probleme
- aucun nouveau process ne peut etre lancé

A titre d'exemple, il est possible de rentrer son login au prompt (donc
getty tourne toujours), mais pas le password (donc le fork/exec de getty
pour lancer "login" n'abouti pas)

De meme un telnet sur le port 80 répond mais ne donnera aucun data

Le ping repond bien

etc...

A noter qu'il n'y a AUCUNE entrée dans les syslog qui s'arettent
brutalement au moment (supposé) du "plantage" sans aucune entrée anormale.

La machine ne présente aucune activité particuliere (les disques ne sont
pas en train de mouliner comme des fous donc elle n'est pas en train de
swapper à mort par exemple).

Je vous avoue que je désespère un peu. Je n'ai rien trouvé sur le net
qui ressemble à ca, rien dans les docs non plus et c'est pour cela que
je me tourne, en désespoir de cause, vers ce groupe...

Merci d'avance

Alain
Qui aimerait dormir tranquile :-)

--
Pour contacter l'équipe de modération : moderateurs-fcolm@efrei.fr
ATTENTION: Postez DIRECTEMENT vos articles dans le groupe, PAS dans
la liste de distribution des modérateurs.

4 réponses

Avatar
Julien BLACHE
Alain Montfranc wrote:

Salut,

A noter qu'il n'y a AUCUNE entrée dans les syslog qui s'arettent
brutalement au moment (supposé) du "plantage" sans aucune entrée
anormale.

La machine ne présente aucune activité particuliere (les disques ne
sont pas en train de mouliner comme des fous donc elle n'est pas en
train de swapper à mort par exemple).



Question bête : est-ce que la machine a encore de l'espace disque
partout où elle en a besoin, au moment où elle "plante" ?

JB.

--
BOFH excuse #27:
radiosity depletion

--
Pour contacter l'équipe de modération :
ATTENTION: Postez DIRECTEMENT vos articles dans le groupe, PAS dans
la liste de distribution des modérateurs.
Avatar
Alain Montfranc
Julien BLACHE wrote:

Alain Montfranc wrote:

Salut,


A noter qu'il n'y a AUCUNE entrée dans les syslog qui s'arettent
brutalement au moment (supposé) du "plantage" sans aucune entrée
anormale.

La machine ne présente aucune activité particuliere (les disques ne
sont pas en train de mouliner comme des fous donc elle n'est pas en
train de swapper à mort par exemple).




Question bête : est-ce que la machine a encore de l'espace disque
partout où elle en a besoin, au moment où elle "plante" ?




oui plein...

par contre, comme on me l'a fait remarqué, mon noyau est un peu vieux.
Va falloir que je tente un upgrade...

--
Pour contacter l'équipe de modération :
ATTENTION: Postez DIRECTEMENT vos articles dans le groupe, PAS dans
la liste de distribution des modérateurs.
Avatar
Julien BLACHE
Alain Montfranc wrote:

Question bête : est-ce que la machine a encore de l'espace disque
partout où elle en a besoin, au moment où elle "plante" ?



oui plein...



Y compris au niveau du nombre d'inodes dispo ? (vieux gag)

par contre, comme on me l'a fait remarqué, mon noyau est un peu
vieux. Va falloir que je tente un upgrade...



Bonne chance.

JB.

--
BOFH excuse #28:
CPU radiator broken

--
Pour contacter l'équipe de modération :
ATTENTION: Postez DIRECTEMENT vos articles dans le groupe, PAS dans
la liste de distribution des modérateurs.
Avatar
Licence IV
Le 04 Jul 2004 19:25:21 GMT, après mûre réflexion,
Alain Montfranc a écrit:
C'est un bipro compaq, DL380 (G1), avec 1 Go de mémoire et 3 disques de
18 Go en Raid5.

De temps en temps (1 fois tous les 6 mois en moyenne mais c'est déjà
trop), la machhine se retrouve dans un état bancal :

- les process existants continuent à tourner sans probleme
- aucun nouveau process ne peut etre lancé



J'ai le même genre de problèmes avec une DL 360 juste après l'avoir
installé, et même après avec réinstallé d'autres version de Debian, le
problème persiste (sauf que la durée est plus proche de 3 jours!
(heureusement que c'est une machine de test!!!)).

Pareil, je suis toujours connecté à la machine, les syslogs sont
arrétés, certains processus tournent toujours...

En regardant le serveur, je m'apperçoit que les 2 disques (mirroir) sont
en "failure"! Je reboote la machine, et ça refonctionne pour quelques
jours!

J'en conclu donc que le problème était surement matériel; probablement
la carte RAID!

J'ai d'autres DL 360 avec la même version de Debian sur lesquels je n'ai
pas de problèmes!!! D'où mon hypthèse d'un problème matériel.

--
Nicolas de Ferrières Mail:
_______________________________________________________________
Si l'alcool ne me tue pas... Les femmes auront ma peau

--
Pour contacter l'équipe de modération :
ATTENTION: Postez DIRECTEMENT vos articles dans le groupe, PAS dans
la liste de distribution des modérateurs.