J'ai un souci avec un serveur tournant sous debian/testing. Il
plante assez aléatoirement (au sens tout est mort, plus d'accès à la
console).
J'ai tout d'abord mis en cause le matériel, la mémoire, enfin tout
ce qui est susceptible de tomber en panne. J'ai fait tourner memtest
plusieurs jours (en bootant sous memtest), rien à signaler. Les
disques SCSI sont impécables. La machine peut ronronner plusieurs
semaines sans aucun problème avec des charges montant à 5 ou 6 en
pointe. Et de temps en temps, un plantage sévère et rien dans les
logs.
Sauf que depuis quelques temps, je remarque que ce ~@#{^ plantage se
produit toujours à xxh17 (toutes les 17 minutes de chaque heure),
heure à laquelle se déclanche cron.hourly. Je n'ai qu'un seul script
qui vérifie si la connexion ADSL est toujours active et qui reboote
le cas échéant le modem.
if [ $TEST_PING -eq 0 ]; then
expect << EOS
spawn telnet einstein.systella.fr
expect "login: "
send -- "superuser\r"
expect "password: "
send -- "5200admin\r"
expect "xsh>"
send -- "do reboot\r"
sleep 5
exit
EOS
fi
exit 0
Je ne vois pas pourquoi ce script ferait planter sévèrement mon
serveur. Sur google, j'ai lu un certain nombre de personnes qui
avaient un problème similaire, mais sans jamais donner de solution.
Alors si l'un d'entre vous avait une idée... Merci d'avance de me la
communiquer ;-)
Pour information, la configuration matérielle est :
- carte mère D5Cub/512 avec un P166 non MMX et 128 Mo de mémoire ;
- une carte graphique Matrox Millenium 2 4 Mo ;
- deux cartes réseau Ethernet Digital Tulip ;
- une carte raid SCSI gdth avec plusieurs disques SCSI ;
- un lecteur de CDROM en IDE ;
- floppies 3"1/2 et 5"1/4.
Merci de votre attention,
JKB
--
Pour contacter l'équipe de modération : moderateurs-fcolm@efrei.fr
ATTENTION: Postez DIRECTEMENT vos articles dans le groupe, PAS dans
la liste de distribution des modérateurs.
Ce n'est pas du tout ça. Les disques sont bons et fonctionnent parfaitement (la carte raid ne renvoie aucune erreur). La machine fonctionne très bien jusqu'à un plantage _total_ (même plus de ping ni de réponse au clavier).
Je sais que tu as dit avoir fait tourner memtest plusieurs heures/jours sans qu'il ne rapporte d'erreur, mais je pencherais quand même pour un problème de mémoire. Dans les problèmes divers de plantage aléatoires liés à la mémoire, il m'est arrivé une fois que memtest ne trouve rien, mais que le remplacement d'une des barrettes de mémoire résolve le problème...
Ne pas forcément exclure non plus un soucis de carte mère.
Dom
-- Pour contacter l'équipe de modération : ATTENTION: Postez DIRECTEMENT vos articles dans le groupe, PAS dans la liste de distribution des modérateurs.
Dans l'article <slrncsmd0k.meb.knatschke@rayleigh.systella.fr>, JKB a écrit :
Ce n'est pas du tout ça. Les disques sont bons et fonctionnent
parfaitement (la carte raid ne renvoie aucune erreur). La
machine fonctionne très bien jusqu'à un plantage _total_ (même
plus de ping ni de réponse au clavier).
Je sais que tu as dit avoir fait tourner memtest plusieurs heures/jours
sans qu'il ne rapporte d'erreur, mais je pencherais quand même pour un
problème de mémoire.
Dans les problèmes divers de plantage aléatoires liés à la mémoire, il
m'est arrivé une fois que memtest ne trouve rien, mais que le
remplacement d'une des barrettes de mémoire résolve le problème...
Ne pas forcément exclure non plus un soucis de carte mère.
Dom
--
Pour contacter l'équipe de modération : moderateurs-fcolm@efrei.fr
ATTENTION: Postez DIRECTEMENT vos articles dans le groupe, PAS dans
la liste de distribution des modérateurs.
Ce n'est pas du tout ça. Les disques sont bons et fonctionnent parfaitement (la carte raid ne renvoie aucune erreur). La machine fonctionne très bien jusqu'à un plantage _total_ (même plus de ping ni de réponse au clavier).
Je sais que tu as dit avoir fait tourner memtest plusieurs heures/jours sans qu'il ne rapporte d'erreur, mais je pencherais quand même pour un problème de mémoire. Dans les problèmes divers de plantage aléatoires liés à la mémoire, il m'est arrivé une fois que memtest ne trouve rien, mais que le remplacement d'une des barrettes de mémoire résolve le problème...
Ne pas forcément exclure non plus un soucis de carte mère.
Dom
-- Pour contacter l'équipe de modération : ATTENTION: Postez DIRECTEMENT vos articles dans le groupe, PAS dans la liste de distribution des modérateurs.
Emmanuel Florac
Le Sun, 26 Dec 2004 23:14:21 +0000, JKB a écrit :
Et lorsque mon script est _déjà_ écrit en bash, qu'est-ce que je fais ?
Et bien essaie de le faire tourner dans différents shells, pour voir. Peut-être en redirigeant explicitement les sorties du script, aussi. Enfin c'est une piste; je n'ai pas trouvé ce qui faisait qu'un script en csh gelait le système (même s'il ne faut jamais scripter en csh, ce n'est tout de même pas une raison...) quand il tournait en cron (en exécution directe il n'y avait aucun soucis).
-- Il y a toujours un bug de plus. Loi de Lubarsky.
-- Pour contacter l'équipe de modération : ATTENTION: Postez DIRECTEMENT vos articles dans le groupe, PAS dans la liste de distribution des modérateurs.
Le Sun, 26 Dec 2004 23:14:21 +0000, JKB a écrit :
Et lorsque mon script est _déjà_ écrit en bash, qu'est-ce que je
fais ?
Et bien essaie de le faire tourner dans différents shells, pour voir.
Peut-être en redirigeant explicitement les sorties du script, aussi.
Enfin c'est une piste; je n'ai pas trouvé ce qui faisait qu'un script en
csh gelait le système (même s'il ne faut jamais scripter en csh, ce
n'est tout de même pas une raison...) quand il tournait en cron (en
exécution directe il n'y avait aucun soucis).
--
Il y a toujours un bug de plus.
Loi de Lubarsky.
--
Pour contacter l'équipe de modération : moderateurs-fcolm@efrei.fr
ATTENTION: Postez DIRECTEMENT vos articles dans le groupe, PAS dans
la liste de distribution des modérateurs.
Et lorsque mon script est _déjà_ écrit en bash, qu'est-ce que je fais ?
Et bien essaie de le faire tourner dans différents shells, pour voir. Peut-être en redirigeant explicitement les sorties du script, aussi. Enfin c'est une piste; je n'ai pas trouvé ce qui faisait qu'un script en csh gelait le système (même s'il ne faut jamais scripter en csh, ce n'est tout de même pas une raison...) quand il tournait en cron (en exécution directe il n'y avait aucun soucis).
-- Il y a toujours un bug de plus. Loi de Lubarsky.
-- Pour contacter l'équipe de modération : ATTENTION: Postez DIRECTEMENT vos articles dans le groupe, PAS dans la liste de distribution des modérateurs.
JKB
Le 26-12-2004, à propos de Re: Cron et plantage serveur, Dominique ROUSSEAU écrivait dans fr.comp.os.linux.moderated :
Dans l'article , JKB a écrit :
Ce n'est pas du tout ça. Les disques sont bons et fonctionnent parfaitement (la carte raid ne renvoie aucune erreur). La machine fonctionne très bien jusqu'à un plantage _total_ (même plus de ping ni de réponse au clavier).
Je sais que tu as dit avoir fait tourner memtest plusieurs heures/jours sans qu'il ne rapporte d'erreur, mais je pencherais quand même pour un problème de mémoire. Dans les problèmes divers de plantage aléatoires liés à la mémoire, il m'est arrivé une fois que memtest ne trouve rien, mais que le remplacement d'une des barrettes de mémoire résolve le problème...
Ne pas forcément exclure non plus un soucis de carte mère.
Dans ce cas, pourquoi _toujours_ à la même heure. J'ai lancé plusieurs compilations de gcc pour voir : aucun problème. Le problème est vraiment lié au cron, mais je ne comprends pas pourquoi... J'ai modifié mon script pour ne pas avoir un appel au bash dans un bash lancé par cron pour voir. Je vous tiendrai au courant...
Cordialement,
JKB
-- Pour contacter l'équipe de modération : ATTENTION: Postez DIRECTEMENT vos articles dans le groupe, PAS dans la liste de distribution des modérateurs.
Le 26-12-2004, à propos de
Re: Cron et plantage serveur,
Dominique ROUSSEAU écrivait dans fr.comp.os.linux.moderated :
Dans l'article <slrncsmd0k.meb.knatschke@rayleigh.systella.fr>, JKB a écrit :
Ce n'est pas du tout ça. Les disques sont bons et fonctionnent
parfaitement (la carte raid ne renvoie aucune erreur). La
machine fonctionne très bien jusqu'à un plantage _total_ (même
plus de ping ni de réponse au clavier).
Je sais que tu as dit avoir fait tourner memtest plusieurs heures/jours
sans qu'il ne rapporte d'erreur, mais je pencherais quand même pour un
problème de mémoire.
Dans les problèmes divers de plantage aléatoires liés à la mémoire, il
m'est arrivé une fois que memtest ne trouve rien, mais que le
remplacement d'une des barrettes de mémoire résolve le problème...
Ne pas forcément exclure non plus un soucis de carte mère.
Dans ce cas, pourquoi _toujours_ à la même heure. J'ai lancé
plusieurs compilations de gcc pour voir : aucun problème. Le
problème est vraiment lié au cron, mais je ne comprends pas
pourquoi... J'ai modifié mon script pour ne pas avoir un appel au
bash dans un bash lancé par cron pour voir. Je vous tiendrai au
courant...
Cordialement,
JKB
--
Pour contacter l'équipe de modération : moderateurs-fcolm@efrei.fr
ATTENTION: Postez DIRECTEMENT vos articles dans le groupe, PAS dans
la liste de distribution des modérateurs.
Le 26-12-2004, à propos de Re: Cron et plantage serveur, Dominique ROUSSEAU écrivait dans fr.comp.os.linux.moderated :
Dans l'article , JKB a écrit :
Ce n'est pas du tout ça. Les disques sont bons et fonctionnent parfaitement (la carte raid ne renvoie aucune erreur). La machine fonctionne très bien jusqu'à un plantage _total_ (même plus de ping ni de réponse au clavier).
Je sais que tu as dit avoir fait tourner memtest plusieurs heures/jours sans qu'il ne rapporte d'erreur, mais je pencherais quand même pour un problème de mémoire. Dans les problèmes divers de plantage aléatoires liés à la mémoire, il m'est arrivé une fois que memtest ne trouve rien, mais que le remplacement d'une des barrettes de mémoire résolve le problème...
Ne pas forcément exclure non plus un soucis de carte mère.
Dans ce cas, pourquoi _toujours_ à la même heure. J'ai lancé plusieurs compilations de gcc pour voir : aucun problème. Le problème est vraiment lié au cron, mais je ne comprends pas pourquoi... J'ai modifié mon script pour ne pas avoir un appel au bash dans un bash lancé par cron pour voir. Je vous tiendrai au courant...
Cordialement,
JKB
-- Pour contacter l'équipe de modération : ATTENTION: Postez DIRECTEMENT vos articles dans le groupe, PAS dans la liste de distribution des modérateurs.