OVH Cloud OVH Cloud

plantages serveur regulier

38 réponses
Avatar
Christophe PEREZ
Bonjour,

Depuis plusieurs mois, je suis confronté à un problème que je ne
parviens pas à résoudre.
Mon serveur plante, régulièrement, après une moyenne d'une dizaine de
jours (sauf exceptions mini: 1 jour,Maxi: 22 jours).

Évidemment, rien dans les logs.
Au moment du plantage, je crois que j'ai toujours été connecté à
internet avec, par un modem pci olitec.

J'ai longtemps incriminé spamassassin qui était très souvent en train
de faire son boulot au moment des plantages.
J'ai fait une mise à jour avec la dernière 2.63.1.

Je pensais à un problème de RAM, je me suis décidé à l'ouvrir pour
lui remettre un lecteur de disquette et faire un test memtest et j'ai
profité de l'ouverture de la machine pour faire un petit entretien
physique.
Bon, c'est vrai que ne pouvant pas trop attendre à ce moment là, je
n'ai laissé que 3 passes au test, ça a duré 3 heures, mais pas
d'erreur.

J'ai pensé au noyau Mandrake, que j'ai remplacé par un 2.4.24 officiel.
Je me suis ensuite rendu compte dans cfdisk que la partition de swap avait
un type 83. J'ai donc refait un mkswap dessus (swap non utilisé à ce
moment là bien sûr).

Après tout ça, j'ai pensé que d'une manière ou d'une autre, le
problème pourrait avoir disparu, et bien non, hier, après juste 2 jours
d'uptime, planté, à nouveau -> power off, rien à faire d'autre.

Maintenant, je commence à me poser des question sur le modem pci. Est-il
possible que ce soit lui qui plante tout comme ça à cause d'une
défaillance de sa part ?
Ça m'embêterait d'avoir à remettre un modem externe car ici, j'ai
énormément de micro-coupures qui me font à chaque fois tomber la
connexion internet si elle est en cours, et il faut aller
désalimenter/réalimenter le modem pour pouvoir reconnecter, c'est
lassant et c'est la raison de mon achat de ce moment interne, il y a
plusieurs mois, mais malheureusement, je ne saurai dire si le début des
plantages correspond à cette date vu que je ne l'avais jamais mis en
cause jusqu'à maintenant.

Le serveur est un vieux PII 233, avec 192Mo de RAM, un disque récent
80Go, carte réseau dlink 100Mb, carte modem pci olitec, carte radio FM
guillemot, pas de X installé, et beaucoup d'applis serveur tournant
dessus (postfix, inn, hylafax, samba, nfs, cups, squid/squidguard, bind,
jabber, ssh, pop3, imap, apache, mysql, icecast, mserver...). Trop ?

Je suis à l'écoute de toutes vos suggestions pour diagnostiquer enfin le
problème, et là, j'ai vraiment besoin d'experts.
Merci beaucoup d'avance.

PS : Désolé pour la longueur, mais je voulais en dire un maximum pour
avoir le maximum de chances d'avoir une aide.

--
Christophe PEREZ
Écrivez moi sans _faute !

10 réponses

1 2 3 4
Avatar
Rakotomandimby
Christophe PEREZ wrote:

Le serveur est un vieux PII 233, avec 192Mo de RAM, un disque récent
80Go, carte réseau dlink 100Mb, carte modem pci olitec, carte radio FM
guillemot, pas de X installé, et beaucoup d'applis serveur tournant
dessus (postfix, inn, hylafax, samba, nfs, cups, squid/squidguard, bind,
jabber, ssh, pop3, imap, apache, mysql, icecast, mserver...). Trop ?


ptet que non ptet que oui , en tout cas , vu le nombre , c'est de dire
lequel est fautif qui va etre dur .

1°) avec une carte mere aussi vieille , c'est la premiere que je pointerai
du doigt .

2°) si tu utilise des vieilles version de tes serveurs logiciels ( au
passage donne les nous ) , ben je dirai eux en deuxieme , mets les tous a
jour , tu a une Mandrake , tu compile des RPM pour TA mandrake et tu les
installe via RPM . ce devrai aider d'avoir les dernieres versions stables .

3°) la charge de ton serveur , tu peux nous la decrire ? ( %CPU ,
user/system %Memory ... ... )

4°) mets quelque part sur ton apache les logs de tous tes serveurs pour
qu'on puisse y jetter un oeil ( en nous indiquant les dernieres lignes
avant plantage ) : postfix, inn, hylafax, samba, nfs, cups,
squid/squidguard, bind, jabber, ssh, pop3, imap, apache, mysql, icecast,
mserver ... on verra bien lequel annonce un truc ...


--
http://mrakotom.free.fr

Avatar
Christophe PEREZ
Le Mon, 09 Feb 2004 19:22:36 +0100, Rakotomandimby a écrit:

1°) avec une carte mere aussi vieille , c'est la premiere que je
pointerai du doigt .


C'est bien ce qui me fait peur...

2°) si tu utilise des vieilles version de tes serveurs logiciels ( au
passage donne les nous )


Vieilles, non, toutes à jour par update mandrake mais évidemment pas les
dernières stables.

, ben je dirai eux en deuxieme , mets les tous a
jour , tu a une Mandrake , tu compile des RPM pour TA mandrake et tu les
installe via RPM .


Bon, puisque tu insistes, il va vraiment falloir que je me mette
rapidement à savoir faire ces foutus rpm.

ce devrai aider d'avoir les dernieres versions stables


Peut-être ;-)

3°) la charge de ton serveur , tu peux nous la decrire ? ( %CPU ,
user/system %Memory ... ... )


A part un "top" que voici, qu'est-ce qui peut me donner tout ça ?

top - 15:12:18 up 2:42, 3 users, load average: 0.00, 0.01, 0.02
Tasks: 114 total, 1 running, 113 sleeping, 0 stopped, 0 zombie
Cpu(s): 1.0% user, 1.3% system, 0.0% nice, 97.7% idle
Mem: 192192k total, 188640k used, 3552k free, 26848k buffers
Swap: 586332k total, 8208k used, 578124k free, 68892k cached

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ Command
8401 root 18 0 992 992 776 R 2.6 0.5 0:00.58 top
1 root 8 0 504 492 444 S 0.0 0.3 0:03.55 init
2 root 8 0 0 0 0 S 0.0 0.0 0:00.03 keventd
3 root 19 19 0 0 0 S 0.0 0.0 0:00.01 ksoftirqd_CPU0
4 root 9 0 0 0 0 S 0.0 0.0 0:05.29 kswapd
5 root 9 0 0 0 0 S 0.0 0.0 0:00.00 bdflush
6 root 9 0 0 0 0 S 0.0 0.0 0:00.02 kupdated
292 root 9 0 0 0 0 S 0.0 0.0 0:01.36 kjournald
293 root 9 0 0 0 0 S 0.0 0.0 0:00.11 kjournald
294 root 9 0 0 0 0 S 0.0 0.0 0:02.55 kjournald
295 root 9 0 0 0 0 S 0.0 0.0 0:00.03 kjournald
296 root 9 0 0 0 0 S 0.0 0.0 0:00.04 kjournald
297 root 9 0 0 0 0 S 0.0 0.0 0:00.00 kjournald
298 root 9 0 0 0 0 S 0.0 0.0 0:00.00 kjournald
779 rpc 9 0 592 592 520 S 0.0 0.3 0:00.07 portmap
793 root 9 0 584 584 488 S 0.0 0.3 0:01.68 syslogd
801 root 9 0 1264 1264 436 S 0.0 0.7 0:00.46 klogd
845 rpcuser 9 0 764 764 672 S 0.0 0.4 0:00.91 rpc.statd
1811 daemon 9 0 500 492 444 S 0.0 0.3 0:00.00 atd
1832 root 9 0 1048 944 940 S 0.0 0.5 0:00.00 saslauthd
1836 root 9 0 1048 928 916 S 0.0 0.5 0:00.00 saslauthd
1837 root 9 0 1048 880 876 S 0.0 0.5 0:00.00 saslauthd
1838 root 9 0 1048 880 876 S 0.0 0.5 0:00.00 saslauthd
1845 root 9 0 1048 880 876 S 0.0 0.5 0:00.00 saslauthd
1851 named 9 0 2596 2508 1748 S 0.0 1.3 0:00.02 named
1859 named 9 0 2596 2508 1748 S 0.0 1.3 0:00.00 named
1863 named 9 0 2596 2508 1748 S 0.0 1.3 0:01.11 named
1864 named 9 0 2596 2508 1748 S 0.0 1.3 0:00.01 named
1865 named 9 0 2596 2508 1748 S 0.0 1.3 0:00.26 named
1894 root 9 0 1320 1256 1124 S 0.0 0.7 0:01.59 sshd
1916 root 8 0 860 832 712 S 0.0 0.4 0:00.45 xinetd
1955 root 9 0 3612 3572 1260 S 0.0 1.9 0:00.68 cupsd
2004 root 9 0 0 0 0 S 0.0 0.0 0:08.82 nfsd


4°) mets quelque part sur ton apache les logs de tous tes serveurs pour
qu'on puisse y jetter un oeil ( en nous indiquant les dernieres lignes
avant plantage ) : postfix, inn, hylafax, samba, nfs, cups,
squid/squidguard, bind, jabber, ssh, pop3, imap, apache, mysql, icecast,
mserver ... on verra bien lequel annonce un truc ...


Wahou ! T'es sûr que quelqu'un ira se taper tout ça pour m'aider ?
Mais puisque tu le proposes, je vais le faire ;-)

Tout sera ici, dès que j'aurai uploadé les 5Mo...(en espérant qu'il me
reste assez de place sur mon hébergement ;-) ).

http://www.novazur.com/download/index.php?chemin=%2Fdownload%2Flog

Merci.

--
Christophe PEREZ
Écrivez moi sans _faute !

Avatar
g.patel
On Mon, 09 Feb 2004 13:39:23 -0400, Christophe PEREZ
wrote:

(...plantages violents...)

Maintenant, je commence à me poser des question sur le modem pci. Est-il
possible que ce soit lui qui plante tout comme ça à cause d'une
défaillance de sa part ?
Ça m'embêterait d'avoir à remettre un modem externe car ici, j'ai
énormément de micro-coupures


hum... des micro-coupures ? a priori ça consomme peu
un modem, l'onduleur du serveur devrait pouvoir l'alimenter
sans trop de problème, non ?

Gérard Patel

Avatar
no_spam
On Mon, 09 Feb 2004 13:39:23 -0400, Christophe PEREZ wrote:

Bonjour,

Depuis plusieurs mois, je suis confronté à un problème que je ne
parviens pas à résoudre.
Mon serveur plante, régulièrement, après une moyenne d'une dizaine de
jours (sauf exceptions mini: 1 jour,Maxi: 22 jours).

Évidemment, rien dans les logs.
Au moment du plantage, je crois que j'ai toujours été connecté à
internet avec, par un modem pci olitec.


Laisse une console active (pas besoin d'être logué, mais juste
qu'elle soit sélectionée). Puis active les trace du kernel
(<CTRL><ALT><Syst>9 pour avoir le maximum). Il faut que les
magic-sys-Rq soient compilées dans le kernel...
Si le problème est logiciel, tu auras des infos quand il plantera
la prochaine fois. Sinon, il est fort probable que le problème
soit matériel...

Avatar
Christophe PEREZ
Le Mon, 09 Feb 2004 22:22:52 +0000, gerard patel a écrit:

hum... des micro-coupures ? a priori ça consomme peu
un modem, l'onduleur du serveur devrait pouvoir l'alimenter
sans trop de problème, non ?


Non, j'avais essayé ça, mais le problème, c'est que, autant l'alim d'un
PC est justement capable d'absorber cette micro-coupure le temps d'être
à nouveau alimentée (car il y a obligatoirement coupure entre le moment
où le secteur part, et le moment où l'onduleur prend le relai), autant
l'alim du modem, elle, ne sait pas le faire, et coupe de toutes les
façons la connexion avant d'avoir eu à nouveau le "jus".
C'est triste, mais c'est un fait.

Merci d'avoir essayé :-)

--
Christophe PEREZ
Écrivez moi sans _faute !

Avatar
Christophe PEREZ
Le Tue, 10 Feb 2004 00:40:43 +0100, no_spam a écrit:

Laisse une console active (pas besoin d'être logué, mais juste
qu'elle soit sélectionée). Puis active les trace du kernel
(<CTRL><ALT><Syst>9 pour avoir le maximum).


Ok, compris, mais il me faut un clavier et un écran dessus pour ça,
non ?
Pas moyen d'avoir ça dans un log ?

Il faut que les
magic-sys-Rq soient compilées dans le kernel...


le sont.

Si le problème est logiciel, tu auras des infos quand il plantera
la prochaine fois.


Et dans ce cas je n'aurais rien dans aucun log ?

Sinon, il est fort probable que le problème
soit matériel...


Je le crains oui, et après, il va falloir savoir d'où ça vient car je
ne vais quand même pas jeter le pc comme ça sans en savoir plus...

Merci pour tes conseils.

--
Christophe PEREZ
Écrivez moi sans _faute !

Avatar
Alexis Muller
On Mon, 09 Feb 2004 20:53:00 -0400, Christophe PEREZ wrote:

Le Mon, 09 Feb 2004 22:22:52 +0000, gerard patel a écrit:

hum... des micro-coupures ? a priori ça consomme peu
un modem, l'onduleur du serveur devrait pouvoir l'alimenter
sans trop de problème, non ?


Non, j'avais essayé ça, mais le problème, c'est que, autant l'alim d'un
PC est justement capable d'absorber cette micro-coupure le temps d'être
à nouveau alimentée (car il y a obligatoirement coupure entre le moment
où le secteur part, et le moment où l'onduleur prend le relai), autant
l'alim du modem, elle, ne sait pas le faire, et coupe de toutes les
façons la connexion avant d'avoir eu à nouveau le "jus".
C'est triste, mais c'est un fait.


Heu bah non, justement le rôle de l'onduleur c'est qu'il n'y plus de
micro-coupures et une alim de PC n'est pas capable d'absorber se genre de
choses.

Normalement ton PC devrais toujours utiliser le courant qui vient de
l'onduleur qui lui est alimenté par le circuit électrique. Si une
coupure (micro ou non) survient, l'onduleur n'est plus alimenté mais
le PC ne le "voit" pas.

Si ton onduleur n'est pas capable de protéger ton modem des
micro-coupures, il n'est pas non plus capable de protéger ton PC (même
si celui-ci "résiste" un peu plus longtemps).
Les micro-coupures ont peut-être fini par avoir raison de lui, et c'est
peut-être la cause des plantages de ton serveur.

--
Alexis Muller
Laboratoire d'Informatique Fondamentale de Lille (LIFL)
Universite de Lille 1 - 59655 Villeneuve d'Ascq Cedex
Email : - Web : http://www.lifl.fr/~mullera


Avatar
no_spam
On Mon, 09 Feb 2004 23:14:19 -0400, Christophe PEREZ wrote:

Le Tue, 10 Feb 2004 00:40:43 +0100, no_spam a écrit:

Laisse une console active (pas besoin d'être logué, mais juste
qu'elle soit sélectionée). Puis active les trace du kernel
(<CTRL><ALT><Syst>9 pour avoir le maximum).


Ok, compris, mais il me faut un clavier et un écran dessus pour ça,
non ?
Pas moyen d'avoir ça dans un log ?


Si le kernel crashe de façon irrémédiable,
il ne faut pas espérer voir quoi que ce soit dans les logs...
Tu peux, en principe, avoir le même résultat avec une console
sur le port série. Dans ce cas, tu peux logger en utilisant un PC
à l'autre bout de la ligne série...

Pour activer les logs du kernel par le proc:
/proc/sys/kernel/printk
printk
------
The four values in printk denote
* console_loglevel,
* default_message_loglevel,
* minimum_console_loglevel and
* default_console_loglevel

Voilà...


Avatar
Rakotomandimby
Christophe PEREZ wrote:

Bon, puisque tu insistes, il va vraiment falloir que je me mette
rapidement à savoir faire ces foutus rpm.


C'est pas que j'insiste , c'est une chose assez logique :Ta distribution
vient avec un systeme de gestion des dependances , porquoi "anihilier" ce
systeme en installant sauvagement ?

tiens le liens pour faire ça . Sur le site officiel de Mandrak en plus .
http://qa.mandrakesoft.com/twiki/bin/view/Main/RpmHowTo#Building_for_Mandrake_Linux

et la version en Francais , mais je ne sais pas si elle est a jour .
http://www.linuxfrench.net/article.php?id_article27
--
http://mrakotom.free.fr

Avatar
Christophe PEREZ
Le Tue, 10 Feb 2004 13:55:44 +0100, Rakotomandimby a écrit:

C'est pas que j'insiste , c'est une chose assez logique :Ta distribution
vient avec un systeme de gestion des dependances , porquoi "anihilier" ce
systeme en installant sauvagement ?


Mais je suis tout à fait d'accord avec toi, et je ne compile _jamais_ et
n'installe _que_ des rpm, justement sauf pour icecast, mais là, c'était
plus pour tests, mais ce n'est pas le sujet de ce fil.

--
Christophe PEREZ
Écrivez moi sans _faute !

1 2 3 4