Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Freeze total

6 réponses
Avatar
Zouplaz
Bonjour, depuis plusieurs semaines il m'arrive un truc vraiment
désagréable et qui j'espère ne finira pas par me poser des problèmes
(corruption du filesystem) : mon serveur se gèle régulièrement, sans que
rien n'apparaisse dans les logs.

Je sais que dans un cas comme ça on commence par soupçonner le hardware
et faire un test mémoire. Mais il y a un indice supplémentaire, les
freezes se produisent TOUJOURS lors mldonkey (client emule) est lancé.

Avant de commencer à changer les barettes (oui j'ai eu UNE fois, UNE
erreur lors d'une passe (sur un test qui en a comporté une dizaine) mais
je doute que ce soit en rapport, sinon j'aurais les même problème
lorsque mldonkey ne fonctionne pas)

J'aimerais donc savoir s'il y a un moyen de mettre un process sous
"surveillance" ? La conso mémoire ne semble pas être en cause (en tout
cas la commande top ne me montre pas une augmentation régulière et
anormale de l'espace mémoire)

A un moment j'avais pensé que ça pouvait venir d'une de mes carte
ethernet (j'en ai deux) car lorsque le débit réseau augmentait (accès
soutenu en transfert de fichier par samba). J'ai supprimé la carte sur
laquelle est le réseau local et activé le controleur ethernet de la
carte mère, sans succès. Peut-être devrais-je remplacer la carte
ethernet surlaquelle transite le flux sortant (vers ma freebox).

Je suis sous Redhat 9.

A toute fin utile, voici les process qui tournent sur cette machine (en
dehors de mldonkey)

Je suis preneur de vos avis éclairés !! Merci

root 1 0 0 09:16 ? 00:00:04 init [5]
root 2 1 0 09:16 ? 00:00:00 [keventd]
root 3 1 0 09:16 ? 00:00:00 [ksoftirqd_CPU0]
root 4 1 0 09:16 ? 00:00:00 [kswapd]
root 5 1 0 09:16 ? 00:00:00 [bdflush]
root 6 1 0 09:16 ? 00:00:00 [kupdated]
root 10 1 0 09:16 ? 00:00:00 [kjournald]
root 623 1 0 09:21 ? 00:00:00 [kjournald]
root 996 1 0 09:22 ? 00:00:00 /sbin/dhclient -1 -q -lf
/var/lib/dhcp/dhclient-eth1.leases -pf /var/run/dhclient-eth1.pid -cf
/etc/dhclient-eth1.conf eth1
root 1044 1 0 09:22 ? 00:00:00 syslogd -m 0
root 1048 1 0 09:22 ? 00:00:00 klogd -x
rpc 1066 1 0 09:22 ? 00:00:00 portmap
rpcuser 1085 1 0 09:22 ? 00:00:00 rpc.statd
named 1142 1 0 09:22 ? 00:00:00 /usr/sbin/named -u named
root 1156 1 0 09:22 ? 00:00:00 /usr/sbin/sshd
root 1170 1 0 09:22 ? 00:00:00 xinetd -stayalive
-pidfile /var/run/xinetd.pid
root 1180 1 0 09:22 ? 00:00:00 /usr/sbin/vsftpd
/etc/vsftpd/vsftpd.conf
root 1192 1 0 09:22 ? 00:00:00 ddclient - sleeping for
270 seconds
root 1263 1 0 09:22 ? 00:00:00 /usr/libexec/postfix/master
postfix 1270 1263 0 09:22 ? 00:00:00 pickup -l -t fifo -u
postfix 1271 1263 0 09:22 ? 00:00:00 nqmgr -l -n qmgr -t fifo -u
root 1274 1 0 09:22 ? 00:00:00 gpm -t imps2 -m /dev/psaux
root 1283 1 0 09:22 ? 00:00:00 /usr/local/apache/bin/httpd
nobody 1292 1283 0 09:22 ? 00:00:00 /usr/local/apache/bin/httpd
nobody 1293 1283 0 09:22 ? 00:00:00 /usr/local/apache/bin/httpd
root 1294 1 0 09:22 ? 00:00:00 crond
root 1303 1 0 09:22 ? 00:00:00 /bin/sh
/usr/bin/mysqld_safe --datadir=/var/lib/mysql
--pid-file=/var/lib/mysql/aboulafia.pid
mysql 1338 1303 0 09:22 ? 00:00:00 /usr/sbin/mysqld
--basedir=/ --datadir=/var/lib/mysql --user=mysql
--pid-file=/var/lib/mysql/aboulafia.pid --skip-locking
xfs 1349 1 0 09:22 ? 00:00:00 xfs -droppriv -daemon
root 1363 1 0 09:22 ? 00:00:00 smbd -D
root 1367 1 0 09:22 ? 00:00:00 nmbd -D
daemon 1385 1 0 09:22 ? 00:00:00 /usr/sbin/atd
root 1391 1 0 09:22 ? 00:00:00
/usr/local/bin/camlgrenouille -t -f /usr/local/etc/grenouille.config
root 1442 1 0 09:22 tty1 00:00:00 /sbin/mingetty tty1
root 1443 1 0 09:22 tty2 00:00:00 /sbin/mingetty tty2
root 1444 1 0 09:22 tty3 00:00:00 /sbin/mingetty tty3
root 1445 1 0 09:22 tty4 00:00:00 /sbin/mingetty tty4
root 1446 1 0 09:22 tty5 00:00:00 /sbin/mingetty tty5
root 1447 1 0 09:22 tty6 00:00:00 /sbin/mingetty tty6
root 1448 1 0 09:22 ? 00:00:00 /usr/bin/kdm -nodaemon
root 1464 1 1 09:22 ? 00:00:10 /usr/upsman/psp/com -s
root 1465 1448 0 09:22 ? 00:00:01 /usr/X11R6/bin/X -auth
/var/run/xauth/A:0-eFQWY8
root 1470 1448 0 09:22 ? 00:00:00 -:0
root 1473 1 0 09:22 ? 00:00:00 /usr/upsman/psp/mon -s
root 1480 1470 0 09:22 ? 00:00:00 /usr/bin/kdm_greet
root 1598 1363 0 09:23 ? 00:00:00 smbd -D
nobody 1734 1283 0 09:27 ? 00:00:00 /usr/local/apache/bin/httpd
root 1817 1156 0 09:32 ? 00:00:00 /usr/sbin/sshd

6 réponses

Avatar
Emmanuel Fleury
Zouplaz wrote:
Bonjour, depuis plusieurs semaines il m'arrive un truc vraiment
désagréable et qui j'espère ne finira pas par me poser des problèmes
(corruption du filesystem) : mon serveur se gèle régulièrement, sans que
rien n'apparaisse dans les logs.


Que dis le /var/log/messages ?

Si tu n'y trouve rien, compile un noyau avec les options de kernel
debugging et avec les magic-keys (voir
linux-2.6.14.1/Documentation/sysrq.txt) et si ta machine replante, note
le Oops qui sera affiché.

Sans ce message d'erreur on ne peut pas faire grand chose pour toi.

PS: À tout hasard fait un memcheck de ta RAM et vérifie l'intégrité de
ton système de fichiers avec fsck.

Amicalement
--
Emmanuel Fleury

Real computer scientists despise the idea of actual hardware.
Hardware has limitations, software doesn't.
It's a real shame that Turing machines are so poor at I/O.
-- Unknown

Avatar
Zouplaz
Emmanuel Fleury wrote:
Zouplaz wrote:

Bonjour, depuis plusieurs semaines il m'arrive un truc vraiment
désagréable et qui j'espère ne finira pas par me poser des problèmes
(corruption du filesystem) : mon serveur se gèle régulièrement, sans que
rien n'apparaisse dans les logs.



Que dis le /var/log/messages ?

Si tu n'y trouve rien, compile un noyau avec les options de kernel
debugging et avec les magic-keys (voir
linux-2.6.14.1/Documentation/sysrq.txt) et si ta machine replante, note
le Oops qui sera affiché.

Sans ce message d'erreur on ne peut pas faire grand chose pour toi.

PS: À tout hasard fait un memcheck de ta RAM et vérifie l'intégrité de
ton système de fichiers avec fsck.

Amicalement


Merci pour ces conseils, je vais recompiler le kernel comme tu le
précises (j'ai tenté d'upgrader jusqu'à la dernière 2.4 mais ça n'a rien
changé). Ca devrait m'aider !

Pour le fsck, il est effectué en totalité après chaque crash (au reboot)
donc pas de soucis de ce côté là.


Avatar
Christophe PEREZ
Le Fri, 25 Nov 2005 09:34:40 +0100, Zouplaz a écrit:

Je suis preneur de vos avis éclairés !! Merci


Par pur hasard complet, tu n'aurais pas un modem avec driver linuxant qui
tourne ?
Un lsmod nous aurait aussi montré les modules chargés.

Je dis ça, tout simplement parce que j'ai longtemps eu des plantages de
mon serveur, uniquement dus au fait que j'utilisais le driver beta (le
seul gratuit). Du jour où j'ai payé pour le driver à jour, je n'ai plus
eu ces plantages.
Bon, depuis, j'ai changé de serveur, et donc de modem.

root 1448 1 0 09:22 ? 00:00:00 /usr/bin/kdm -nodaemon
root 1465 1448 0 09:22 ? 00:00:01 /usr/X11R6/bin/X -auth
/var/run/xauth/A:0-eFQWY8
root 1470 1448 0 09:22 ? 00:00:00 -:0
root 1480 1470 0 09:22 ? 00:00:00 /usr/bin/kdm_greet


Hum !
Serveur disais-tu ?

Et la GUI de mldonkey tourne au moment des plantages ?
Parce que elle, elle est (était, à l'époque) particulièrement gourmande,
et pas nécessairement stable.

--
Christophe PEREZ
Écrivez moi sans _faute !

Avatar
Zouplaz
Christophe PEREZ wrote:



Par pur hasard complet, tu n'aurais pas un modem avec driver linuxant qui
tourne ?
Un lsmod nous aurait aussi montré les modules chargés.

Je dis ça, tout simplement parce que j'ai longtemps eu des plantages de
mon serveur, uniquement dus au fait que j'utilisais le driver beta (le
seul gratuit). Du jour où j'ai payé pour le driver à jour, je n'ai plus
eu ces plantages.
Bon, depuis, j'ai changé de serveur, et donc de modem.



Non, pas de modem ou de driver spécifique et aucun patch du noyau...

lsmod :

Module Size Used by Not tainted
ipt_ULOG 4804 2 (autoclean)
ipt_MASQUERADE 3160 1 (autoclean)
ipt_state 1016 2 (autoclean)
iptable_nat 30136 1 (autoclean) [ipt_MASQUERADE]
ip_conntrack 40648 0 (autoclean) [ipt_MASQUERADE ipt_state
iptable_nat]
iptable_filter 2412 1 (autoclean)
ip_tables 18016 7 [ipt_ULOG ipt_MASQUERADE ipt_state
iptable_nat iptable_filter]



root 1448 1 0 09:22 ? 00:00:00 /usr/bin/kdm -nodaemon
root 1465 1448 0 09:22 ? 00:00:01 /usr/X11R6/bin/X -auth
/var/run/xauth/A:0-eFQWY8
root 1470 1448 0 09:22 ? 00:00:00 -:0
root 1480 1470 0 09:22 ? 00:00:00 /usr/bin/kdm_greet



Hum !
Serveur disais-tu ?



Serveur de dev ;-) Je laisserais pas tourner X sinon - Pis quand même
j'ai quelques règles iptables.

Et la GUI de mldonkey tourne au moment des plantages ?
Parce que elle, elle est (était, à l'époque) particulièrement gourmande,
et pas nécessairement stable.



Non, je me sert d'un navigateur web à partir d'un autre poste du réseau.
J'ai jamais utilisé de gui pour mldonkey.


Avatar
Zouplaz
Emmanuel Fleury wrote:


Si tu n'y trouve rien, compile un noyau avec les options de kernel
debugging et avec les magic-keys (voir
linux-2.6.14.1/Documentation/sysrq.txt) et si ta machine replante, note
le Oops qui sera affiché.



J'ai donc tenté, et activé presque toutes les options de debugging. Ca
tourne pas plus lentement qu'avant par contre ça fait deux jours que je
le maltraite et il n'a pas planté (dans des circonstances où ça n'aurait
pas manqué d'arriver).

Parmi les options il y avait celles concernant la mémoire (vérification
stack, parité, et je sais plus quoi)

Par contre, toujours rien dans les logs -

Avatar
Emmanuel Fleury
Zouplaz wrote:

J'ai donc tenté, et activé presque toutes les options de debugging. Ca
tourne pas plus lentement qu'avant


Les mécanismes que tu ajoutes au noyau n'interviennent qu'en cas de
crash, pas lors du fonctionnement normal du système. C'est pour cela que
tu n'observes pas de ralentissement (cela dit, il doit y avoir un petit
ralentissement, mais tu ne peux pas le percevoir).

par contre ça fait deux jours que je
le maltraite et il n'a pas planté (dans des circonstances où ça n'aurait
pas manqué d'arriver).


Tant mieux ! :)

Parmi les options il y avait celles concernant la mémoire (vérification
stack, parité, et je sais plus quoi)


Lorsqu'une des conditions sera violée, tu aura un log, mais en attendant...

Certains bugs sont très long à trouver (et pas évident). Par exemple,
celui-ci m'a demandé environs un an: http://www.cs.aau.dk/~fleury/bug_cms/

Il faut persister et ne pas se décourager et ne pas assumer des choses
qui n'existent pas.

Amicalement
--
Emmanuel Fleury

The great difficulty in debugging: You have to divorce yourself
from preconceptions, make your mind blank, unlinked, unchanneld,
the Zen state ...
-- Ellen Ullman (The Bug)