OVH Cloud OVH Cloud

Linux se fige

21 réponses
Avatar
Pham
Bonjour,

Je sollicite votre aide pour résoudre un problème de plantage de linux.
Il arrive de temps en temps que tout se fige (écran, souris, réseau,
etc...), bref que linux se plante. Malheureusement je n'ai aucune
information suite au plantage et je ne connais donc pas précisemment la
cause pour pouvoir remonter la cause au développeurs (ou la corriger si
elle est connue).

Comment faire pour avoir plus d'informations de déboguage ?
Est-ce que le log des informations intervient assez tôt dans la chaîne
de traitement des informations pour que le problème puisse être écrit
avant que le noyau ne se plante ?

Pour info, le plantage intervient le plus souvent (mais pas toujours)
quand j'accède à un disque dur partitionné FAT32 (géré par windows) qui
possède quelques secteurs défectueux (mais impossible à corriger, merci
FAT32). Je suis sûr que c'est un plantage total et pas seulement un
plantage de X car impossible aussi d'accéder à la machine via le réseau.
Je suis sous Debian Woody avec un noyau 2.4.18 patché par les bons soins
des développeurs Debian.

Merci pour toute aide que vous pourrez m'apporter !

10 réponses

1 2 3
Avatar
Vincent Bernat
OoO En cette matinée pluvieuse du samedi 20 décembre 2003, vers 10:46,
Pham disait:

Je sollicite votre aide pour résoudre un problème de plantage de
linux. Il arrive de temps en temps que tout se fige (écran, souris,
réseau, etc...), bref que linux se plante. Malheureusement je n'ai
aucune information suite au plantage et je ne connais donc pas
précisemment la cause pour pouvoir remonter la cause au développeurs
(ou la corriger si elle est connue).


Je suppose qu'au moment où l'affichage se fige, tu es sous X, il est
donc compliqué pour le noyau de t'afficher les informations relatives
à ce plantage. Est-ce que les leds du clavier clignotent (dans le cas
d'un clavier PS/2 ou AT) ? Dans ce cas, tu peux trouver un patch
permettant d'obtenir le kernel panic en morse.

Pour info, le plantage intervient le plus souvent (mais pas
toujours) quand j'accède à un disque dur partitionné FAT32 (géré par
windows) qui possède quelques secteurs défectueux (mais impossible à
corriger, merci FAT32). Je suis sûr que c'est un plantage total et
pas seulement un plantage de X car impossible aussi d'accéder à la
machine via le réseau. Je suis sous Debian Woody avec un noyau
2.4.18 patché par les bons soins des développeurs Debian.


Comme a priori tu n'as pas besoin de X pour reproduire le bug, place
toi simplement dans la première console et essaie de reproduire le
problème. Le noyau devrait te donner le kernel panic si le plantage
n'est pas trop violent.
--
#ifdef STUPIDLY_TRUST_BROKEN_PCMD_ENA_BIT
2.4.0-test2 /usr/src/linux/drivers/ide/cmd640.c

Avatar
Jean-Claude(06)
Bonjour,

Si tu as un gros plantage et que tu n'arrives plus a recuperer
la main.
Essaye les Magic Systrequest Keys (Jette un oeil sur le guide de reference debian
ou tout simplement google)
EN bref, tu fais en aveugle en regardant si ton proc s'est
mis en marche et a pris en compte la commande parceque evidemment
ton clavier ne l'affichera pas (il est plante)
Tu fais dans l'ordre:
Alt + Syst + R
Alt + Syst + S puis E, I, U, B
Et ensuite ton PC rebootes proprement.
Ensuite au boot suivant tu peux deja aller voir tes logs, non ?

J.C
Avatar
Pham
On Sat, 20 Dec 2003 12:22:32 -0800, Vincent Bernat

Je sollicite votre aide pour résoudre un problème de plantage de
linux. Il arrive de temps en temps que tout se fige (écran, souris,
réseau, etc...), bref que linux se plante. Malheureusement je n'ai
aucune information suite au plantage et je ne connais donc pas
précisemment la cause pour pouvoir remonter la cause au développeurs
(ou la corriger si elle est connue).


Je suppose qu'au moment où l'affichage se fige, tu es sous X, il est
donc compliqué pour le noyau de t'afficher les informations relatives
à ce plantage. Est-ce que les leds du clavier clignotent (dans le cas
d'un clavier PS/2 ou AT) ? Dans ce cas, tu peux trouver un patch
permettant d'obtenir le kernel panic en morse.


Pas de chance, j'ai un clavier sans LED !

Pour info, le plantage intervient le plus souvent (mais pas
toujours) quand j'accède à un disque dur partitionné FAT32 (géré par
windows) qui possède quelques secteurs défectueux (mais impossible à
corriger, merci FAT32). Je suis sûr que c'est un plantage total et
pas seulement un plantage de X car impossible aussi d'accéder à la
machine via le réseau. Je suis sous Debian Woody avec un noyau
2.4.18 patché par les bons soins des développeurs Debian.


Comme a priori tu n'as pas besoin de X pour reproduire le bug, place
toi simplement dans la première console et essaie de reproduire le
problème. Le noyau devrait te donner le kernel panic si le plantage
n'est pas trop violent.


Non je n'ai aucun message à l'écran au moment du plantage.
Ah ! et j'avais oublié de dire que je constatais le même problème avec
la Mandrake 9.0, cependant avec la Mandrake c'était quasi systématique
alors qu'avec Debian c'est beaucoup plus rare et plus aléatoire...
bizarre...


Avatar
Pham
On Sun, 21 Dec 2003 10:50:17 +0100, Jean-Claude(06)

Bonjour,

Si tu as un gros plantage et que tu n'arrives plus a recuperer
la main.
Essaye les Magic Systrequest Keys (Jette un oeil sur le guide de
reference debian ou tout simplement google)
EN bref, tu fais en aveugle en regardant si ton proc s'est
mis en marche et a pris en compte la commande parceque evidemment
ton clavier ne l'affichera pas (il est plante)
Tu fais dans l'ordre:
Alt + Syst + R
Alt + Syst + S puis E, I, U, B
Et ensuite ton PC rebootes proprement.
Ensuite au boot suivant tu peux deja aller voir tes logs, non ?



Je ne pense pas avoir ces 'magic keys', il me semble qu'il faut
recompiler le noyau pour cela non ? Je soujaitais garder une
configuration la plus proche possible de la distribution Debian
d'origine (ça aide pour le déboguage...).
Cependant si je n'ai pas de logs suite à ce plantage en rebootant
sauvagement avec le bouton reset, pourquoi est-ce que j'en aurais avec
ces 'magic keys' ?
De plus si je ne peux même plus accéder à linux via le réseau, cela veut
bien dire que le noyau est planté non ? Dans ce cas il n'acceptera pas
mes 'magic keys' non plus non ?

Avatar
J. Mayer
On Sun, 21 Dec 2003 13:42:14 +0100, Pham wrote:

On Sun, 21 Dec 2003 10:50:17 +0100, Jean-Claude(06)

Bonjour,

Si tu as un gros plantage et que tu n'arrives plus a recuperer
la main.
Essaye les Magic Systrequest Keys (Jette un oeil sur le guide de
reference debian ou tout simplement google)
EN bref, tu fais en aveugle en regardant si ton proc s'est
mis en marche et a pris en compte la commande parceque evidemment
ton clavier ne l'affichera pas (il est plante)
Tu fais dans l'ordre:
Alt + Syst + R
Alt + Syst + S puis E, I, U, B
Et ensuite ton PC rebootes proprement.
Ensuite au boot suivant tu peux deja aller voir tes logs, non ?



Je ne pense pas avoir ces 'magic keys', il me semble qu'il faut
recompiler le noyau pour cela non ? Je soujaitais garder une
configuration la plus proche possible de la distribution Debian
d'origine (ça aide pour le déboguage...).
Cependant si je n'ai pas de logs suite à ce plantage en rebootant
sauvagement avec le bouton reset, pourquoi est-ce que j'en aurais avec
ces 'magic keys' ?
De plus si je ne peux même plus accéder à linux via le réseau, cela veut
bien dire que le noyau est planté non ? Dans ce cas il n'acceptera pas
mes 'magic keys' non plus non ?


Ca veut dire que le scheduler est planté et que la couche réseau ne
répond plus. Il est extrèmement rare que les Magic-Sys-Rq ne marchent
plus. Si tu n'as aucun message, celà veut sans doute dire que ton
noyau n'envoie pas ses messages sur la console. Pour activer
ces logs: <Alt><Syst><9>
Mais il est possible que les Magic-Sys-Rq ne soient pas activées. Dans
ce cas, le seul moyen pour les obtenir est de recompiler le noyau.


Avatar
lgmdmdlsr
Pham wrote:

Bonjour,

Je sollicite votre aide pour résoudre un problème de plantage de linux.
Il arrive de temps en temps que tout se fige (écran, souris, réseau,
etc...), bref que linux se plante. Malheureusement je n'ai aucune
information suite au plantage et je ne connais donc pas précisemment la
cause pour pouvoir remonter la cause au développeurs (ou la corriger si
elle est connue).


J'ai moi aussi ce genre de problème. Gel total de la machine aléatoire (mais
peu fréquent, en moyenne 2 à 3 fois par mois).
Le test avec Memtest86 signale des erreurs, donc il s'agit chez moi d'un
ennui matériel. (le problème est que les erreurs se produisent quelle que
soit la barrette de mémoire utilisée, donc ça doit être un problème de
carte-mère ...)

Donc : vérifier si le matériel fonctionne.


--
lgmdmdlsr

Avatar
Pham
On Sun, 21 Dec 2003 15:13:24 +0100, lgmdmdlsr
wrote :

Pham wrote:

Bonjour,

Je sollicite votre aide pour résoudre un problème de plantage de
linux. Il arrive de temps en temps que tout se fige (écran, souris,
réseau, etc...), bref que linux se plante. Malheureusement je n'ai
aucune information suite au plantage et je ne connais donc pas
précisemment la cause pour pouvoir remonter la cause au développeurs
(ou la corriger si elle est connue).


J'ai moi aussi ce genre de problème. Gel total de la machine aléatoire
(mais peu fréquent, en moyenne 2 à 3 fois par mois).
Le test avec Memtest86 signale des erreurs, donc il s'agit chez moi
d'un ennui matériel. (le problème est que les erreurs se produisent
quelle que soit la barrette de mémoire utilisée, donc ça doit être un
problème de carte-mère ...)

Donc : vérifier si le matériel fonctionne.



Aucun problème détecté avec memtest. Si c'est la carte mère je suis mal
barré... Comment on teste une carte mère ?


Avatar
J. Mayer
On Sun, 21 Dec 2003 20:10:59 +0100, Pham wrote:

On Sun, 21 Dec 2003 15:13:24 +0100, lgmdmdlsr

Pham wrote:

Bonjour,

Je sollicite votre aide pour résoudre un problème de plantage de
linux. Il arrive de temps en temps que tout se fige (écran, souris,
réseau, etc...), bref que linux se plante. Malheureusement je n'ai
aucune information suite au plantage et je ne connais donc pas
précisemment la cause pour pouvoir remonter la cause au développeurs
(ou la corriger si elle est connue).


J'ai moi aussi ce genre de problème. Gel total de la machine aléatoire
(mais peu fréquent, en moyenne 2 à 3 fois par mois).
Le test avec Memtest86 signale des erreurs, donc il s'agit chez moi
d'un ennui matériel. (le problème est que les erreurs se produisent
quelle que soit la barrette de mémoire utilisée, donc ça doit être un
problème de carte-mère ...)

Donc : vérifier si le matériel fonctionne.



Aucun problème détecté avec memtest. Si c'est la carte mère je suis mal
barré... Comment on teste une carte mère ?


Ca peut aussi être un driver qui délire (par ex qui part en boucle
infinie dans un handler d'interruption). Essaye de voir si tu as
toujours des problèmes avec un support minimal (le moins de modules
possibles chargés...).



Avatar
Motodashi
Le Sat, 20 Dec 2003 19:46:25 +0100, Pham a écrit:

Bonjour,

Je sollicite votre aide pour résoudre un problème de plantage de linux.
Il arrive de temps en temps que tout se fige (écran, souris, réseau,
etc...), bref que linux se plante. Malheureusement je n'ai aucune
information suite au plantage et je ne connais donc pas précisemment la
cause pour pouvoir remonter la cause au développeurs (ou la corriger si
elle est connue).

Comment faire pour avoir plus d'informations de déboguage ?
Est-ce que le log des informations intervient assez tôt dans la chaîne
de traitement des informations pour que le problème puisse être écrit
avant que le noyau ne se plante ?

Pour info, le plantage intervient le plus souvent (mais pas toujours)
quand j'accède à un disque dur partitionné FAT32 (géré par windows) qui
possède quelques secteurs défectueux (mais impossible à corriger, merci
FAT32). Je suis sûr que c'est un plantage total et pas seulement un
plantage de X car impossible aussi d'accéder à la machine via le réseau.
Je suis sous Debian Woody avec un noyau 2.4.18 patché par les bons soins
des développeurs Debian.

Merci pour toute aide que vous pourrez m'apporter !


Moi j'avais ce probleme aussi, en regardant dans /var/log/messages au
moment ou ca a fige, j'ai vu que le probleme venait d'un daemon (diald)
qui essayait de se connecter a internet, je l'ai desinstalle et ca a l'air
de marcher

--
<Mooby> dites comment on fait pour lancer un prg sous NT? on double
clique dessus, c'est bien ca ?

- #linuxfr

Avatar
Pham
X-Newsreader: Sylpheed version 0.9.8claws (GTK+ 1.2.10; i686-pc-linux-gnu)
Mime-Version: 1.0
Content-Type: text/plain; charset=ISO-8859-1
Content-Transfer-Encoding: 8bit

On Sun, 21 Dec 2003 14:15:44 +0100, "J. Mayer"

Bonjour,

Si tu as un gros plantage et que tu n'arrives plus a recuperer
la main.
Essaye les Magic Systrequest Keys (Jette un oeil sur le guide de
reference debian ou tout simplement google)
EN bref, tu fais en aveugle en regardant si ton proc s'est
mis en marche et a pris en compte la commande parceque evidemment
ton clavier ne l'affichera pas (il est plante)
Tu fais dans l'ordre:
Alt + Syst + R
Alt + Syst + S puis E, I, U, B
Et ensuite ton PC rebootes proprement.
Ensuite au boot suivant tu peux deja aller voir tes logs, non ?



Je ne pense pas avoir ces 'magic keys', il me semble qu'il faut
recompiler le noyau pour cela non ? Je soujaitais garder une
configuration la plus proche possible de la distribution Debian
d'origine (ça aide pour le déboguage...).
Cependant si je n'ai pas de logs suite à ce plantage en rebootant
sauvagement avec le bouton reset, pourquoi est-ce que j'en aurais
avec ces 'magic keys' ?
De plus si je ne peux même plus accéder à linux via le réseau, cela
veut bien dire que le noyau est planté non ? Dans ce cas il
n'acceptera pas mes 'magic keys' non plus non ?


Ca veut dire que le scheduler est planté et que la couche réseau ne
répond plus. Il est extrèmement rare que les Magic-Sys-Rq ne marchent
plus. Si tu n'as aucun message, celà veut sans doute dire que ton
noyau n'envoie pas ses messages sur la console. Pour activer
ces logs: <Alt><Syst><9>
Mais il est possible que les Magic-Sys-Rq ne soient pas activées. Dans
ce cas, le seul moyen pour les obtenir est de recompiler le noyau.


Bon après recompilation du noyau et tout le toutim : c'est bien planté
!!
Même les 'Magic-Sys-Rq' ne marchent plus !
Au niveau des logs même après le passage en 'verbosité' maximale
(Alt-Sys-9) il n'y a toujours rien !
Ah si il y a dans le kern.log :
kernel: 22:45: rw=0, want83444632, limit8443513
kernel: attempt to access beyond end of device

Mais ça m'étonne que cela suffise à planter le kernel...

Bon je vais essayer de voir si je peux enlever les modules petit à petit
mais ça commence à devenir vraiment fastidieux cette histoire...

Merci quand même pour ton aide !



1 2 3