Comment provoquer, volontairement, un crash de linux ?

Le
Yann Cohen
Bonjour,

En fait je dois envoyer loin loin d'ici une machine fonctionnant sous
Debian lenny.

L'appli sur cette machine plante de proche en proche nécessitant un
long long déplacement pour appuyer sur le bouton marche arrêt
(fréquence de type une fois tous les 15 jours aléatoirement).

Donc pour, dans un premier temps, éviter ces déplacements et en t=
ablant
sur un crash système, j'ai mis en place dans sysctl.conf une ligne
kernel.panic = 20 qui est prévue pour un reboot au bout de 20 second=
es
après le crash.

Avant d'envoyer la CPU sur site et comme pour l'instant je n'ai pas
réussi à mettre en place un banc de test qui réussi à t=
ous les coups le
plantage du système complet (6 mois de fonctionnement : deux cas de
plantage aléatoire), je cherche à "voir" fonctionner le reboot
automatique sur plantage système

D'où ma question : existe-t-il une méthode pour simuler ou provoq=
uer un
crash système ?

Merci.

--
Yann.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers debian-user-french-REQUEST@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmaster@lists.debian.org
Archive: http://lists.debian.org/20111206085049.57406a5e@lurr069-l.ianco.homelinux.org
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Yves Rutschle
Le #24037171
On Tue, Dec 06, 2011 at 08:50:49AM +0100, Yann Cohen wrote:
L'appli sur cette machine plante de proche en proche nécessitant un
long long déplacement pour appuyer sur le bouton marche arrêt...
(fréquence de type une fois tous les 15 jours aléatoirement).



Je ne comprend pas: c'est l'appli ou le noyau qui crash?

D'où ma question : existe-t-il une méthode pour simuler ou provoquer un
crash système ?



cat /dev/random > /proc/kcore ?

Mais plus sérieusement, ce qu'il te faut, c'est une carte
watchdog.

Y.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Yann Cohen
Le #24037261
Le Tue, 6 Dec 2011 09:08:06 +0100,
Yves Rutschle
On Tue, Dec 06, 2011 at 08:50:49AM +0100, Yann Cohen wrote:
> L'appli sur cette machine plante de proche en proche nécessitant un
> long long déplacement pour appuyer sur le bouton marche arrêt ...
> (fréquence de type une fois tous les 15 jours aléatoirement).

Je ne comprend pas: c'est l'appli ou le noyau qui crash?


Et bien, les rapports des observateurs envoyés sur place me laisse un
doute : le système ne répond plus au niveau réseau (mêm e le ping n'est
plus accessible), l'appli est silencieuse, plus de prompte console, mais
la console n'afficherai pas l'écran de crash.


> D'où ma question : existe-t-il une méthode pour simuler ou
> provoquer un crash système ?

cat /dev/random > /proc/kcore ?


Ok je vais essayer de ce pas !


Mais plus sérieusement, ce qu'il te faut, c'est une carte
watchdog.



Oui, c'est une piste que j'envisage depuis un certain temps d'autant
plus que la CPU est une geode LX avec un watchdog physique intégrà ©.

Mais l'ajout du paquet watchdog ou la compilation du noyau avec
explicitement la prise en compte du compagnon de la geode ne donne
satisfaction : aujourd'hui aucun /dev/watchdog créer et la
documentation glanée sur le net ne m'a pas permis d'avancer beaucoup
sur ce point...

Coté applicatif multi-thread, j'ai mis en place un pseudo watchdog
applicatif : si absence de signalisation du fonctionnement des threads
critique alors reboot de la cible.

Je verrai bien qui déclenche : l'appli ou non (enfin si elle a le temps
de tracer ses log...).

Enfin le caractère exceptionnel de ce comportement rend "complexe"
l'analyse puisqu'il s'agit un seul site sur plus d'une centaine et sur
lequel tous les éléments matériel ont déjà ét é changés.

Y.



--
Yann.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Jean-Yves F. Barbier
Le #24037401
On Tue, 6 Dec 2011 09:46:43 +0100
Yann Cohen
> Je ne comprend pas: c'est l'appli ou le noyau qui crash?
Et bien, les rapports des observateurs envoyés sur place me laisse un
doute : le système ne répond plus au niveau réseau (mà ªme le ping n'est
plus accessible), l'appli est silencieuse, plus de prompte console, mais
la console n'afficherai pas l'écran de crash.



Ca doit-être la raison pour laquelle le watchdog ne réagit pas:
l'appli plante une partie du micro, mais il reste "opérationnel"
(d'ailleurs, ça serait intéressant de voir si on garde la poss. de
se connecter en SSH, auquel cas fini les déplacements).

Maintenant, la 1ère chose à faire serait d'avoir une appli stable ...

Déjà, as-tu fait un memtest de la Cte mère? (s/s entendu, ex iste-t'il
des conditions particulières s/s lesquelles l'appli se met à
consommer de la RAM?)

Sinon, si cette appli reste en fonctionnement 24/7, une autre
solution serait d'utiliser un cron pour la relancer à intervalles
réguliers.

Une autre encore serait de faire tourner l'appli dans une VM et de
la relancer lorsqu'elle ne répond plus (un genre de HA à la hache :)

Quelle type de traitement fournit cette appli?

…
Enfin le caractère exceptionnel de ce comportement rend "complexe"
l'analyse puisqu'il s'agit un seul site sur plus d'une centaine et sur
lequel tous les éléments matérielS ont déjà à ©té changés.



Certaines cartes réseau (Rhine-II, donc pas mal de D-link) ont une
fâcheuse tendance à mal se comporter et nécessitent un ifdow n/ifup
régulier pour continuer à fonctionner correctement.

--
printk("ufs_read_super: fucking Sun blows men");
-- /usr/src/linux/fs/ufs/ufs_super.c

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Frédéric Massot
Le #24037391
Yann Cohen

Je ne comprend pas: c'est l'appli ou le noyau qui crash?


Et bien, les rapports des observateurs envoyés sur place me laisse un
doute : le système ne répond plus au niveau réseau (même le ping n'est
plus accessible), l'appli est silencieuse, plus de prompte console, mais
la console n'afficherai pas l'écran de crash.





Tu peux vérifier que le système tourne toujours en demandant à rsyslog
de laisser des marques dans les logs.

Dans le fichier "/etc/rsyslog.conf", tu dé-commentes la ligne :

$ModLoad immark


Et pour que ces marques soient inscrites de façon inconditionnelles tu
ajoutes :

$ActionWriteAllMarkMessages on

Au dessus du bloc :

*.=info;*.=notice;*.=warn;
auth,authpriv.none;
cron,daemon.none;
mail,news.none -/var/log/messages

Tu auras une marque "-- MARK --" dans le fichier "/var/log/messages"
toutes les 20 minutes.

--
============================================= | FRÉDÉRIC MASSOT |
| http://www.juliana-multimedia.com |
| mailto: |
==========================Þbian=GNU/Linux==
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Grégory Bulot
Le #24037421
Bonjour, Bonsoir,

Le Tue, 6 Dec 2011 09:08:06 +0100, Yves Rutschle, vous avez écrit :

On Tue, Dec 06, 2011 at 08:50:49AM +0100, Yann Cohen wrote:
> L'appli sur cette machine plante de proche en proche nécessitant un
> long long déplacement pour appuyer sur le bouton marche arrêt...
> (fréquence de type une fois tous les 15 jours aléatoirement).

Je ne comprend pas: c'est l'appli ou le noyau qui crash?




J'adore cette façon de ne pas répondre à la question initiale,
heureusement que plus bas vous proposez une solution. Malheureusement
les contributeurs suivant de ce fil ont oublié de lire le sujet ...


Si l'auteur avait demandé "pouvez-vous me dire pourquoi mon appli
plante", il se serait fait incendier sur environ 500 posts pendant 2-3
semaines.

C'est dommage, je trouvais la question de l'auteur intéressante.





--
Cordialement
Grégory BULOT

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Yann Cohen
Le #24037641
Le Tue, 6 Dec 2011 09:08:06 +0100,
Yves Rutschle
[...]
> D'où ma question : existe-t-il une méthode pour simuler ou
> provoquer un crash système ?

cat /dev/random > /proc/kcore ?


Non !
marche pas...

Yann.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Matthieu
Le #24037731
On Tue, Dec 6, 2011 at 11:57, Yann Cohen
Le Tue, 6 Dec 2011 09:08:06 +0100,
Yves Rutschle
[...]
> D'où ma question : existe-t-il une méthode pour simuler ou
> provoquer un crash système ?

cat /dev/random > /proc/kcore ?


Non !
marche pas...



Bonjour,

"echo c > /proc/sysrq-trigger" devrait faire l'affaire.


Yann.



--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/CAK6ghz-nu0DycjNdPXd92Gsa1wcjiLUEHBE1BFQ-FN67d7rb+
Yves Rutschle
Le #24038481
On Tue, Dec 06, 2011 at 10:31:24AM +0100, Grégory Bulot wrote:
J'adore cette façon de ne pas répondre à la question initiale,
heureusement que plus bas vous proposez une solution. Malheureusement
les contributeurs suivant de ce fil ont oublié de lire le sujet ...



J'imagine que quand on te demande si tu as l'heure, tu
réponds "oui".

Le but de l'auteur n'est pas planter son système, c'est
qu'il redémarre correctement lorsqu'il plante. Comme
d'habitude, on essaie d'extrapoler le besoin derrière la
question.

Je t'invite à lire
http://catb.org/~esr/faqs/smart-questions.html#symptoms
(en français au 3.8 ici:
http://1100f.free.fr/smart-questions-fr.pdf).

Si l'auteur avait demandé "pouvez-vous me dire pourquoi mon appli
plante", il se serait fait incendier sur environ 500 posts pendant 2-3
semaines.



Non, la question que j'ai l'impression qu'il voulait poser,
c'est: "Mon serveur semble planter [description des
symptômes], comment résoudre ce problème sachant qu'on ne
peut pas toucher à l'application".

Y.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Yves Rutschle
Le #24038531
On Tue, Dec 06, 2011 at 09:46:43AM +0100, Yann Cohen wrote:
Et bien, les rapports des observateurs envoyés sur place me laisse un
doute : le système ne répond plus au niveau réseau (même le ping n'est
plus accessible), l'appli est silencieuse, plus de prompte console, mais
la console n'afficherai pas l'écran de crash.



Ok, ça ressemble donc bien à un crash de noyau ou un
problème matériel. Si ça plante "suffisament", on peut se
retrouver figé et ne pas arriver à afficher l'écran de
crash. Mais si ça plante à ce point, la solution en
demandant au noyau de redémarrer 20 secondes après son crash
ne va pas marcher non plus (ça ne peut marcher que si le
noyau marche encore suffisament). Et aucune solution à base
de watchdog logiciel ne suffira.

> Mais plus sérieusement, ce qu'il te faut, c'est une carte
> watchdog.

Oui, c'est une piste que j'envisage depuis un certain temps d'autant
plus que la CPU est une geode LX avec un watchdog physique intégré.



Désolé, je ne connais pas ces choses là. Après compilation
et chargement du pilote tu ne le vois pas dans
/proc/devices?

Y.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Publicité
Poster une réponse
Anonyme