OVH Cloud OVH Cloud

newbie : plantage openBSD -- aide demandée

3 réponses
Avatar
Jean-Francois Boisvieux
j'ai installé openBSD 3.5 comme nat/firewall sans problème (sinon
l'obligation de gérer par un script les coupure pppoe de wanadoo).
Cette nuit j'ai lancé un gros transfert de fichier via un scp, depuis
une machine externe sur le routeur openBSD (evidemment c'est pas optimal
mais il était tard). La surprise a été de retrouver le routeur planté
(j'ai eu l'impression que la machine était en cours de reboot, mais je
n'avais pas la main via une console, j'ai été obligé de faire un reboot
physique)

j'ai bien sur regardé les logs dans messages et la seule chose que je
trouve est :

-- debut
May 28 19:00:01 namouic syslogd: restart
May 28 20:00:02 namouic syslogd: restart
May 28 21:00:01 namouic syslogd: restart
May 28 22:00:01 namouic syslogd: restart
May 28 23:00:01 namouic syslogd: restart
May 29 00:00:01 namouic syslogd: restart
May 29 01:00:02 namouic syslogd: restart
May 29 02:00:02 namouic syslogd: restart
May 29 08:18:35 namouic syslogd: restart
May 29 08:18:35 namouic /bsd: OpenBSD 3.5 (GENERIC) #34: Mon Mar 29
12:24:55 MST 2004
May 29 08:18:35 namouic /bsd:
deraadt@i386.openbsd.org:/usr/src/sys/arch/i386/compile/GENERIC
-- fin

apparemment il s'est planté apres 2 h du matin et je l'ai rebooté à 8:18

questions

quel log fouiller pour trouver la raison de ce comportement
invraisemblable (je croyais que open était rock-solid !)

JFB

3 réponses

Avatar
Benjamin Pineau
Le Sat, 29 May 2004 12:07:25 +0200,
Jean-Francois Boisvieux écrivais:

quel log fouiller pour trouver la raison de ce comportement
invraisemblable (je croyais que open était rock-solid !)


À première vue vous étes tombés sur un authentique bug du noyau
(chanceux, c'est fort rare) ou du matériel (moins rare), un os quoi.
Et le syslog n'aura pas eu loisir d'en porter témoignage (car ce sont
toujours les meilleurs qui partent les premiers). Sans les services
du noyau seule une vraie console et le ddb vous auraient apportés
plus d'informations (et/ou matière à rapport de bug).

Dans ce genre de situation un petit check-up du matériel peut être
éclairant, à commencer par un memtest (http://www.memtest86.com/),
un cpuburn (http://users.ev1.net/~redelm/) et aussi un "stress" (cf.
http://weather.ou.edu/~apw/projects/stress/).

Si le matériel réagit bien, et s'il vous est possible de reproduire
le problème (avec console) je vous serai très reconnaissant de faire
un sendbug(1) circonstancié et détaillé étant donné qu'il s'agirai
alors d'un problème grave, susceptible d'affecter d'autres utilisateurs.

En ce qui concerne vos soucis de connexion, en revanche, je suspecte
fortement une erreur de configuration: vous devez bien vous rendre
compte que nous sommes très nombreux à utiliser l'adsl avec cet OS
(et aussi avec wanadoo) sans rencontrer de problème ; vos précédents
messages manquaient cruellement de détails (logs ppp, fichiers de confs
etc.) pour permettre un diagnostique.

ps: utilisez vous les fonctionalités de QoS de pf ?


--
Benjamin Pineau

Avatar
Jean-Francois Boisvieux
merci, je vais tester le matériel et tenter de reproduire le plantage si
le matériel est O.K.

Pour pppoe je suis tout a fait persuadé que j'ai du faire une erreur qq
part, je vais d'abord regarder ce que sont les fonctionnalités Qos de
pf, et je communiquerai les détails si je n'arrive pas à y remedier tout
seul (maintenant je comprends que bien configuré pppoe doit se
reconnecter tout seul)



Benjamin Pineau wrote:
Le Sat, 29 May 2004 12:07:25 +0200,
Jean-Francois Boisvieux écrivais:

quel log fouiller pour trouver la raison de ce comportement
invraisemblable (je croyais que open était rock-solid !)



À première vue vous étes tombés sur un authentique bug du noyau
(chanceux, c'est fort rare) ou du matériel (moins rare), un os quoi.
Et le syslog n'aura pas eu loisir d'en porter témoignage (car ce sont
toujours les meilleurs qui partent les premiers). Sans les services
du noyau seule une vraie console et le ddb vous auraient apportés
plus d'informations (et/ou matière à rapport de bug).

Dans ce genre de situation un petit check-up du matériel peut être
éclairant, à commencer par un memtest (http://www.memtest86.com/),
un cpuburn (http://users.ev1.net/~redelm/) et aussi un "stress" (cf.
http://weather.ou.edu/~apw/projects/stress/).

Si le matériel réagit bien, et s'il vous est possible de reproduire
le problème (avec console) je vous serai très reconnaissant de faire
un sendbug(1) circonstancié et détaillé étant donné qu'il s'agirai
alors d'un problème grave, susceptible d'affecter d'autres utilisateurs.

En ce qui concerne vos soucis de connexion, en revanche, je suspecte
fortement une erreur de configuration: vous devez bien vous rendre
compte que nous sommes très nombreux à utiliser l'adsl avec cet OS
(et aussi avec wanadoo) sans rencontrer de problème ; vos précédents
messages manquaient cruellement de détails (logs ppp, fichiers de confs
etc.) pour permettre un diagnostique.

ps: utilisez vous les fonctionalités de QoS de pf ?




JFB


Avatar
Benjamin Pineau
Le Sun, 30 May 2004 09:21:51 +0200,
Jean-Francois Boisvieux écrivais:

Pour pppoe je suis tout a fait persuadé que j'ai du faire une erreur qq
part, je vais d'abord regarder ce que sont les fonctionnalités Qos de
pf, et je communiquerai les détails si je n'arrive pas à y remedier tout


Heu ... je vous ai induit en erreur avec ma question, désolé. Je la
posait parcequ'à l'époque où ça s'appellait encore altq, je faisait
planter les OS (OpenBSD et FreeBSD) à chaque fois que je tentait ce
genre manipulations: c'était très sensibles aux admins malhabiles
(depuis je fuis cet outil superstissieusement ;). Depuis ça a été
intégré dans pf (cf. la section 'Queueing' de pf.conf(5)).
Et comme les plantages apparaissaient selon les flux réseau, ça aurai
pu être une cause de votre problème. Mais c'est probablement une fausse
piste: si en vous ignorez l'existence, vous n'aurez certainement pas
saboté la conf.