OVH Cloud OVH Cloud

Bind meurt abruptement

8 réponses
Avatar
steve
Bonjour la liste,

J'ai install=E9 un serveur DNS Bind (verson Sarge) en cache-only. Il foncti=
onne=20
tr=E8s bien sauf qu'assez r=E9guli=E8rement (difficile =E0 quantifier, peut=
=2D=EAtre une=20
fois par semaine), le processus meurt sans crier gare. Et aucune trace dans=
=20
les logs. J'ai googlis=E9, regard=E9 les diff=E9rentes options, mais rien q=
ui ne me=20
permettent de comprendre ce comportement.=20

Cela n'est pas tr=E8s grave, je n'ai qu'=E0 relancer le processus, mais je =
perds=20
bien s=FBr les correspondances du pass=E9,et il faut donc attendre un momen=
t pour=20
que cela soit efficace =E0 nouveau.

Auriez-vous une explication et un moyen de corriger cela (l'option=20
magique ?) ?

Merci et tr=E8s belle journ=E9e

=2D-=20
steve
jabber : sdl@jabber.org

8 réponses

Avatar
Jean-Michel OLTRA
bonjour,


Le lundi 09 janvier 2006, steve a écrit...


le processus meurt sans crier gare. Et aucune trace dans
les logs. J'ai googlisé, regardé les différentes options, mais rien qui ne me
permettent de comprendre ce comportement.




Peu problable, mais...En cas de défaut de mémoire le noyau peut tuer des
processus pour faire de la place.

Remède dans ce cas : alléger la machine ou rajouter de la ram, ou du
swap.

--
jm



--
Pensez
Avatar
steve
Le Lundi, 9 Janvier 2006 11.28, Jean-Michel OLTRA a écrit :
bonjour,


Le lundi 09 janvier 2006, steve a écrit...

> le processus meurt sans crier gare. Et aucune trace dans
> les logs. J'ai googlisé, regardé les différentes options , mais rien qui
> ne me permettent de comprendre ce comportement.

Peu problable, mais...En cas de défaut de mémoire le noyau peut tuer des
processus pour faire de la place.

Remède dans ce cas : alléger la machine ou rajouter de la ram, ou du
swap.



j'y avais pensé mais comme j'ai 2G de mémoire je me suis dit que ce ne devait
pas être cela. Mais si c'était vraiment cela, y a-t-il un moyen d e dire au
noyau de tuer un autre processus plutôt que bind ? Genre un "nice"
apparenté ?

Merci de ta réponse.


--
jm



--
steve
jabber :
Avatar
Frédéric Bothamy
* steve [2006-01-09 12:10] :
Le Lundi, 9 Janvier 2006 11.28, Jean-Michel OLTRA a écrit :
> bonjour,
>
>
> Le lundi 09 janvier 2006, steve a écrit...
>
> > le processus meurt sans crier gare. Et aucune trace dans
> > les logs. J'ai googlisé, regardé les différentes options, mais rien qui
> > ne me permettent de comprendre ce comportement.
>
> Peu problable, mais...En cas de défaut de mémoire le noyau peut tuer des
> processus pour faire de la place.
>
> Remède dans ce cas : alléger la machine ou rajouter de la ram, ou du
> swap.

j'y avais pensé mais comme j'ai 2G de mémoire je me suis dit que ce ne devait
pas être cela. Mais si c'était vraiment cela, y a-t-il un moyen de dire au
noyau de tuer un autre processus plutôt que bind ? Genre un "nice"
apparenté ?



Il est possible de faire cela avec /proc/<pid>/oom_{score,adj} (pour le
noyau 2.6.14.4 et probablement des 2.6 auparavant, a priori, cela
n'existe pas pour les 2.4). La documentation sur l'utilisation de ces
paramètres semble absente des sources du noyau, par contre, il y en a un
peu sur cette page : http://lwn.net/Articles/104180/.

Cela dit, normalement, sur un oom-kill, le noyau écrit dans les logs ce qu'il
a fait.


Fred

--
Comment poser les questions de manière intelligente ?
http://www.gnurou.org/Writing/SmartQuestionsFr
Comment signaler efficacement un bug ?
http://www.chiark.greenend.org.uk/~sgtatham/bugs-fr.html


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Jean-Michel OLTRA
bonjour,


Le lundi 09 janvier 2006, Frédéric Bothamy a écrit...


Il est possible de faire cela avec /proc/<pid>/oom_{score,adj} (pour le
noyau 2.6.14.4 et probablement des 2.6 auparavant, a priori, cela
n'existe pas pour les 2.4). La documentation sur l'utilisation de ces
paramètres semble absente des sources du noyau, par contre, il y en a un
peu sur cette page : http://lwn.net/Articles/104180/.



Cela dit, normalement, sur un oom-kill, le noyau écrit dans les logs ce qu'il
a fait.




Il n'y a pas une option du noyau qui traite de ça ? Il me semblait, et
j'ai regardé sans trouver.

--
jm



--
Pensez
Avatar
Pascal Hambourg
Jean-Michel OLTRA a écrit :



[Out of memory kill]
Il n'y a pas une option du noyau qui traite de ça ?



CONFIG_OOM_KILLER ?


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Frédéric Bothamy
* Pascal Hambourg [2006-01-09 20:23] :
Jean-Michel OLTRA a écrit :
>
[Out of memory kill]
>Il n'y a pas une option du noyau qui traite de ça ?

CONFIG_OOM_KILLER ?



De mémoire, cette option n'est présente que dans les noyaux 2.4 (en tout
cas, je ne la trouve dans aucun des patchs-2.6.*.bz2 sur ma machine).
Pour les noyaux 2.6, il doit falloir utiliser les /proc/<pid>/oom_*.


Fred

--
Comment poser les questions de manière intelligente ?
http://www.gnurou.org/Writing/SmartQuestionsFr
Comment signaler efficacement un bug ?
http://www.chiark.greenend.org.uk/~sgtatham/bugs-fr.html


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
steve
Bonjour à tous et merci pour vos réponses.

je vais aller voir ça dès que le temps me le permet.

a+ et bonne journée

Le Lundi, 9 Janvier 2006 23.59, Frédéric Bothamy a écrit :
* Pascal Hambourg [2006-01-09 20:23] :
> Jean-Michel OLTRA a écrit :
>
> [Out of memory kill]
>
> >Il n'y a pas une option du noyau qui traite de ça ?
>
> CONFIG_OOM_KILLER ?

De mémoire, cette option n'est présente que dans les noyaux 2.4 (en t out
cas, je ne la trouve dans aucun des patchs-2.6.*.bz2 sur ma machine).
Pour les noyaux 2.6, il doit falloir utiliser les /proc/<pid>/oom_*.


Fred

--
Comment poser les questions de manière intelligente ?
http://www.gnurou.org/Writing/SmartQuestionsFr
Comment signaler efficacement un bug ?
http://www.chiark.greenend.org.uk/~sgtatham/bugs-fr.html



--
steve
jabber :
Avatar
steve
Bonjour la liste,

et voilà, Bind s'est éteint à nouveau ce matin, sans faire beaucoup d e bruit,
avec comme seul message dans syslog :

named[374]: name.c:2791: REQUIRE(suffixlabels > 0) failed
named[374]: exiting (due to assertion failure)

J'ai un un peu Googlesisé, été voir le BTS, où je trouve le #186648 mais sans
soution.

Je précise que j'utilise la version 9.2.4-1 de Sarge.

Et depuis, impossible de relancer le daemon.

/etc/init.d/bind9 start
Starting domain name service: named.

mais

ps aux | grep named
root 16517 0.0 0.0 2192 720 pts/4 S+ 10:56 0:00 grep named

Aussi :

rndc restart
Instruction illégale


Donc gros problème.

Une idée ?

Merci et bonne journée

--
steve
jabber :