OVH Cloud OVH Cloud

reboot toutes les 27m30s

71 réponses
Avatar
Essomba
Bonjour à tous,

une machine que j'ai à l'autre bout du monde, reboote toutes les 27m30s
à peu près :

Uptime | System Boot up
----------------------------+---------------------------------------------------
1 0 days, 00:27:40 | Linux 2.6.32-5-amd64 08:46:43 2012
2 0 days, 00:27:37 | Linux 2.6.32-5-amd64 07:20:17 2012
3 0 days, 00:27:36 | Linux 2.6.32-5-amd64 09:15:36 2012
4 0 days, 00:27:35 | Linux 2.6.32-5-amd64 07:49:03 2012
5 0 days, 00:27:30 | Linux 2.6.32-5-amd64 08:17:54 2012

j'ai regardé dans les logs : rien. J'ai regardé les crontab, rien qui ne
se lance à cette périodicité.

Auriez-vous une idée ? Comment trouver le coupable sans prendre un
billet d'avion ?

Merci,

Laurent

PS : de plus, régulièrement uptimed ne retrouve pas/écrase/perds ses
logs... savez-vous pourquoi ?


--
Remplacez yahou par yahoo et com par fr pour me répondre en direct

Laurent

10 réponses

1 2 3 4 5
Avatar
xavier
denis.paris wrote:

> il reboote ou il redémarre ?
>

C'est un peu comme de demander "est-ce que ça vous grattouille, ou
est-ce que ça vous chatouille?"



Non, il n'a pas tort : un reboot est une séquence brutale, voire
hardware, envoyée, par ex. par le watchdog dont on parlait tout à
l'heure.

Un redémarrage est une instruction propre, envoyée par un script ou un
daemon.

L'absence de fsck dans les logs de notre ami indique un shutdown propre,
ce qui semblerait pouvoir exclure la panne matérielle.

Cela dit, un circuit matériel peut très bien envoyer un Ctrl-Alt-Del,
qui est en principe trappé sur un shutdown "régulier"

--
XAv
In your pomp and all your glory you're a poorer man than me,
as you lick the boots of death born out of fear.
(Jethro Tull)
Avatar
JKB
Le Thu, 2 Feb 2012 15:07:41 +0100,
Xavier écrivait :
denis.paris wrote:

> il reboote ou il redémarre ?
>

C'est un peu comme de demander "est-ce que ça vous grattouille, ou
est-ce que ça vous chatouille?"



Non, il n'a pas tort : un reboot est une séquence brutale, voire
hardware, envoyée, par ex. par le watchdog dont on parlait tout à
l'heure.

Un redémarrage est une instruction propre, envoyée par un script ou un
daemon.

L'absence de fsck dans les logs de notre ami indique un shutdown propre,
ce qui semblerait pouvoir exclure la panne matérielle.

Cela dit, un circuit matériel peut très bien envoyer un Ctrl-Alt-Del,
qui est en principe trappé sur un shutdown "régulier"



Et qui serait loggué dans les journaux.

JKB

--
Si votre demande me parvient sur carte perforée, je titiouaillerai très
volontiers une réponse...
=> http://grincheux.de-charybde-en-scylla.fr
Avatar
Essomba
On 02/02/2012 15:07, Xavier wrote:
denis.paris wrote:

il reboote ou il redémarre ?




C'est un peu comme de demander "est-ce que ça vous grattouille, ou
est-ce que ça vous chatouille?"



Non, il n'a pas tort : un reboot est une séquence brutale, voire
hardware, envoyée, par ex. par le watchdog dont on parlait tout à
l'heure.

Un redémarrage est une instruction propre, envoyée par un script ou un
daemon.

L'absence de fsck dans les logs de notre ami indique un shutdown propre,
ce qui semblerait pouvoir exclure la panne matérielle.



moi j'ai un doute là dessus. Car il y a quand même des pertes de data :
les logs de uptimed, les fichiers où je loggais les processus actifs qui
sont vides sur la dernière minute... Bref on dirait quand même qu'il y a
de la casse. Mais rien de lost+found, pas de fsck, un reboot en moins de
2 minutes (excluant un fsck sur le To de disque), ...

De plus quand on reboote, il y a un broadcast aux console et il est
loggé. Or là, pas de log de reboot, pas de broadcast...




--
Remplacez yahou par yahoo et com par fr pour me répondre en direct

Laurent
Avatar
JKB
Le Thu, 02 Feb 2012 15:21:09 +0100,
denis.paris écrivait :
Le 02/02/2012 14:28, Essomba a écrit :
On 02/02/2012 13:59, denis.paris wrote:


La machine est dans une ambiance de 40°C, et peut-être même humide? Sans
indiscrétion, c'est dans quel pays?



c'est en guinée équatoriale. Oui elle brasse de la poussière, oui il
fait chaud et humides, mais ses sœurs d'à côté n'ont pas de problèmes...




Ne cherche pas plus loin. Et l'argument "les autres machines n'ont pas
de problèmes" est tout de même faiblard, hein! (tout comme celui de dire
"en France ça marchait très bien...)

Tu aurais dû commencer par nous dire ça...



Certes, mais de là à avoir une régularité de métronome...

JKB

--
Si votre demande me parvient sur carte perforée, je titiouaillerai très
volontiers une réponse...
=> http://grincheux.de-charybde-en-scylla.fr
Avatar
Essomba
On 02/02/2012 15:21, JKB wrote:


Tu aurais dû commencer par nous dire ça...



Certes, mais de là à avoir une régularité de métronome...

JKB




ben oué car mettons que le processeur chauffe. En l'espace d'un reboot
(2 minutes) il refroidit assez pour repartir ? Et 27m30, de jour comme
de nuit alors que la température change ?

Moi je doute vraiment d'une cause extérieure...


--
Remplacez yahou par yahoo et com par fr pour me répondre en direct

Laurent
Avatar
Qu'est ce qu'elle a ma gueule ?
On Thu, 02 Feb 2012 11:20:15 +0100, "denis.paris"
wrote:

Je penche plus pour un problème hardware, par exemple un ventilateur de
processeur encrassé qui provoque une surchauffe et un blocage du CPU.



Vachement précise la panne de ventillateur.
C'est toutes les 27m30



--
« le politiquement correct ne proclame pas la tolérance ; il ne fait qu'organiser la haine. » (Jacques Barzun)
C'est une doctrine obligatoire, qui n'est en réalité que l'expression la plus autoritaire du conformisme
Avatar
denis.paris
Le 02/02/2012 15:38, Essomba a écrit :
On 02/02/2012 15:21, JKB wrote:


Tu aurais dû commencer par nous dire ça...



Certes, mais de là à avoir une régularité de métronome...

JKB




ben oué car mettons que le processeur chauffe. En l'espace d'un reboot
(2 minutes) il refroidit assez pour repartir ? Et 27m30, de jour comme
de nuit alors que la température change ?

Moi je doute vraiment d'une cause extérieure...





Alors il reste la compromission de la machine, un root kit installé qui
provoque un init 0 dès le lancement. 30s c'est un temps typique pour
arrêter une machine.
Avatar
Qu'est ce qu'elle a ma gueule ?
On Thu, 02 Feb 2012 11:45:01 +0100, Essomba
wrote:

On 02/02/2012 11:42, Nicolas George wrote:
Essomba , dans le message <4f2a572c$0$10732$, a
écrit :
une machine que j'ai à l'autre bout du monde, reboote toutes les 27m30s
à peu près :



Une telle régularité me semble assez contradictoire avec l'idée d'un
problème matériel.

As-tu regardé s'il n'y aurait pas un watchdog ?



ben j'ai regardé la liste des processes, je n'ai rien vu de particulier.
J'ai regardé cron et anacron, je n'ai rien vu non plus. Il y a d'autres
endroits où chercher ? Des méthodes plus systématiques ?

Merci,

Laurent




Chaque user a des "cron". Par exemple fcrontab chez moi il y en a pour
users et root

voir :
fcrontab -l
et
sudo fcrontab -l


--
« le politiquement correct ne proclame pas la tolérance ; il ne fait qu'organiser la haine. » (Jacques Barzun)
C'est une doctrine obligatoire, qui n'est en réalité que l'expression la plus autoritaire du conformisme
Avatar
Essomba
On 02/02/2012 15:58, denis.paris wrote:


Alors il reste la compromission de la machine, un root kit installé qui
provoque un init 0 dès le lancement. 30s c'est un temps typique pour
arrêter une machine.



on parle ici de 27 minutes et 30 secondes... pas juste 30s

--
Remplacez yahou par yahoo et com par fr pour me répondre en direct

Laurent
Avatar
Cornelia Schneider
"denis.paris" wrote in news:4f2a6362$0$31964
$:

Je penche plus pour un problème hardware, par exemple un ventilateur de
processeur encrass‚ qui provoque une surchauffe et un blocage du CPU.



Pile toutes les 27m30s ? (selon l'OP) Très improbable en cas de surchauffe,
cette régularité parfaite.

Conseil à l'OP : Si tu peux, rapatrie une image complète de ton serveur
chez toi et installe-la sur une machine vierge en local pour observer. Si
le problème persiste, il est très probablement d'origine logicielle (et tu
pourras alors rechercher plus confortablement ce qui ne va pas). Sinon il
est plus probablement d'origine ou dû à une compromission active (=
crack/piratage) de ta machine distante.

Cornelia

--
Be out and be proud - today is the first day of the rest of your life
Support Transgenre Strasbourg : www.sts67.org
GPG key ID 83FF7452
1 2 3 4 5