reboot toutes les 27m30s

Le
Essomba
Bonjour à tous,

une machine que j'ai à l'autre bout du monde, reboote toutes les 27m30s
à peu près :

Uptime | System Boot up
-+
1 0 days, 00:27:40 | Linux 2.6.32-5-amd64 08:46:43 2012
2 0 days, 00:27:37 | Linux 2.6.32-5-amd64 07:20:17 2012
3 0 days, 00:27:36 | Linux 2.6.32-5-amd64 09:15:36 2012
4 0 days, 00:27:35 | Linux 2.6.32-5-amd64 07:49:03 2012
5 0 days, 00:27:30 | Linux 2.6.32-5-amd64 08:17:54 2012

j'ai regardé dans les logs : rien. J'ai regardé les crontab, rien qui ne
se lance à cette périodicité.

Auriez-vous une idée ? Comment trouver le coupable sans prendre un
billet d'avion ?

Merci,

Laurent

PS : de plus, régulièrement uptimed ne retrouve pas/écrase/perds ses
logs savez-vous pourquoi ?


--
Remplacez yahou par yahoo et com par fr pour me répondre en direct

Laurent
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses Page 1 / 8
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
franssoa
Le #24213881
Le 02. 02. 12 10:28, Essomba a écrit :
une machine que j'ai à l'autre bout du monde, reboote toutes les 27m30s
à peu près



Peut-être rien à voir (et ça risque de ne même pas t'aider), mais j'ai
eu un problème similaire sur mon serveur maison (PC de récup). Il
rebootait systématiquement toutes les 5-7 heures. Le problème était
matériel (défaut de l'alimentation surement). Je ne suis pas allé
beaucoup plus loin, car j'avais un autre PC identique et en y mettant le
disque dur de l'ancien, plus de problème.

franssoa
denis.paris
Le #24213871
Le 02/02/2012 10:28, Essomba a écrit :
Bonjour à tous,

une machine que j'ai à l'autre bout du monde, reboote toutes les 27m30s
à peu près :

Uptime | System Boot up
----------------------------+---------------------------------------------------
1 0 days, 00:27:40 | Linux 2.6.32-5-amd64 08:46:43 2012
2 0 days, 00:27:37 | Linux 2.6.32-5-amd64 07:20:17 2012
3 0 days, 00:27:36 | Linux 2.6.32-5-amd64 09:15:36 2012
4 0 days, 00:27:35 | Linux 2.6.32-5-amd64 07:49:03 2012
5 0 days, 00:27:30 | Linux 2.6.32-5-amd64 08:17:54 2012

j'ai regardé dans les logs : rien. J'ai regardé les crontab, rien qui ne
se lance à cette périodicité.

Auriez-vous une idée ? Comment trouver le coupable sans prendre un
billet d'avion ?

Merci,

Laurent

PS : de plus, régulièrement uptimed ne retrouve pas/écrase/perds ses
logs... savez-vous pourquoi ?





Avec aussi peu d'information ça ne va pas être facile. "...dans les
logs: rien", ça veut dire que tous les logs sont vides?

Soit la machine est compromise, et il faut regarder les connexions /
process pendant que tu as la main, soit il y a un problème d'alimentation.
La Bete des Vosges (Francis Chartier)
Le #24213991
Le Thu, 02 Feb 2012 10:28:12 +0100, Essomba a écrit :


une machine que j'ai à l'autre bout du monde, reboote toutes les 27m30s
à peu près :



CVomme les autres : ça ressemble à un problème d'alim.
La durée entre 2 redémarrages aurait-elle un rapport avec un réglage
d'onduleur ?



--
La Bête des Vosges
Essomba
Le #24213981
On 02/02/2012 10:59, denis.paris wrote:


Avec aussi peu d'information ça ne va pas être facile. "...dans les
logs: rien", ça veut dire que tous les logs sont vides?




rien qui ne m'aide :

/var/log/messages :

Feb 2 10:37:32 routeur kernel: [ 109.914642] tun: Universal TUN/TAP
device driver, 1.6
Feb 2 10:37:32 routeur kernel: [ 109.914643] tun: (C) 1999-2004 Max
Krasnyansky Feb 2 11:05:41 routeur kernel: imklog 4.6.4, log source = /proc/kmsg
started.
Feb 2 11:05:41 routeur rsyslogd: [origin software="rsyslogd"
swVersion="4.6.4" x-pid="1500" x-info="http://www.rsyslog.com"] (re)start
Feb 2 11:05:41 routeur kernel: [ 0.000000] Initializing cgroup
subsys cpuset


/var/log/syslog :

Feb 2 10:37:32 routeur kernel: [ 109.914642] tun: Universal TUN/TAP
device driver, 1.6
Feb 2 10:37:32 routeur kernel: [ 109.914643] tun: (C) 1999-2004 Max
Krasnyansky Feb 2 10:37:32 routeur ovpn-anim[1665]: Initialization Sequence Completed

... quelques DHCP ...
... quelques Crontab ...

Feb 2 11:05:41 routeur rsyslogd: [origin software="rsyslogd"
swVersion="4.6.4" x-pid="1500" x-info="http://www.rsyslog.com"] (re)start
Feb 2 11:05:41 routeur kernel: [ 0.000000] Initializing cgroup
subsys cpuset
Feb 2 11:05:41 routeur kernel: [ 0.000000] Initializing cgroup
subsys cpu


Soit la machine est compromise, et il faut regarder les connexions /
process pendant que tu as la main, soit il y a un problème d'alimentation.





je vais tenter de regarder les processus au moment du reboot... Sinon en
croisière :

1 ? 00:00:00 init
2 ? 00:00:00 kthreadd
3 ? 00:00:00 migration/0
4 ? 00:00:00 ksoftirqd/0
5 ? 00:00:00 watchdog/0
6 ? 00:00:00 migration/1
7 ? 00:00:00 ksoftirqd/1
8 ? 00:00:00 watchdog/1
9 ? 00:00:00 migration/2
10 ? 00:00:00 ksoftirqd/2
11 ? 00:00:00 watchdog/2
12 ? 00:00:00 migration/3
13 ? 00:00:00 ksoftirqd/3
14 ? 00:00:00 watchdog/3
15 ? 00:00:00 events/0
16 ? 00:00:00 events/1
17 ? 00:00:00 events/2
18 ? 00:00:00 events/3
19 ? 00:00:00 cpuset
20 ? 00:00:00 khelper
21 ? 00:00:00 netns
22 ? 00:00:00 async/mgr
23 ? 00:00:00 pm
24 ? 00:00:00 sync_supers
25 ? 00:00:00 bdi-default
26 ? 00:00:00 kintegrityd/0
27 ? 00:00:00 kintegrityd/1
28 ? 00:00:00 kintegrityd/2
29 ? 00:00:00 kintegrityd/3
30 ? 00:00:00 kblockd/0
31 ? 00:00:00 kblockd/1
32 ? 00:00:00 kblockd/2
33 ? 00:00:00 kblockd/3
34 ? 00:00:00 kacpid
35 ? 00:00:00 kacpi_notify
36 ? 00:00:00 kacpi_hotplug
37 ? 00:00:00 kseriod
42 ? 00:00:00 kondemand/0
43 ? 00:00:00 kondemand/1
44 ? 00:00:00 kondemand/2
45 ? 00:00:00 kondemand/3
46 ? 00:00:00 khungtaskd
47 ? 00:00:00 kswapd0
48 ? 00:00:00 ksmd
49 ? 00:00:00 aio/0
50 ? 00:00:00 aio/1
51 ? 00:00:00 aio/2
52 ? 00:00:00 aio/3
53 ? 00:00:00 crypto/0
54 ? 00:00:00 crypto/1
55 ? 00:00:00 crypto/2
56 ? 00:00:00 crypto/3
279 ? 00:00:00 ksuspend_usbd
280 ? 00:00:00 khubd
281 ? 00:00:00 ata/0
282 ? 00:00:00 ata/1
283 ? 00:00:00 ata/2
284 ? 00:00:00 ata/3
285 ? 00:00:00 ata_aux
290 ? 00:00:00 scsi_eh_0
291 ? 00:00:00 scsi_eh_1
292 ? 00:00:00 scsi_eh_2
293 ? 00:00:00 scsi_eh_3
294 ? 00:00:00 scsi_eh_4
295 ? 00:00:00 scsi_eh_5
302 ? 00:00:00 scsi_eh_6
303 ? 00:00:00 scsi_eh_7
350 ? 00:00:00 md0_raid1
357 ? 00:00:03 md1_raid1
363 ? 00:00:00 usbhid_resumer
371 ? 00:00:00 kstriped
374 ? 00:00:00 kdmflush
381 ? 00:00:00 kdmflush
395 ? 00:00:06 md1_resync
396 ? 00:00:00 jbd2/dm-0-8
397 ? 00:00:00 ext4-dio-unwrit
398 ? 00:00:00 ext4-dio-unwrit
399 ? 00:00:00 ext4-dio-unwrit
400 ? 00:00:00 ext4-dio-unwrit
506 ? 00:00:00 udevd
651 ? 00:00:00 udevd
652 ? 00:00:00 udevd
783 ? 00:00:00 kpsmoused
822 ? 00:00:00 hd-audio0
825 ? 00:00:00 flush-253:0
986 ? 00:00:00 kdmflush
1051 ? 00:00:00 jbd2/dm-2-8
1052 ? 00:00:00 ext4-dio-unwrit
1053 ? 00:00:00 ext4-dio-unwrit
1054 ? 00:00:00 ext4-dio-unwrit
1055 ? 00:00:00 ext4-dio-unwrit
1260 ? 00:00:00 dhclient
1333 ? 00:00:00 dhclient
1476 ? 00:00:00 uptimed
1500 ? 00:00:00 rsyslogd
1530 ? 00:00:00 mdadm
1577 ? 00:00:00 gpm
1591 ? 00:00:00 kconservative/0
1592 ? 00:00:00 kconservative/1
1593 ? 00:00:00 kconservative/2
1594 ? 00:00:00 kconservative/3
1600 ? 00:00:00 cpufreqd
1625 ? 00:00:00 named
1668 ? 00:00:00 acpid
1685 ? 00:00:00 openvpn
1727 ? 00:00:00 cron
1733 ? 00:00:00 sshd
1750 tty1 00:00:00 getty
1751 tty2 00:00:00 getty
1752 tty3 00:00:00 getty
1753 tty4 00:00:00 getty
1754 tty5 00:00:00 getty
1755 tty6 00:00:00 getty
1775 ? 00:00:00 sshd
1777 ? 00:00:00 sshd
1778 pts/0 00:00:00 bash
1783 pts/0 00:00:00 su
1784 pts/0 00:00:00 bash
1808 pts/0 00:00:00 ps


Merci !


--
Remplacez yahou par yahoo et com par fr pour me répondre en direct

Laurent
Essomba
Le #24213971
On 02/02/2012 11:08, La Bete des Vosges (Francis Chartier) wrote:
Le Thu, 02 Feb 2012 10:28:12 +0100, Essomba a écrit :


une machine que j'ai à l'autre bout du monde, reboote toutes les 27m30s
à peu près :



CVomme les autres : ça ressemble à un problème d'alim.
La durée entre 2 redémarrages aurait-elle un rapport avec un réglage
d'onduleur ?






y a pas (encore) d'onduleur...

--
Remplacez yahou par yahoo et com par fr pour me répondre en direct

Laurent
denis.paris
Le #24214081
Le 02/02/2012 11:11, Essomba a écrit :
On 02/02/2012 10:59, denis.paris wrote:


Avec aussi peu d'information ça ne va pas être facile. "...dans les
logs: rien", ça veut dire que tous les logs sont vides?




rien qui ne m'aide :

/var/log/messages :

Feb 2 10:37:32 routeur kernel: [ 109.914642] tun: Universal TUN/TAP
device driver, 1.6
Feb 2 10:37:32 routeur kernel: [ 109.914643] tun: (C) 1999-2004 Max
Krasnyansky Feb 2 11:05:41 routeur kernel: imklog 4.6.4, log source = /proc/kmsg
started.
Feb 2 11:05:41 routeur rsyslogd: [origin software="rsyslogd"
swVersion="4.6.4" x-pid="1500" x-info="http://www.rsyslog.com"] (re)start
Feb 2 11:05:41 routeur kernel: [ 0.000000] Initializing cgroup
subsys cpuset


/var/log/syslog :

Feb 2 10:37:32 routeur kernel: [ 109.914642] tun: Universal TUN/TAP
device driver, 1.6
Feb 2 10:37:32 routeur kernel: [ 109.914643] tun: (C) 1999-2004 Max
Krasnyansky Feb 2 10:37:32 routeur ovpn-anim[1665]: Initialization Sequence Completed

... quelques DHCP ...
... quelques Crontab ...

Feb 2 11:05:41 routeur rsyslogd: [origin software="rsyslogd"
swVersion="4.6.4" x-pid="1500" x-info="http://www.rsyslog.com"] (re)start
Feb 2 11:05:41 routeur kernel: [ 0.000000] Initializing cgroup
subsys cpuset
Feb 2 11:05:41 routeur kernel: [ 0.000000] Initializing cgroup
subsys cpu


Soit la machine est compromise, et il faut regarder les connexions /
process pendant que tu as la main, soit il y a un problème d'alimentation.





je vais tenter de regarder les processus au moment du reboot... Sinon en
croisière :

1 ? 00:00:00 init
2 ? 00:00:00 kthreadd
3 ? 00:00:00 migration/0
4 ? 00:00:00 ksoftirqd/0
5 ? 00:00:00 watchdog/0
6 ? 00:00:00 migration/1
7 ? 00:00:00 ksoftirqd/1
8 ? 00:00:00 watchdog/1
9 ? 00:00:00 migration/2
10 ? 00:00:00 ksoftirqd/2
11 ? 00:00:00 watchdog/2
12 ? 00:00:00 migration/3
13 ? 00:00:00 ksoftirqd/3
14 ? 00:00:00 watchdog/3
15 ? 00:00:00 events/0
16 ? 00:00:00 events/1
17 ? 00:00:00 events/2
18 ? 00:00:00 events/3
19 ? 00:00:00 cpuset
20 ? 00:00:00 khelper
21 ? 00:00:00 netns
22 ? 00:00:00 async/mgr
23 ? 00:00:00 pm
24 ? 00:00:00 sync_supers
25 ? 00:00:00 bdi-default
26 ? 00:00:00 kintegrityd/0
27 ? 00:00:00 kintegrityd/1
28 ? 00:00:00 kintegrityd/2
29 ? 00:00:00 kintegrityd/3
30 ? 00:00:00 kblockd/0
31 ? 00:00:00 kblockd/1
32 ? 00:00:00 kblockd/2
33 ? 00:00:00 kblockd/3
34 ? 00:00:00 kacpid
35 ? 00:00:00 kacpi_notify
36 ? 00:00:00 kacpi_hotplug
37 ? 00:00:00 kseriod
42 ? 00:00:00 kondemand/0
43 ? 00:00:00 kondemand/1
44 ? 00:00:00 kondemand/2
45 ? 00:00:00 kondemand/3
46 ? 00:00:00 khungtaskd
47 ? 00:00:00 kswapd0
48 ? 00:00:00 ksmd
49 ? 00:00:00 aio/0
50 ? 00:00:00 aio/1
51 ? 00:00:00 aio/2
52 ? 00:00:00 aio/3
53 ? 00:00:00 crypto/0
54 ? 00:00:00 crypto/1
55 ? 00:00:00 crypto/2
56 ? 00:00:00 crypto/3
279 ? 00:00:00 ksuspend_usbd
280 ? 00:00:00 khubd
281 ? 00:00:00 ata/0
282 ? 00:00:00 ata/1
283 ? 00:00:00 ata/2
284 ? 00:00:00 ata/3
285 ? 00:00:00 ata_aux
290 ? 00:00:00 scsi_eh_0
291 ? 00:00:00 scsi_eh_1
292 ? 00:00:00 scsi_eh_2
293 ? 00:00:00 scsi_eh_3
294 ? 00:00:00 scsi_eh_4
295 ? 00:00:00 scsi_eh_5
302 ? 00:00:00 scsi_eh_6
303 ? 00:00:00 scsi_eh_7
350 ? 00:00:00 md0_raid1
357 ? 00:00:03 md1_raid1
363 ? 00:00:00 usbhid_resumer
371 ? 00:00:00 kstriped
374 ? 00:00:00 kdmflush
381 ? 00:00:00 kdmflush
395 ? 00:00:06 md1_resync
396 ? 00:00:00 jbd2/dm-0-8
397 ? 00:00:00 ext4-dio-unwrit
398 ? 00:00:00 ext4-dio-unwrit
399 ? 00:00:00 ext4-dio-unwrit
400 ? 00:00:00 ext4-dio-unwrit
506 ? 00:00:00 udevd
651 ? 00:00:00 udevd
652 ? 00:00:00 udevd
783 ? 00:00:00 kpsmoused
822 ? 00:00:00 hd-audio0
825 ? 00:00:00 flush-253:0
986 ? 00:00:00 kdmflush
1051 ? 00:00:00 jbd2/dm-2-8
1052 ? 00:00:00 ext4-dio-unwrit
1053 ? 00:00:00 ext4-dio-unwrit
1054 ? 00:00:00 ext4-dio-unwrit
1055 ? 00:00:00 ext4-dio-unwrit
1260 ? 00:00:00 dhclient
1333 ? 00:00:00 dhclient
1476 ? 00:00:00 uptimed
1500 ? 00:00:00 rsyslogd
1530 ? 00:00:00 mdadm
1577 ? 00:00:00 gpm
1591 ? 00:00:00 kconservative/0
1592 ? 00:00:00 kconservative/1
1593 ? 00:00:00 kconservative/2
1594 ? 00:00:00 kconservative/3
1600 ? 00:00:00 cpufreqd
1625 ? 00:00:00 named
1668 ? 00:00:00 acpid
1685 ? 00:00:00 openvpn
1727 ? 00:00:00 cron
1733 ? 00:00:00 sshd
1750 tty1 00:00:00 getty
1751 tty2 00:00:00 getty
1752 tty3 00:00:00 getty
1753 tty4 00:00:00 getty
1754 tty5 00:00:00 getty
1755 tty6 00:00:00 getty
1775 ? 00:00:00 sshd
1777 ? 00:00:00 sshd
1778 pts/0 00:00:00 bash
1783 pts/0 00:00:00 su
1784 pts/0 00:00:00 bash
1808 pts/0 00:00:00 ps


Merci !





Tu peux envoyer cette liste dans des fichiers à intervalles régulier et
comparer avant le reboot.

Je penche plus pour un problème hardware, par exemple un ventilateur de
processeur encrassé qui provoque une surchauffe et un blocage du CPU.
Essomba
Le #24214071
On 02/02/2012 11:20, denis.paris wrote:


Tu peux envoyer cette liste dans des fichiers à intervalles régulier et
comparer avant le reboot.



yes je vais faire ça

Je penche plus pour un problème hardware, par exemple un ventilateur de
processeur encrassé qui provoque une surchauffe et un blocage du CPU.




en fait le matériel est neuf et quand je l'ai testé ici avant de
l'envoyer là bas, il fonctionnait très bien...

Je vais regarder la température du proc aussi...

Merci,

L


--
Remplacez yahou par yahoo et com par fr pour me répondre en direct

Laurent
Essomba
Le #24214061
On 02/02/2012 11:22, Essomba wrote:

Je vais regarder la température du proc aussi...




$ sensors-detect
...
Sorry, no sensors were detected.

quand ça ne veut pas...

--
Remplacez yahou par yahoo et com par fr pour me répondre en direct

Laurent
Essomba
Le #24214121
On 02/02/2012 11:20, denis.paris wrote:


Tu peux envoyer cette liste dans des fichiers à intervalles régulier et
comparer avant le reboot.



ma dernière minute de log est vite...

-rw-r--r-- 1 root root 4114 2 févr. 11:31 log-11:31:36-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:37-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:38-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:39-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:40-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:41-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:42-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:43-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:44-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:45-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:46-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:47-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:48-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:49-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:50-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:51-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:52-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:53-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:54-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:55-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:56-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:57-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:58-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:59-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:32 log-11:32:00-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:32 log-11:32:01-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:32 log-11:32:02-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:32 log-11:32:03-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:32 log-11:32:04-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:32 log-11:32:05-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:32 log-11:32:06-up-28-min


une idée de pourquoi ? Ca pourrait expliquer aussi les pertes de record
de uptimed...


--
Remplacez yahou par yahoo et com par fr pour me répondre en direct

Laurent
Nicolas George
Le #24214111
Essomba , dans le message écrit :
une machine que j'ai à l'autre bout du monde, reboote toutes les 27m30s
à peu près :



Une telle régularité me semble assez contradictoire avec l'idée d'un
problème matériel.

As-tu regardé s'il n'y aurait pas un watchdog ?
Publicité
Suivre les réponses
Poster une réponse
Anonyme