Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

reboot toutes les 27m30s

71 réponses
Avatar
Essomba
Bonjour à tous,

une machine que j'ai à l'autre bout du monde, reboote toutes les 27m30s
à peu près :

Uptime | System Boot up
----------------------------+---------------------------------------------------
1 0 days, 00:27:40 | Linux 2.6.32-5-amd64 08:46:43 2012
2 0 days, 00:27:37 | Linux 2.6.32-5-amd64 07:20:17 2012
3 0 days, 00:27:36 | Linux 2.6.32-5-amd64 09:15:36 2012
4 0 days, 00:27:35 | Linux 2.6.32-5-amd64 07:49:03 2012
5 0 days, 00:27:30 | Linux 2.6.32-5-amd64 08:17:54 2012

j'ai regardé dans les logs : rien. J'ai regardé les crontab, rien qui ne
se lance à cette périodicité.

Auriez-vous une idée ? Comment trouver le coupable sans prendre un
billet d'avion ?

Merci,

Laurent

PS : de plus, régulièrement uptimed ne retrouve pas/écrase/perds ses
logs... savez-vous pourquoi ?


--
Remplacez yahou par yahoo et com par fr pour me répondre en direct

Laurent

10 réponses

1 2 3 4 5
Avatar
franssoa
Le 02. 02. 12 10:28, Essomba a écrit :
une machine que j'ai à l'autre bout du monde, reboote toutes les 27m30s
à peu près



Peut-être rien à voir (et ça risque de ne même pas t'aider), mais j'ai
eu un problème similaire sur mon serveur maison (PC de récup). Il
rebootait systématiquement toutes les 5-7 heures. Le problème était
matériel (défaut de l'alimentation surement). Je ne suis pas allé
beaucoup plus loin, car j'avais un autre PC identique et en y mettant le
disque dur de l'ancien, plus de problème.

franssoa
Avatar
denis.paris
Le 02/02/2012 10:28, Essomba a écrit :
Bonjour à tous,

une machine que j'ai à l'autre bout du monde, reboote toutes les 27m30s
à peu près :

Uptime | System Boot up
----------------------------+---------------------------------------------------
1 0 days, 00:27:40 | Linux 2.6.32-5-amd64 08:46:43 2012
2 0 days, 00:27:37 | Linux 2.6.32-5-amd64 07:20:17 2012
3 0 days, 00:27:36 | Linux 2.6.32-5-amd64 09:15:36 2012
4 0 days, 00:27:35 | Linux 2.6.32-5-amd64 07:49:03 2012
5 0 days, 00:27:30 | Linux 2.6.32-5-amd64 08:17:54 2012

j'ai regardé dans les logs : rien. J'ai regardé les crontab, rien qui ne
se lance à cette périodicité.

Auriez-vous une idée ? Comment trouver le coupable sans prendre un
billet d'avion ?

Merci,

Laurent

PS : de plus, régulièrement uptimed ne retrouve pas/écrase/perds ses
logs... savez-vous pourquoi ?





Avec aussi peu d'information ça ne va pas être facile. "...dans les
logs: rien", ça veut dire que tous les logs sont vides?

Soit la machine est compromise, et il faut regarder les connexions /
process pendant que tu as la main, soit il y a un problème d'alimentation.
Avatar
La Bete des Vosges (Francis Chartier)
Le Thu, 02 Feb 2012 10:28:12 +0100, Essomba a écrit :


une machine que j'ai à l'autre bout du monde, reboote toutes les 27m30s
à peu près :



CVomme les autres : ça ressemble à un problème d'alim.
La durée entre 2 redémarrages aurait-elle un rapport avec un réglage
d'onduleur ?



--
La Bête des Vosges
Avatar
Essomba
On 02/02/2012 10:59, denis.paris wrote:


Avec aussi peu d'information ça ne va pas être facile. "...dans les
logs: rien", ça veut dire que tous les logs sont vides?




rien qui ne m'aide :

/var/log/messages :

Feb 2 10:37:32 routeur kernel: [ 109.914642] tun: Universal TUN/TAP
device driver, 1.6
Feb 2 10:37:32 routeur kernel: [ 109.914643] tun: (C) 1999-2004 Max
Krasnyansky
Feb 2 11:05:41 routeur kernel: imklog 4.6.4, log source = /proc/kmsg
started.
Feb 2 11:05:41 routeur rsyslogd: [origin software="rsyslogd"
swVersion="4.6.4" x-pid="1500" x-info="http://www.rsyslog.com"] (re)start
Feb 2 11:05:41 routeur kernel: [ 0.000000] Initializing cgroup
subsys cpuset


/var/log/syslog :

Feb 2 10:37:32 routeur kernel: [ 109.914642] tun: Universal TUN/TAP
device driver, 1.6
Feb 2 10:37:32 routeur kernel: [ 109.914643] tun: (C) 1999-2004 Max
Krasnyansky
Feb 2 10:37:32 routeur ovpn-anim[1665]: Initialization Sequence Completed

... quelques DHCP ...
... quelques Crontab ...

Feb 2 11:05:41 routeur rsyslogd: [origin software="rsyslogd"
swVersion="4.6.4" x-pid="1500" x-info="http://www.rsyslog.com"] (re)start
Feb 2 11:05:41 routeur kernel: [ 0.000000] Initializing cgroup
subsys cpuset
Feb 2 11:05:41 routeur kernel: [ 0.000000] Initializing cgroup
subsys cpu


Soit la machine est compromise, et il faut regarder les connexions /
process pendant que tu as la main, soit il y a un problème d'alimentation.





je vais tenter de regarder les processus au moment du reboot... Sinon en
croisière :

1 ? 00:00:00 init
2 ? 00:00:00 kthreadd
3 ? 00:00:00 migration/0
4 ? 00:00:00 ksoftirqd/0
5 ? 00:00:00 watchdog/0
6 ? 00:00:00 migration/1
7 ? 00:00:00 ksoftirqd/1
8 ? 00:00:00 watchdog/1
9 ? 00:00:00 migration/2
10 ? 00:00:00 ksoftirqd/2
11 ? 00:00:00 watchdog/2
12 ? 00:00:00 migration/3
13 ? 00:00:00 ksoftirqd/3
14 ? 00:00:00 watchdog/3
15 ? 00:00:00 events/0
16 ? 00:00:00 events/1
17 ? 00:00:00 events/2
18 ? 00:00:00 events/3
19 ? 00:00:00 cpuset
20 ? 00:00:00 khelper
21 ? 00:00:00 netns
22 ? 00:00:00 async/mgr
23 ? 00:00:00 pm
24 ? 00:00:00 sync_supers
25 ? 00:00:00 bdi-default
26 ? 00:00:00 kintegrityd/0
27 ? 00:00:00 kintegrityd/1
28 ? 00:00:00 kintegrityd/2
29 ? 00:00:00 kintegrityd/3
30 ? 00:00:00 kblockd/0
31 ? 00:00:00 kblockd/1
32 ? 00:00:00 kblockd/2
33 ? 00:00:00 kblockd/3
34 ? 00:00:00 kacpid
35 ? 00:00:00 kacpi_notify
36 ? 00:00:00 kacpi_hotplug
37 ? 00:00:00 kseriod
42 ? 00:00:00 kondemand/0
43 ? 00:00:00 kondemand/1
44 ? 00:00:00 kondemand/2
45 ? 00:00:00 kondemand/3
46 ? 00:00:00 khungtaskd
47 ? 00:00:00 kswapd0
48 ? 00:00:00 ksmd
49 ? 00:00:00 aio/0
50 ? 00:00:00 aio/1
51 ? 00:00:00 aio/2
52 ? 00:00:00 aio/3
53 ? 00:00:00 crypto/0
54 ? 00:00:00 crypto/1
55 ? 00:00:00 crypto/2
56 ? 00:00:00 crypto/3
279 ? 00:00:00 ksuspend_usbd
280 ? 00:00:00 khubd
281 ? 00:00:00 ata/0
282 ? 00:00:00 ata/1
283 ? 00:00:00 ata/2
284 ? 00:00:00 ata/3
285 ? 00:00:00 ata_aux
290 ? 00:00:00 scsi_eh_0
291 ? 00:00:00 scsi_eh_1
292 ? 00:00:00 scsi_eh_2
293 ? 00:00:00 scsi_eh_3
294 ? 00:00:00 scsi_eh_4
295 ? 00:00:00 scsi_eh_5
302 ? 00:00:00 scsi_eh_6
303 ? 00:00:00 scsi_eh_7
350 ? 00:00:00 md0_raid1
357 ? 00:00:03 md1_raid1
363 ? 00:00:00 usbhid_resumer
371 ? 00:00:00 kstriped
374 ? 00:00:00 kdmflush
381 ? 00:00:00 kdmflush
395 ? 00:00:06 md1_resync
396 ? 00:00:00 jbd2/dm-0-8
397 ? 00:00:00 ext4-dio-unwrit
398 ? 00:00:00 ext4-dio-unwrit
399 ? 00:00:00 ext4-dio-unwrit
400 ? 00:00:00 ext4-dio-unwrit
506 ? 00:00:00 udevd
651 ? 00:00:00 udevd
652 ? 00:00:00 udevd
783 ? 00:00:00 kpsmoused
822 ? 00:00:00 hd-audio0
825 ? 00:00:00 flush-253:0
986 ? 00:00:00 kdmflush
1051 ? 00:00:00 jbd2/dm-2-8
1052 ? 00:00:00 ext4-dio-unwrit
1053 ? 00:00:00 ext4-dio-unwrit
1054 ? 00:00:00 ext4-dio-unwrit
1055 ? 00:00:00 ext4-dio-unwrit
1260 ? 00:00:00 dhclient
1333 ? 00:00:00 dhclient
1476 ? 00:00:00 uptimed
1500 ? 00:00:00 rsyslogd
1530 ? 00:00:00 mdadm
1577 ? 00:00:00 gpm
1591 ? 00:00:00 kconservative/0
1592 ? 00:00:00 kconservative/1
1593 ? 00:00:00 kconservative/2
1594 ? 00:00:00 kconservative/3
1600 ? 00:00:00 cpufreqd
1625 ? 00:00:00 named
1668 ? 00:00:00 acpid
1685 ? 00:00:00 openvpn
1727 ? 00:00:00 cron
1733 ? 00:00:00 sshd
1750 tty1 00:00:00 getty
1751 tty2 00:00:00 getty
1752 tty3 00:00:00 getty
1753 tty4 00:00:00 getty
1754 tty5 00:00:00 getty
1755 tty6 00:00:00 getty
1775 ? 00:00:00 sshd
1777 ? 00:00:00 sshd
1778 pts/0 00:00:00 bash
1783 pts/0 00:00:00 su
1784 pts/0 00:00:00 bash
1808 pts/0 00:00:00 ps


Merci !


--
Remplacez yahou par yahoo et com par fr pour me répondre en direct

Laurent
Avatar
Essomba
On 02/02/2012 11:08, La Bete des Vosges (Francis Chartier) wrote:
Le Thu, 02 Feb 2012 10:28:12 +0100, Essomba a écrit :


une machine que j'ai à l'autre bout du monde, reboote toutes les 27m30s
à peu près :



CVomme les autres : ça ressemble à un problème d'alim.
La durée entre 2 redémarrages aurait-elle un rapport avec un réglage
d'onduleur ?






y a pas (encore) d'onduleur...

--
Remplacez yahou par yahoo et com par fr pour me répondre en direct

Laurent
Avatar
denis.paris
Le 02/02/2012 11:11, Essomba a écrit :
On 02/02/2012 10:59, denis.paris wrote:


Avec aussi peu d'information ça ne va pas être facile. "...dans les
logs: rien", ça veut dire que tous les logs sont vides?




rien qui ne m'aide :

/var/log/messages :

Feb 2 10:37:32 routeur kernel: [ 109.914642] tun: Universal TUN/TAP
device driver, 1.6
Feb 2 10:37:32 routeur kernel: [ 109.914643] tun: (C) 1999-2004 Max
Krasnyansky
Feb 2 11:05:41 routeur kernel: imklog 4.6.4, log source = /proc/kmsg
started.
Feb 2 11:05:41 routeur rsyslogd: [origin software="rsyslogd"
swVersion="4.6.4" x-pid="1500" x-info="http://www.rsyslog.com"] (re)start
Feb 2 11:05:41 routeur kernel: [ 0.000000] Initializing cgroup
subsys cpuset


/var/log/syslog :

Feb 2 10:37:32 routeur kernel: [ 109.914642] tun: Universal TUN/TAP
device driver, 1.6
Feb 2 10:37:32 routeur kernel: [ 109.914643] tun: (C) 1999-2004 Max
Krasnyansky
Feb 2 10:37:32 routeur ovpn-anim[1665]: Initialization Sequence Completed

... quelques DHCP ...
... quelques Crontab ...

Feb 2 11:05:41 routeur rsyslogd: [origin software="rsyslogd"
swVersion="4.6.4" x-pid="1500" x-info="http://www.rsyslog.com"] (re)start
Feb 2 11:05:41 routeur kernel: [ 0.000000] Initializing cgroup
subsys cpuset
Feb 2 11:05:41 routeur kernel: [ 0.000000] Initializing cgroup
subsys cpu


Soit la machine est compromise, et il faut regarder les connexions /
process pendant que tu as la main, soit il y a un problème d'alimentation.





je vais tenter de regarder les processus au moment du reboot... Sinon en
croisière :

1 ? 00:00:00 init
2 ? 00:00:00 kthreadd
3 ? 00:00:00 migration/0
4 ? 00:00:00 ksoftirqd/0
5 ? 00:00:00 watchdog/0
6 ? 00:00:00 migration/1
7 ? 00:00:00 ksoftirqd/1
8 ? 00:00:00 watchdog/1
9 ? 00:00:00 migration/2
10 ? 00:00:00 ksoftirqd/2
11 ? 00:00:00 watchdog/2
12 ? 00:00:00 migration/3
13 ? 00:00:00 ksoftirqd/3
14 ? 00:00:00 watchdog/3
15 ? 00:00:00 events/0
16 ? 00:00:00 events/1
17 ? 00:00:00 events/2
18 ? 00:00:00 events/3
19 ? 00:00:00 cpuset
20 ? 00:00:00 khelper
21 ? 00:00:00 netns
22 ? 00:00:00 async/mgr
23 ? 00:00:00 pm
24 ? 00:00:00 sync_supers
25 ? 00:00:00 bdi-default
26 ? 00:00:00 kintegrityd/0
27 ? 00:00:00 kintegrityd/1
28 ? 00:00:00 kintegrityd/2
29 ? 00:00:00 kintegrityd/3
30 ? 00:00:00 kblockd/0
31 ? 00:00:00 kblockd/1
32 ? 00:00:00 kblockd/2
33 ? 00:00:00 kblockd/3
34 ? 00:00:00 kacpid
35 ? 00:00:00 kacpi_notify
36 ? 00:00:00 kacpi_hotplug
37 ? 00:00:00 kseriod
42 ? 00:00:00 kondemand/0
43 ? 00:00:00 kondemand/1
44 ? 00:00:00 kondemand/2
45 ? 00:00:00 kondemand/3
46 ? 00:00:00 khungtaskd
47 ? 00:00:00 kswapd0
48 ? 00:00:00 ksmd
49 ? 00:00:00 aio/0
50 ? 00:00:00 aio/1
51 ? 00:00:00 aio/2
52 ? 00:00:00 aio/3
53 ? 00:00:00 crypto/0
54 ? 00:00:00 crypto/1
55 ? 00:00:00 crypto/2
56 ? 00:00:00 crypto/3
279 ? 00:00:00 ksuspend_usbd
280 ? 00:00:00 khubd
281 ? 00:00:00 ata/0
282 ? 00:00:00 ata/1
283 ? 00:00:00 ata/2
284 ? 00:00:00 ata/3
285 ? 00:00:00 ata_aux
290 ? 00:00:00 scsi_eh_0
291 ? 00:00:00 scsi_eh_1
292 ? 00:00:00 scsi_eh_2
293 ? 00:00:00 scsi_eh_3
294 ? 00:00:00 scsi_eh_4
295 ? 00:00:00 scsi_eh_5
302 ? 00:00:00 scsi_eh_6
303 ? 00:00:00 scsi_eh_7
350 ? 00:00:00 md0_raid1
357 ? 00:00:03 md1_raid1
363 ? 00:00:00 usbhid_resumer
371 ? 00:00:00 kstriped
374 ? 00:00:00 kdmflush
381 ? 00:00:00 kdmflush
395 ? 00:00:06 md1_resync
396 ? 00:00:00 jbd2/dm-0-8
397 ? 00:00:00 ext4-dio-unwrit
398 ? 00:00:00 ext4-dio-unwrit
399 ? 00:00:00 ext4-dio-unwrit
400 ? 00:00:00 ext4-dio-unwrit
506 ? 00:00:00 udevd
651 ? 00:00:00 udevd
652 ? 00:00:00 udevd
783 ? 00:00:00 kpsmoused
822 ? 00:00:00 hd-audio0
825 ? 00:00:00 flush-253:0
986 ? 00:00:00 kdmflush
1051 ? 00:00:00 jbd2/dm-2-8
1052 ? 00:00:00 ext4-dio-unwrit
1053 ? 00:00:00 ext4-dio-unwrit
1054 ? 00:00:00 ext4-dio-unwrit
1055 ? 00:00:00 ext4-dio-unwrit
1260 ? 00:00:00 dhclient
1333 ? 00:00:00 dhclient
1476 ? 00:00:00 uptimed
1500 ? 00:00:00 rsyslogd
1530 ? 00:00:00 mdadm
1577 ? 00:00:00 gpm
1591 ? 00:00:00 kconservative/0
1592 ? 00:00:00 kconservative/1
1593 ? 00:00:00 kconservative/2
1594 ? 00:00:00 kconservative/3
1600 ? 00:00:00 cpufreqd
1625 ? 00:00:00 named
1668 ? 00:00:00 acpid
1685 ? 00:00:00 openvpn
1727 ? 00:00:00 cron
1733 ? 00:00:00 sshd
1750 tty1 00:00:00 getty
1751 tty2 00:00:00 getty
1752 tty3 00:00:00 getty
1753 tty4 00:00:00 getty
1754 tty5 00:00:00 getty
1755 tty6 00:00:00 getty
1775 ? 00:00:00 sshd
1777 ? 00:00:00 sshd
1778 pts/0 00:00:00 bash
1783 pts/0 00:00:00 su
1784 pts/0 00:00:00 bash
1808 pts/0 00:00:00 ps


Merci !





Tu peux envoyer cette liste dans des fichiers à intervalles régulier et
comparer avant le reboot.

Je penche plus pour un problème hardware, par exemple un ventilateur de
processeur encrassé qui provoque une surchauffe et un blocage du CPU.
Avatar
Essomba
On 02/02/2012 11:20, denis.paris wrote:


Tu peux envoyer cette liste dans des fichiers à intervalles régulier et
comparer avant le reboot.



yes je vais faire ça

Je penche plus pour un problème hardware, par exemple un ventilateur de
processeur encrassé qui provoque une surchauffe et un blocage du CPU.




en fait le matériel est neuf et quand je l'ai testé ici avant de
l'envoyer là bas, il fonctionnait très bien...

Je vais regarder la température du proc aussi...

Merci,

L


--
Remplacez yahou par yahoo et com par fr pour me répondre en direct

Laurent
Avatar
Essomba
On 02/02/2012 11:22, Essomba wrote:

Je vais regarder la température du proc aussi...




$ sensors-detect
...
Sorry, no sensors were detected.

quand ça ne veut pas...

--
Remplacez yahou par yahoo et com par fr pour me répondre en direct

Laurent
Avatar
Essomba
On 02/02/2012 11:20, denis.paris wrote:


Tu peux envoyer cette liste dans des fichiers à intervalles régulier et
comparer avant le reboot.



ma dernière minute de log est vite...

-rw-r--r-- 1 root root 4114 2 févr. 11:31 log-11:31:36-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:37-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:38-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:39-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:40-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:41-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:42-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:43-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:44-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:45-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:46-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:47-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:48-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:49-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:50-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:51-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:52-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:53-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:54-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:55-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:56-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:57-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:58-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:31 log-11:31:59-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:32 log-11:32:00-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:32 log-11:32:01-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:32 log-11:32:02-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:32 log-11:32:03-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:32 log-11:32:04-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:32 log-11:32:05-up-27-min
-rw-r--r-- 1 root root 0 2 févr. 11:32 log-11:32:06-up-28-min


une idée de pourquoi ? Ca pourrait expliquer aussi les pertes de record
de uptimed...


--
Remplacez yahou par yahoo et com par fr pour me répondre en direct

Laurent
Avatar
Nicolas George
Essomba , dans le message <4f2a572c$0$10732$, a
écrit :
une machine que j'ai à l'autre bout du monde, reboote toutes les 27m30s
à peu près :



Une telle régularité me semble assez contradictoire avec l'idée d'un
problème matériel.

As-tu regardé s'il n'y aurait pas un watchdog ?
1 2 3 4 5