Essomba , dans le message <4f2a572c$0$10732$, a écrit :
une machine que j'ai à l'autre bout du monde, reboote toutes les 27m30s à peu près :
Une telle régularité me semble assez contradictoire avec l'idée d'un problème matériel.
As-tu regardé s'il n'y aurait pas un watchdog ?
ben j'ai regardé la liste des processes, je n'ai rien vu de particulier. J'ai regardé cron et anacron, je n'ai rien vu non plus. Il y a d'autres endroits où chercher ? Des méthodes plus systématiques ?
Merci,
Laurent
-- Remplacez yahou par yahoo et com par fr pour me répondre en direct
Laurent
On 02/02/2012 11:42, Nicolas George wrote:
Essomba , dans le message <4f2a572c$0$10732$426a34cc@news.free.fr>, a
écrit :
une machine que j'ai à l'autre bout du monde, reboote toutes les 27m30s
à peu près :
Une telle régularité me semble assez contradictoire avec l'idée d'un
problème matériel.
As-tu regardé s'il n'y aurait pas un watchdog ?
ben j'ai regardé la liste des processes, je n'ai rien vu de particulier.
J'ai regardé cron et anacron, je n'ai rien vu non plus. Il y a d'autres
endroits où chercher ? Des méthodes plus systématiques ?
Merci,
Laurent
--
Remplacez yahou par yahoo et com par fr pour me répondre en direct
Essomba , dans le message <4f2a572c$0$10732$, a écrit :
une machine que j'ai à l'autre bout du monde, reboote toutes les 27m30s à peu près :
Une telle régularité me semble assez contradictoire avec l'idée d'un problème matériel.
As-tu regardé s'il n'y aurait pas un watchdog ?
ben j'ai regardé la liste des processes, je n'ai rien vu de particulier. J'ai regardé cron et anacron, je n'ai rien vu non plus. Il y a d'autres endroits où chercher ? Des méthodes plus systématiques ?
Merci,
Laurent
-- Remplacez yahou par yahoo et com par fr pour me répondre en direct
Laurent
Nicolas George
Essomba , dans le message <4f2a692c$0$16558$, a écrit :
ben j'ai regardé la liste des processes, je n'ai rien vu de particulier. J'ai regardé cron et anacron, je n'ai rien vu non plus. Il y a d'autres endroits où chercher ? Des méthodes plus systématiques ?
Un watchdog, c'est un composant matériel. Et c'est justement si tu as un watchdog matériel activé sans le pan logiciel correspondant que tu peux avoir des soucis tels que tu les décris.
Regarde si tu as un /dev/watchdog.
Essomba , dans le message <4f2a692c$0$16558$426a74cc@news.free.fr>, a
écrit :
ben j'ai regardé la liste des processes, je n'ai rien vu de particulier.
J'ai regardé cron et anacron, je n'ai rien vu non plus. Il y a d'autres
endroits où chercher ? Des méthodes plus systématiques ?
Un watchdog, c'est un composant matériel. Et c'est justement si tu as un
watchdog matériel activé sans le pan logiciel correspondant que tu peux
avoir des soucis tels que tu les décris.
Essomba , dans le message <4f2a692c$0$16558$, a écrit :
ben j'ai regardé la liste des processes, je n'ai rien vu de particulier. J'ai regardé cron et anacron, je n'ai rien vu non plus. Il y a d'autres endroits où chercher ? Des méthodes plus systématiques ?
Un watchdog, c'est un composant matériel. Et c'est justement si tu as un watchdog matériel activé sans le pan logiciel correspondant que tu peux avoir des soucis tels que tu les décris.
Regarde si tu as un /dev/watchdog.
denis.paris
Le 02/02/2012 11:30, Essomba a écrit :
On 02/02/2012 11:22, Essomba wrote:
Je vais regarder la température du proc aussi...
$ sensors-detect ... Sorry, no sensors were detected.
quand ça ne veut pas...
Ca peut être une barrette de RAM défectueuse aussi: la mémoire se remplit au fur à à mesure après le reboot (mise en cache) puis arrive sur la partie défectueuse => faire un TESTMEM.
Donc soit le billet d'avion, soit trouver quelqu'un sur place qui a accès à la machine pour faire un dépoussiérage / TESTMEM
Le 02/02/2012 11:30, Essomba a écrit :
On 02/02/2012 11:22, Essomba wrote:
Je vais regarder la température du proc aussi...
$ sensors-detect
...
Sorry, no sensors were detected.
quand ça ne veut pas...
Ca peut être une barrette de RAM défectueuse aussi: la mémoire se
remplit au fur à à mesure après le reboot (mise en cache) puis arrive
sur la partie défectueuse => faire un TESTMEM.
Donc soit le billet d'avion, soit trouver quelqu'un sur place qui a
accès à la machine pour faire un dépoussiérage / TESTMEM
$ sensors-detect ... Sorry, no sensors were detected.
quand ça ne veut pas...
Ca peut être une barrette de RAM défectueuse aussi: la mémoire se remplit au fur à à mesure après le reboot (mise en cache) puis arrive sur la partie défectueuse => faire un TESTMEM.
Donc soit le billet d'avion, soit trouver quelqu'un sur place qui a accès à la machine pour faire un dépoussiérage / TESTMEM
Essomba
On 02/02/2012 11:58, Nicolas George wrote:
Essomba , dans le message <4f2a692c$0$16558$, a écrit :
ben j'ai regardé la liste des processes, je n'ai rien vu de particulier. J'ai regardé cron et anacron, je n'ai rien vu non plus. Il y a d'autres endroits où chercher ? Des méthodes plus systématiques ?
Un watchdog, c'est un composant matériel. Et c'est justement si tu as un watchdog matériel activé sans le pan logiciel correspondant que tu peux avoir des soucis tels que tu les décris.
Regarde si tu as un /dev/watchdog.
nan, je n'ai pas ce device.
-- Remplacez yahou par yahoo et com par fr pour me répondre en direct
Laurent
On 02/02/2012 11:58, Nicolas George wrote:
Essomba , dans le message <4f2a692c$0$16558$426a74cc@news.free.fr>, a
écrit :
ben j'ai regardé la liste des processes, je n'ai rien vu de particulier.
J'ai regardé cron et anacron, je n'ai rien vu non plus. Il y a d'autres
endroits où chercher ? Des méthodes plus systématiques ?
Un watchdog, c'est un composant matériel. Et c'est justement si tu as un
watchdog matériel activé sans le pan logiciel correspondant que tu peux
avoir des soucis tels que tu les décris.
Regarde si tu as un /dev/watchdog.
nan, je n'ai pas ce device.
--
Remplacez yahou par yahoo et com par fr pour me répondre en direct
Essomba , dans le message <4f2a692c$0$16558$, a écrit :
ben j'ai regardé la liste des processes, je n'ai rien vu de particulier. J'ai regardé cron et anacron, je n'ai rien vu non plus. Il y a d'autres endroits où chercher ? Des méthodes plus systématiques ?
Un watchdog, c'est un composant matériel. Et c'est justement si tu as un watchdog matériel activé sans le pan logiciel correspondant que tu peux avoir des soucis tels que tu les décris.
Regarde si tu as un /dev/watchdog.
nan, je n'ai pas ce device.
-- Remplacez yahou par yahoo et com par fr pour me répondre en direct
Laurent
Essomba
On 02/02/2012 12:10, denis.paris wrote:
Le 02/02/2012 11:30, Essomba a écrit :
On 02/02/2012 11:22, Essomba wrote:
Je vais regarder la température du proc aussi...
$ sensors-detect ... Sorry, no sensors were detected.
quand ça ne veut pas...
Ca peut être une barrette de RAM défectueuse aussi: la mémoire se remplit au fur à à mesure après le reboot (mise en cache) puis arrive sur la partie défectueuse => faire un TESTMEM.
oui à voir. Mais la machine ne fait rien du tout de ses journées pour le moment. Donc je ne vois pas trop pourquoi la mémoire se remplirait. Je vais regarder.
Donc soit le billet d'avion, soit trouver quelqu'un sur place qui a accès à la machine pour faire un dépoussiérage / TESTMEM
oui plus ça va et plus j'y songe :(
-- Remplacez yahou par yahoo et com par fr pour me répondre en direct
Laurent
On 02/02/2012 12:10, denis.paris wrote:
Le 02/02/2012 11:30, Essomba a écrit :
On 02/02/2012 11:22, Essomba wrote:
Je vais regarder la température du proc aussi...
$ sensors-detect
...
Sorry, no sensors were detected.
quand ça ne veut pas...
Ca peut être une barrette de RAM défectueuse aussi: la mémoire se
remplit au fur à à mesure après le reboot (mise en cache) puis arrive
sur la partie défectueuse => faire un TESTMEM.
oui à voir. Mais la machine ne fait rien du tout de ses journées pour le
moment. Donc je ne vois pas trop pourquoi la mémoire se remplirait. Je
vais regarder.
Donc soit le billet d'avion, soit trouver quelqu'un sur place qui a
accès à la machine pour faire un dépoussiérage / TESTMEM
oui plus ça va et plus j'y songe :(
--
Remplacez yahou par yahoo et com par fr pour me répondre en direct
$ sensors-detect ... Sorry, no sensors were detected.
quand ça ne veut pas...
Ca peut être une barrette de RAM défectueuse aussi: la mémoire se remplit au fur à à mesure après le reboot (mise en cache) puis arrive sur la partie défectueuse => faire un TESTMEM.
oui à voir. Mais la machine ne fait rien du tout de ses journées pour le moment. Donc je ne vois pas trop pourquoi la mémoire se remplirait. Je vais regarder.
Donc soit le billet d'avion, soit trouver quelqu'un sur place qui a accès à la machine pour faire un dépoussiérage / TESTMEM
oui plus ça va et plus j'y songe :(
-- Remplacez yahou par yahoo et com par fr pour me répondre en direct
Laurent
Tonton Th
On 02/02/2012 11:45 AM, Essomba wrote:
Une telle régularité me semble assez contradictoire avec l'idée d'un problème matériel.
ben j'ai regardé la liste des processes, je n'ai rien vu de particulier. J'ai regardé cron et anacron, je n'ai rien vu non plus. Il y a d'autres endroits où chercher ? Des méthodes plus systématiques ?
Hypothèse gratuite : anacron est réglé pour commencer à travailler un _certain_ temps après le démarrage, ce qui pourrait expliquer la régularité des reboots.
--
Nous vivons dans un monde étrange/ http://foo.bar.quux.over-blog.com/
On 02/02/2012 11:45 AM, Essomba wrote:
Une telle régularité me semble assez contradictoire avec l'idée d'un
problème matériel.
ben j'ai regardé la liste des processes, je n'ai rien vu de particulier.
J'ai regardé cron et anacron, je n'ai rien vu non plus. Il y a d'autres
endroits où chercher ? Des méthodes plus systématiques ?
Hypothèse gratuite : anacron est réglé pour commencer à
travailler un _certain_ temps après le démarrage, ce qui
pourrait expliquer la régularité des reboots.
--
Nous vivons dans un monde étrange/
http://foo.bar.quux.over-blog.com/
Une telle régularité me semble assez contradictoire avec l'idée d'un problème matériel.
ben j'ai regardé la liste des processes, je n'ai rien vu de particulier. J'ai regardé cron et anacron, je n'ai rien vu non plus. Il y a d'autres endroits où chercher ? Des méthodes plus systématiques ?
Hypothèse gratuite : anacron est réglé pour commencer à travailler un _certain_ temps après le démarrage, ce qui pourrait expliquer la régularité des reboots.
--
Nous vivons dans un monde étrange/ http://foo.bar.quux.over-blog.com/
Sergio
Le Thu, 02 Feb 2012 11:22:43 +0100, Essomba a écrit :
Tu peux envoyer cette liste dans des fichiers à intervalles régulier et comparer avant le reboot.
yes je vais faire ça
Je penche plus pour un problème hardware, par exemple un ventilateur de processeur encrassé qui provoque une surchauffe et un blocage du CPU.
en fait le matériel est neuf et quand je l'ai testé ici avant de l'envoyer là bas, il fonctionnait très bien...
Mais si "ici" il fait 20°C (dans la pièce, dehors, il fait -4°) et "là- bas" +40°C, c'est pas pareil...
-- Serge http://leserged.online.fr/ Mon blog: http://cahierdesergio.free.fr/ Soutenez le libre: http://www.framasoft.org
Le Thu, 02 Feb 2012 11:22:43 +0100, Essomba a écrit :
Tu peux envoyer cette liste dans des fichiers à intervalles régulier et
comparer avant le reboot.
yes je vais faire ça
Je penche plus pour un problème hardware, par exemple un ventilateur de
processeur encrassé qui provoque une surchauffe et un blocage du CPU.
en fait le matériel est neuf et quand je l'ai testé ici avant de
l'envoyer là bas, il fonctionnait très bien...
Mais si "ici" il fait 20°C (dans la pièce, dehors, il fait -4°) et "là-
bas" +40°C, c'est pas pareil...
--
Serge http://leserged.online.fr/
Mon blog: http://cahierdesergio.free.fr/
Soutenez le libre: http://www.framasoft.org
une machine que j'ai à l'autre bout du monde, reboote toutes les 27m30s à peu près :
Uptime | System Boot up ----------------------------+---------------------------------------------------
1 0 days, 00:27:40 | Linux 2.6.32-5-amd64 08:46:43 2012 2 0 days, 00:27:37 | Linux 2.6.32-5-amd64 07:20:17 2012 3 0 days, 00:27:36 | Linux 2.6.32-5-amd64 09:15:36 2012 4 0 days, 00:27:35 | Linux 2.6.32-5-amd64 07:49:03 2012 5 0 days, 00:27:30 | Linux 2.6.32-5-amd64 08:17:54 2012
j'ai regardé dans les logs : rien. J'ai regardé les crontab, rien qui ne se lance à cette périodicité.
Auriez-vous une idée ? Comment trouver le coupable sans prendre un billet d'avion ?
Merci,
Laurent
PS : de plus, régulièrement uptimed ne retrouve pas/écrase/perds ses logs... savez-vous pourquoi ?
il reboote ou il redémarre ?
C'est un peu comme de demander "est-ce que ça vous grattouille, ou est-ce que ça vous chatouille?"
Essomba
On 02/02/2012 13:10, Tonton Th wrote:
On 02/02/2012 11:45 AM, Essomba wrote:
Une telle régularité me semble assez contradictoire avec l'idée d'un problème matériel.
ben j'ai regardé la liste des processes, je n'ai rien vu de particulier. J'ai regardé cron et anacron, je n'ai rien vu non plus. Il y a d'autres endroits où chercher ? Des méthodes plus systématiques ?
Hypothèse gratuite : anacron est réglé pour commencer à travailler un _certain_ temps après le démarrage, ce qui pourrait expliquer la régularité des reboots.
d'après ce que je vois, anacron est lancé lors du passage en ring 2 et immédiatement si on est pas sur batterie. Il y a une crontab journalière à 7h30 pour lancer anacron... On peut différer les jobs mais les seuls jobs lancés sont les job cron daily, weekly et monthy qui ne contiennent rien...
-- Remplacez yahou par yahoo et com par fr pour me répondre en direct
Laurent
On 02/02/2012 13:10, Tonton Th wrote:
On 02/02/2012 11:45 AM, Essomba wrote:
Une telle régularité me semble assez contradictoire avec l'idée d'un
problème matériel.
ben j'ai regardé la liste des processes, je n'ai rien vu de particulier.
J'ai regardé cron et anacron, je n'ai rien vu non plus. Il y a d'autres
endroits où chercher ? Des méthodes plus systématiques ?
Hypothèse gratuite : anacron est réglé pour commencer à
travailler un _certain_ temps après le démarrage, ce qui
pourrait expliquer la régularité des reboots.
d'après ce que je vois, anacron est lancé lors du passage en ring 2 et
immédiatement si on est pas sur batterie. Il y a une crontab journalière
à 7h30 pour lancer anacron... On peut différer les jobs mais les seuls
jobs lancés sont les job cron daily, weekly et monthy qui ne contiennent
rien...
--
Remplacez yahou par yahoo et com par fr pour me répondre en direct
Une telle régularité me semble assez contradictoire avec l'idée d'un problème matériel.
ben j'ai regardé la liste des processes, je n'ai rien vu de particulier. J'ai regardé cron et anacron, je n'ai rien vu non plus. Il y a d'autres endroits où chercher ? Des méthodes plus systématiques ?
Hypothèse gratuite : anacron est réglé pour commencer à travailler un _certain_ temps après le démarrage, ce qui pourrait expliquer la régularité des reboots.
d'après ce que je vois, anacron est lancé lors du passage en ring 2 et immédiatement si on est pas sur batterie. Il y a une crontab journalière à 7h30 pour lancer anacron... On peut différer les jobs mais les seuls jobs lancés sont les job cron daily, weekly et monthy qui ne contiennent rien...
-- Remplacez yahou par yahoo et com par fr pour me répondre en direct