[testing] reboot brutal

Le
Gaëtan PERRIER
Salut,

Ce soir j'ai subit 3 reboot brutaux de mon système, successivement, sans =
cause
apparente ni aucun message dans les logs. J'ai lancé un memtest qui n'ind=
ique
pas de problème sur la mémoire. Les températures sont correctes.
Depuis plus d'1h tout est normal.
Ça fait déjà pas mal de temps que j'ai cette machine sans problème =
particulier
à part de temps en temps un conflit d'it quand je branche un disque firew=
ire
externe (ce n'était pas le cas ce soir).

J'aimerai bien essayer d'identifier la cause du problème mais là je ne =
vois
pas trop où chercher ?

Ma config:

ASUS P8P67 LE
CPU i2500k (pas d'overclock)
8 Gio de RAM (Crucial)
SSD Crucial C300
HDD ST31000528AS Seagate Barracuda 7200.12
CG Nvidia 9600GT
DVD Plextor PX-880SA

Debian testing 32 bits.

Gaëtan

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers debian-user-french-REQUEST@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmaster@lists.debian.org
Archive: http://lists.debian.org/20120627223718.ba6c09c310f4b736c0ad60c1@neuf.fr
Questions / Réponses high-tech
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses Page 1 / 5
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
andre_debian
Le #24600091
Bonsoir,

Tu n'es pas le seul à avoir ce type de problème.

Moi également, avec un matos neuf quasi identique du tien.

Si je laisse mon PC en veille, au bout d'une heure,
blocage complet, avec ce message :
"Kernel panic - not syncing : VFS unable to mount
root fs on unknown-block (8,8)"
(serait-ce mon noyau "bigmem" ?).

andré


On Wednesday 27 June 2012 22:37:18 Gaëtan PERRIER wrote:
Ce soir j'ai subit 3 reboot brutaux de mon système, successivement, sans
cause apparente ni aucun message dans les logs. J'ai lancé un memtest q ui
n'indique pas de problème sur la mémoire. Les températures sont cor rectes.
Depuis plus d'1h tout est normal.
Ça fait déjà pas mal de temps que j'ai cette machine sans problème
particulier à part de temps en temps un conflit d'it quand je branche un
disque firewire externe (ce n'était pas le cas ce soir).
J'aimerai bien essayer d'identifier la cause du problème mais là je n e vois
pas trop où chercher ?
Ma config:
ASUS P8P67 LE
CPU i2500k (pas d'overclock)
8 Gio de RAM (Crucial)
SSD Crucial C300
HDD ST31000528AS Seagate Barracuda 7200.12
CG Nvidia 9600GT
DVD Plextor PX-880SA
Debian testing 32 bits.
Gaëtan



--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Bzzz
Le #24600121
On Wed, 27 Jun 2012 22:37:18 +0200
Gaëtan PERRIER
j'ai soir Ce subit 3 système brutaux de mon reboot



Est-ce que les tests RAM ont bien *tous* été exécutés,
et si possible 3-4 fois d'affilée?

Sinon, commence par vérifier que l'enfichage des cartes
addons et de tous les câbles sur la CM est correct.

Après, reste the usual suspects: les chimiques qui ont gonflé (st op
immédiat), la CM qui déménage et le CPU qui a surchauffà © et s'est
abîmé (dans l'ordre) ou... l'exorcisme ]:->

--
One hundred and one uses for canned peaches.
One hundred and two if you plan to eat them.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Gaëtan PERRIER
Le #24600131
Sauf que moi y a vraiment aucun message. Pas de kernel panic, pas de freeze.
Juste le PC qui reboote tout seul sans autre forme de procès.

Gaëtan

Le Wed, 27 Jun 2012 22:58:27 +0200
a écrit:

Bonsoir,

Tu n'es pas le seul à avoir ce type de problème.

Moi également, avec un matos neuf quasi identique du tien.

Si je laisse mon PC en veille, au bout d'une heure,
blocage complet, avec ce message :
"Kernel panic - not syncing : VFS unable to mount
root fs on unknown-block (8,8)"
(serait-ce mon noyau "bigmem" ?).

andré


On Wednesday 27 June 2012 22:37:18 Gaëtan PERRIER wrote:
> Ce soir j'ai subit 3 reboot brutaux de mon système, successivement, s ans
> cause apparente ni aucun message dans les logs. J'ai lancé un memtest qui
> n'indique pas de problème sur la mémoire. Les températures sont c orrectes.
> Depuis plus d'1h tout est normal.
> Ça fait déjà pas mal de temps que j'ai cette machine sans probl ème
> particulier à part de temps en temps un conflit d'it quand je branche un
> disque firewire externe (ce n'était pas le cas ce soir).
> J'aimerai bien essayer d'identifier la cause du problème mais là je ne vois
> pas trop où chercher ?
> Ma config:
> ASUS P8P67 LE
> CPU i2500k (pas d'overclock)
> 8 Gio de RAM (Crucial)
> SSD Crucial C300
> HDD ST31000528AS Seagate Barracuda 7200.12
> CG Nvidia 9600GT
> DVD Plextor PX-880SA
> Debian testing 32 bits.
> Gaëtan

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive:
http://lists.debian.org/



--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Gaëtan PERRIER
Le #24600171
Le Wed, 27 Jun 2012 23:02:38 +0200
Bzzz
On Wed, 27 Jun 2012 22:37:18 +0200
Gaëtan PERRIER
> j'ai soir Ce subit 3 système brutaux de mon reboot

Est-ce que les tests RAM ont bien *tous* été exécutés,
et si possible 3-4 fois d'affilée?



Non une seule fois. Je essaierai de lancer le test toute la journée demain.


Sinon, commence par vérifier que l'enfichage des cartes
addons et de tous les câbles sur la CM est correct.



Tout est ok.


Après, reste the usual suspects: les chimiques qui ont gonflé (stop
immédiat),



Elle n'est pas non plus super vieille ma carte (fin octobre 2011). Et l'alim
est de la même date (Antec HCG400).

la CM qui déménage



oui peut-être mais pas facile à déterminer :(

et le CPU qui a surchauffé et s'est



Je n'ai pas l'impression dans les logs je ne vois rien qui monte au delà de 50°
C et là je suis entre 35 et 40°C selon les cœurs.

abîmé (dans l'ordre) ou... l'exorcisme ]:->



C'est idée. Tu conseilles un exorciste en particulier ? ;)

Gaëtan

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Bzzz
Le #24600231
On Wed, 27 Jun 2012 23:19:21 +0200
Gaëtan PERRIER

Non une seule fois. Je essaierai de lancer le test toute la
journée demain.



N'exagérons rien, 3-4x d'affilée ça le fait.

>
> Sinon, commence par vérifier que l'enfichage des cartes
> addons et de tous les câbles sur la CM est correct.

Tout est ok.



Donc tu as arrêté la machine, vérifié élément par élément et
redémarré...

>
> Après, reste the usual suspects: les chimiques qui ont gonflé
> (stop immédiat),

Elle n'est pas non plus super vieille ma carte (fin octobre 2011).
Et l'alim est de la même date (Antec HCG400).



Rien à voir: si l'électrolyte s'est oxydé ou qu'il n'y-en pa s eu
assez ou qu'il-y-a une prise d'air ou que l'isolant se dégrade ça
suffit pour nicker les chimiques à vitesse-V.
Et puis l'électronique c'est comme ça: soit ça pète dan s les
premiers 6 mois, soit ça tient des années, soit ça pète n'importe
quand.

> la CM qui déménage

oui peut-être mais pas facile à déterminer :(



Seuls des tests poussés peuvent le dire; mais déjà l'observe r à la
loupe sous une lumière bien crûe ça peut permettre de repà ©rer un truc
anormal.

> et le CPU qui a surchauffé et s'est

Je n'ai pas l'impression dans les logs je ne vois rien qui monte
au delà de 50° C et là je suis entre 35 et 40°C selon les cœurs.



Wai, et puis mnt que les CPUs sont plus ou moins protégés contre ça,
c'est Trare (par contre, une bonne surtension ou des micro-coupures
à répétition, ça peut abîmer des tas de choses, ma is en Gal ça
commence par les HDz).

Pour tester l'ensemble, tu peux tjrs essayer de mettre tout ça en
burn in pendant 4-5H (me rappelle plus le nom du package de stress).

Mnt, ça peut aussi être dû à un PB dans le kernel ou da ns une lib de
bas niveau, ça ne serait pas la première fois ni la dernière ; donc
avant de tout jeter attend un peu, et en attendant chronomètre donc
le temps avant crash, histoire de voir s'il est linéaire ou pas.

> abîmé (dans l'ordre) ou... l'exorcisme ]:->

C'est idée. Tu conseilles un exorciste en particulier ? ;)



Appelle le pape, il a un meilleur ping ];-)

--
I remember when legal used to mean lawful, now it means some
kind of loophole.-- Leo Kessler

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Gaëtan PERRIER
Le #24600311
Le Wed, 27 Jun 2012 23:44:01 +0200
Bzzz
On Wed, 27 Jun 2012 23:19:21 +0200
Gaëtan PERRIER
>
> Non une seule fois. Je essaierai de lancer le test toute la
> journée demain.

N'exagérons rien, 3-4x d'affilée ça le fait.



Oui mais comme je ne vais pas spécialement revenir chez moi pour éteindre la
machine je pense qu'elle en aura fait beaucoup plus quand je reviendrai demain
soir. ;)


> >
> > Sinon, commence par vérifier que l'enfichage des cartes
> > addons et de tous les câbles sur la CM est correct.
>
> Tout est ok.

Donc tu as arrêté la machine, vérifié élément par élément et
redémarré...



Oui j'ai ouvert la machine vérifié les connections, enlevé et remis les
barrettes de RAM. Tout est ok.


> >
> > Après, reste the usual suspects: les chimiques qui ont gonflé
> > (stop immédiat),
>
> Elle n'est pas non plus super vieille ma carte (fin octobre 2011).
> Et l'alim est de la même date (Antec HCG400).

Rien à voir: si l'électrolyte s'est oxydé ou qu'il n'y-en pas eu
assez ou qu'il-y-a une prise d'air ou que l'isolant se dégrade ça
suffit pour nicker les chimiques à vitesse-V.
Et puis l'électronique c'est comme ça: soit ça pète dans les
premiers 6 mois, soit ça tient des années, soit ça pète n'importe
quand.




Oui je sais bien mais bon quand même ...

> > la CM qui déménage
>
> oui peut-être mais pas facile à déterminer :(

Seuls des tests poussés peuvent le dire; mais déjà l'observer à la
loupe sous une lumière bien crûe ça peut permettre de repérer un truc
anormal.



Bon ça on verra ce week-end, parce que là je n'ai pas le courage de tout
démonter ;)


> > et le CPU qui a surchauffé et s'est
>
> Je n'ai pas l'impression dans les logs je ne vois rien qui monte
> au delà de 50° C et là je suis entre 35 et 40°C selon les cœurs.

Wai, et puis mnt que les CPUs sont plus ou moins protégés contre ça,
c'est Trare (par contre, une bonne surtension ou des micro-coupures
à répétition, ça peut abîmer des tas de choses, mais en Gal ça
commence par les HDz).

Pour tester l'ensemble, tu peux tjrs essayer de mettre tout ça en
burn in pendant 4-5H (me rappelle plus le nom du package de stress).



C'est une idée mais ça ne semble pas lié à la charge parce quand c'est arrivé
je ne faisais vraiment pas grand chose ...


Mnt, ça peut aussi être dû à un PB dans le kernel ou dans une lib de
bas niveau, ça ne serait pas la première fois ni la dernière; donc
avant de tout jeter attend un peu, et en attendant chronomètre donc
le temps avant crash, histoire de voir s'il est linéaire ou pas.



Je n'aurai pas eu au moins un message, surtout si c'était kernel, non ?
Ça semble purement aléatoire. Le premier est intervenu 30 minutes après le
démarrage (j'avais fais les mises à jours de ce jour), le suivant pendant le
reboot (après la correction des systèmes de fichiers) et le 3e, 1 minute après
le redémarrage ...

Gaëtan

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Bzzz
Le #24600381
On Thu, 28 Jun 2012 00:22:21 +0200
Gaëtan PERRIER
> Pour tester l'ensemble, tu peux tjrs essayer de mettre tout ça en
> burn in pendant 4-5H (me rappelle plus le nom du package de
> stress).

C'est une idée mais ça ne semble pas lié à la charge parce quand
c'est arrivé je ne faisais vraiment pas grand chose ...



Arf, nan: c'est juste pour stresser le matériel; ça permet de voir
si une conjonction d'actions le fait sauter (ça n'est pas parce que
tu ne fais rien qu'il ne se passe rien).
Par contre, évite s'il fait trop chaud: ça arrache qd même.

>
> Mnt, ça peut aussi être dû à un PB dans le kernel o u dans une
> lib de bas niveau, ça ne serait pas la première fois ni la
> dernière; donc avant de tout jeter attend un peu, et en
> attendant chronomètre donc le temps avant crash, histoire de
> voir s'il est linéaire ou pas.

Je n'aurai pas eu au moins un message, surtout si c'était kernel,
non ?



Pas forcément parce que quand ça le crash, il-y-a certains cas o ù
les mécanismes de trace etc n'ont pas le temps d'agir; à T0 à §a va,
et à T+qq ns tout est arrêté.

Ça semble purement aléatoire. Le premier est intervenu 30
minutes après le démarrage (j'avais fais les mises à jours de ce
jour), le suivant pendant le reboot (après la correction des
systèmes de fichiers) et le 3e, 1 minute après le redémarr age ...



Ce qui est moins aléatoire, c'est la mise à jour juste avant.
Donc avant tout, essaye de downgrader les packages MàJ.

--
The attacker must vanquish; the defender need only survive.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Gaëtan PERRIER
Le #24600441
Le Thu, 28 Jun 2012 00:38:28 +0200
Bzzz
On Thu, 28 Jun 2012 00:22:21 +0200
Gaëtan PERRIER
> Ça semble purement aléatoire. Le premier est intervenu 30
> minutes après le démarrage (j'avais fais les mises à jours de ce
> jour), le suivant pendant le reboot (après la correction des
> systèmes de fichiers) et le 3e, 1 minute après le redémarrage ...

Ce qui est moins aléatoire, c'est la mise à jour juste avant.
Donc avant tout, essaye de downgrader les packages MàJ.



Là ça fait plus de 3h que ça tourne sans problème en faisant les m êmes
tâches qu'avant. Y a peut-être eu un bug lié à la mise à jour qui s'est
corrigé suite aux redémarrages ?

Gaëtan

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Bzzz
Le #24600541
On Thu, 28 Jun 2012 00:47:34 +0200
Gaëtan PERRIER
>
> Ce qui est moins aléatoire, c'est la mise à jour juste avant.
> Donc avant tout, essaye de downgrader les packages MàJ.

Là ça fait plus de 3h que ça tourne sans problème en faisant les
mêmes tâches qu'avant. Y a peut-être eu un bug lié à la mise à
jour qui s'est corrigé suite aux redémarrages ?



En dehors de la recompilation d'un module, je ne vois pas ce que ça
pourrait être d'autre (mais c'est bleu-suppo).

T'as vérifié si ta CM n'était pas enceinte?

--
It is very vulgar to talk like a dentist when one isn't a dentist.
It produces a false impression. -- Oscar Wilde.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Goldy
Le #24601771
Je déplore aussi une extinction de ce type hier soir. Sur le coup, j'ai
pensé que ça pouvait être la température du macbook sur lequel est
installé ma debian testing, comme je regardais des vidéos sur youtube et
que flash ça fait chauffer le pc...

Après c'est peut-être une coïncidence.

Christophe

Le 27/06/2012 22:37, Gaëtan PERRIER a écrit :> Salut,

Ce soir j'ai subit 3 reboot brutaux de mon système, successivement,


sans cause
apparente ni aucun message dans les logs. J'ai lancé un memtest qui


n'indique
pas de problème sur la mémoire. Les températures sont correctes.
Depuis plus d'1h tout est normal.
Ça fait déjà pas mal de temps que j'ai cette machine sans problème


particulier
à part de temps en temps un conflit d'it quand je branche un disque


firewire
externe (ce n'était pas le cas ce soir).

J'aimerai bien essayer d'identifier la cause du problème mais là je ne


vois
pas trop où chercher ?

Ma config:

ASUS P8P67 LE
CPU i2500k (pas d'overclock)
8 Gio de RAM (Crucial)
SSD Crucial C300
HDD ST31000528AS Seagate Barracuda 7200.12
CG Nvidia 9600GT
DVD Plextor PX-880SA

Debian testing 32 bits.

Gaëtan





--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Publicité
Poster une réponse
Anonyme