OVH Cloud OVH Cloud

bug kernel, carte-mère HS, autre chose ?

17 réponses
Avatar
claude
Bonsoir,

Depuis quelques temps, ma machine (Athlon64 3000+, 2x1 Go RAM) donne des
signes inquiétants de faiblesses : de façon aléatoire, elle se fige
(laps de temps variable mais de 15/20 jours il y a 3 mois, on est tombé
à 6 jours maxi depuis 2 semaines... 1 jour depuis vendredi dernier).

Comme mon disque système avait l'air fatigué (unroceverable errors
régulièrement via logcheck), après un ultime fsck qui ne m'a rien dit
(pas de secteurs défectueux) et un testdisk sans histoire, j'ai quand
même pris parti de le changer. Je passe sur mes galères avec le SATA non
reconnu par ma cart-mère (asus A8V deluxe) et la suite (au départ je
voulais en profiter pour faire du raid 1), j'ai finalement pu transférer
mon système sur un autre disque (IDE aussi) et repartir... Mais, ma
machine a tenu 21H puis s'est totalement figée. Et là, misère pour
redémarrer : figeage à des moments divers (ça va du démarrage de
postgresql serveur jusqu'à l'apparition du bureau de kde4 ou un peu
après). Bref, à chaque fois que la machine est figée comme cela, je dois
redémarrer 4 ou 5 fois avant de pouvoir faire quoi que ce soit d'autre
que relancer mes applis (essentiellement iceweazel, icedove, iceape,
dolphin et 2/3 konsole).

Le blocage se produit parfois avant même d'arriver à grub2 et dans ce
cas, je dois enlever la pile pour réussir à repartir (écran figé sur
l'accueil du bios). J'ai changé la pile pour voir mais pas de changement
notable (enfin si, dans le sens où je n'ai plus eu ce pb particulier
depuis... mais ça ne fait que 3 jours).

Laisser la machine 30 minutes à 1H suffit parfois (mais pas toujours)
pour redémarrer du premier coup. Là, je tourne avec un bios par défaut
depuis cet après-midi : l'idée m'est venue parce qu'un autre pc me fait
le coup du figeage depuis quelques jours aussi (asus K8V) et qu'il ne
redémarre qu'après avoir chargé le bios par défaut.

Mais, du coup je me retrouve avec des lignes bizarre au démarrage :

EDAC MC: Ver: 2.1.0 Jan 10 2010
[ 10.403086] EDAC amd64_edac: Ver: 3.2.0 Jan 10 2010
[ 10.403159] EDAC amd64: This node reports that Memory ECC is
currently disabled, set F3x44[22] (0000:00:18.3).
[ 10.403165] EDAC amd64: WARNING: ECC is disabled by BIOS. Module will
NOT be loaded.
[ 10.403167] Either Enable ECC in the BIOS, or set 'ecc_enable_override'.
[ 10.403168] Also, use of the override can cause unknown side effects.
[ 10.403185] amd64_edac: probe of 0000:00:18.2 failed with error -22

Ma mémoire n'étant pas l'ECC cela doit-il m'inquiéter ou pas (est-ce une
"feature" du 2.6.32 ?) ?

J'ai aussi un message :
[ 0.089546] pci 0000:00:00.0: BAR 0: address space collision on of
device [0xdc0000
00-0xdfffffff]
[ 0.089607] pci 0000:00:00.0: BAR 0: can't allocate resource

sur ces deux machines : pareil est-ce lié au 2.6.32 et est-ce inquiétant
(lié à mes problèmes) ?

J'avoue que là, je ne sais plus trop si je dois me résigner à investir
dans un achat carte-mère / CPU / RAM and Co ou chercher du côté des
bugs. Mais, sauf à avoir loupé des mails sur la liste @bugs.debian, je
n'ai rien vu qui ressemble à mes soucis présents. Une Idée ?

Debian Sid (à jour), kernel 2.6.32, kde4... et rien de probant dans les
logs.

--
Claude
http://www.chateaubourg.info

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers debian-user-french-REQUEST@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmaster@lists.debian.org

7 réponses

1 2
Avatar
claude
BmailDB a écrit :
[...]
Peut-être qu'en examinant le +12v lors d'une charge (bonne
compilation, cpuburn, forte activité des disques par exemple), tu
pourras voir si celui-ci est à la peine ?



Suite à un énième plantage (moins de 4H d'uptime ce coup-ci), j'en ai
profité pour changer l'alim mais en remettant mon xorg.conf (puisqu'il
n'a pas l'air en cause)... Les 2 alims sont des 550W et celle que je
viens de mettre provient d'un serveur qui avait 6 DD + DVD. Le serveur
ne me servant plus dans l'immédiat, il était éteint et a donc subi moins
de coupures de courants (et elle est un peu plus récente je crois). Donc
on va bien voir : si ça continue, hormis mettre une autre carte
graphique, je ne vois plus quoi tester :D

Pour le +12v y'a un utilitaire pour ça ? hwinfo ne me parle pas de mon
alimentation, pas plus que le centre d'information de kde.

--
Claude
http://www.chateaubourg.info

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Avatar
Pascal Hambourg
Salut,

claude a écrit :

Pour le +12v y'a un utilitaire pour ça ? hwinfo ne me parle pas de mon
alimentation, pas plus que le centre d'information de kde.



Il y a lm-sensors, avec probablement des surcouches graphiques
disponibles mais ce n'est pas mon rayon. Ou bien un bon vieux
multimètre. Mais cela ne mettra pas en évidence d'éventuelles chutes de
tension transitoires, dont l'observation nécessiterait un oscilloscope.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Avatar
h22 s44
Sinon, dans le bios, parfoi tu as un monitoring des divers tension, ça
peut déja te donnée une idée de la stabilité des tension.

Le 29/01/10, Pascal Hambourg a écrit :
Salut,

claude a écrit :

Pour le +12v y'a un utilitaire pour ça ? hwinfo ne me parle pas de mon
alimentation, pas plus que le centre d'information de kde.



Il y a lm-sensors, avec probablement des surcouches graphiques
disponibles mais ce n'est pas mon rayon. Ou bien un bon vieux
multimètre. Mais cela ne mettra pas en évidence d'éventuelles chute s de
tension transitoires, dont l'observation nécessiterait un oscilloscope.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS





--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Avatar
Julien
as-tu pensé à mettre ton bios à jour ?

Le vendredi 29 janvier 2010 à 08:38 +0100, h22 s44 a écrit :
Sinon, dans le bios, parfoi tu as un monitoring des divers tension, ça
peut déja te donnée une idée de la stabilité des tension.

Le 29/01/10, Pascal Hambourg a écrit :
> Salut,
>
> claude a écrit :
>>
>> Pour le +12v y'a un utilitaire pour ça ? hwinfo ne me parle pas de mon
>> alimentation, pas plus que le centre d'information de kde.
>
> Il y a lm-sensors, avec probablement des surcouches graphiques
> disponibles mais ce n'est pas mon rayon. Ou bien un bon vieux
> multimètre. Mais cela ne mettra pas en évidence d'éventuelles chutes de
> tension transitoires, dont l'observation nécessiterait un oscilloscope.
>
> --
> Lisez la FAQ de la liste avant de poser une question :
> http://wiki.debian.org/fr/FrenchLists
>
> Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
> vers
> En cas de soucis, contactez EN ANGLAIS
>
>




--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Avatar
claude
Julien a écrit :
as-tu pensé à mettre ton bios à jour ?



Oui... Mais j'ai pas de lecteur de disquette et installer un dos-like
juste pour ça... Et ma carte-mère ne supporte pas la mise à jour sur
disque externe, cd. Pas de ez-update, flash-update ou trucs de ce genre
au démarrage :(

--
Claude
http://www.chateaubourg.info

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Avatar
claude
h22 s44 a écrit :
Sinon, dans le bios, parfoi tu as un monitoring des divers tension, ça
peut déja te donnée une idée de la stabilité des tension.



Au niveau du bios, elle est très stable... C'est parce qu'il m'a été
suggéré de lancer une grosse compilation et de regarder à ce moment-là
si le +12v restait stable que je me pose la question d'un programme
faisant ça ;)

Pour le message suggérant lm-sensors, j'ai jamais réussi à bien le faire
fonctionner. Mais bon, me suis pas trop acharné non plus :)

--
Claude
http://www.chateaubourg.info

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Avatar
BmailDB
Le vendredi 29 janvier 2010, claude a écrit :
h22 s44 a écrit :
> Sinon, dans le bios, parfoi tu as un monitoring des divers
> tension, ça peut déja te donnée une idée de la stabilité des
> tension.




Bonjour,

Oui, mais avec juste le bios de "lancé", on ne la "fatigue" pas
bien ... donc cette stabilité ne veut peut-être pas dire grand chose.

Au niveau du bios, elle est très stable... C'est parce qu'il m'a
été suggéré de lancer une grosse compilation et de regarder à ce
moment-là si le +12v restait stable que je me pose la question d'un
programme faisant ça ;)

Pour le message suggérant lm-sensors, j'ai jamais réussi à bien le
faire fonctionner. Mais bon, me suis pas trop acharné non plus :)




De mémoire, il faut lancer "sensors-detect" qui va chercher les sondes
existantes de la carte et te proposer de charger les modules
éventuels pour les gérer.
La lecture des valeurs se fait avec "sensors" (je crois). Cela se
paramètre pour avoir des valeurs "justes", mais dans un 1er temps,
l'important ce sont les deltas de tension sur le +12v et
éventuellement le +5v (clavier, etc). Enfin c'est surtout le +12v car
en cas de faiblesse cela impacte aussi des éléments qui ne sont pas
forcément alimenté en +12 (pci, clavier, souris par ex.)

Selon l'environnement que tu utilises, il y a aussi des applis qui te
sortent des graphes (ex: "surveilance du systeme - indicateurs de
performance" sous kde). Sous Gnome, il doit aussi exister le même
genre de truc, sous forme d'applet ??.

Avec ce genre de monitoring simple, et en ayant lancé cpuburn par
exemple et un gros transfert de fichiers de disque à disques, je
pense que si tu vois ces tensions être assez impactées, cela te
donnera une idée sur la forme de l'alimentation.
Ceci dit, ça peut aussi être la régulation sur la carte mère qui
fouare ... mais cela fouarera encore probablement avec une autre alim
considéré comme OK (qualité, dimensionnement).

Bertrand

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
1 2