FreeBSD : remontée des erreurs ECC

Le
patpro ~ Patrick Proniewski
Bonjour,


Je sais que le BIOS a généralement un log (DMI LOG) pour les remontées
d'erreurs, et notamment les erreurs ECC sur la RAM.
Est-ce qu'il est possible de faire remonter ces erreurs jusqu'à FreeBSD ?

patpro

--
A vendre ! http://www.patpro.net/blog/index.php/2008/01/12/133
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Patrick Lamaizière
Le #22725841
patpro ~ Patrick Proniewski :

Je sais que le BIOS a généralement un log (DMI LOG) pour les remontées
d'erreurs, et notamment les erreurs ECC sur la RAM.
Est-ce qu'il est possible de faire remonter ces erreurs jusqu'à FreeBSD ?



Via ipmi(4) et ipmitools ?
http://serverfault.com/questions/131005/monitoring-physical-ram-errors-on-linux

(ipmitool est dans les ports)

C'est juste une suggestion...
patpro ~ patrick proniewski
Le #22726021
In article Patrick Lamaizière
patpro ~ Patrick Proniewski :

> Je sais que le BIOS a généralement un log (DMI LOG) pour les remontées
> d'erreurs, et notamment les erreurs ECC sur la RAM.
> Est-ce qu'il est possible de faire remonter ces erreurs jusqu'à FreeBSD ?

Via ipmi(4) et ipmitools ?
http://serverfault.com/questions/131005/monitoring-physical-ram-errors-on-linu
x

(ipmitool est dans les ports)

C'est juste une suggestion...



intéressante au demeurant, mais j'ai pas d'IPMI sur ma carte mère :(
D'autres pistes ?

patpro

--
A vendre : KVM IP 16 ports APC
http://patpro.net/blog/index.php/2008/01/12/133
Philippe Chevalier
Le #22726961
On Wed, 27 Oct 2010 08:04:42 +0200, patpro ~ Patrick Proniewski
Bonjour,


Je sais que le BIOS a généralement un log (DMI LOG) pour les remontées
d'erreurs, et notamment les erreurs ECC sur la RAM.
Est-ce qu'il est possible de faire remonter ces erreurs jusqu'à FreeBSD ?



sysutils/dmidecode ?

Juste une suggestion. Pas essayé.

K.
--
Kyoko Otonashi's shrine / Le temple de Kyoko Otonashi
My tribute to Maison Ikkoku / Mon hommage a Maison Ikkoku
Visit http://www.kyoko.org/
patpro ~ patrick proniewski
Le #22727531
In article Philippe Chevalier
> Je sais que le BIOS a gÈnÈralement un log (DMI LOG) pour les remontÈes
> d'erreurs, et notamment les erreurs ECC sur la RAM.
> Est-ce qu'il est possible de faire remonter ces erreurs jusqu'ý FreeBSD ?

sysutils/dmidecode ?




ça va dans la bonne direction, mais je ne suis pas sûr de savoir
interpréter correctement le résultat...

J'ai ça :

Handle 0x0016, DMI type 15, 29 bytes
System Event Log
Area Length: 1016 bytes
Header Start Offset: 0x0000
Header Length: 16 bytes
Data Start Offset: 0x0010
Access Method: General-purpose non-volatile data functions
Access Address: 0x0000
Status: Valid, Full
Change Token: 0x000000C5
Header Format: Type 1
Supported Log Type Descriptors: 3
Descriptor 1: POST error
Data Format 1: POST results bitmap
Descriptor 2: Single-bit ECC memory error
Data Format 2: Multiple-event
Descriptor 3: Multi-bit ECC memory error
Data Format 3: Multiple-event



Status: Valid, Full <-- ça c'est pas bon, le log d'erreur est plein
Par contre, qu'est ce qu'il y a dedans ?

Ensuite, par rapport à la mémoire installée il dit ça d'un coté :

Handle 0x0018, DMI type 17, 27 bytes
Memory Device
Array Handle: 0x0017
Error Information Handle: No Error
Total Width: 72 bits
Data Width: 64 bits
Size: 4096 MB
Form Factor: DIMM
Set: 1
Locator: CH0_DIMM0
Bank Locator: DIMM 0-1
Type: DDR2
Type Detail: Synchronous
Speed: 667 MHz
Manufacturer: CE00000000000000
Serial Number: 510B91CA
Asset Tag:
Part Number: M3 93T5166AZA-CE6

Handle 0x0019, DMI type 17, 27 bytes
Memory Device
Array Handle: 0x0017
Error Information Handle: No Error
Total Width: 72 bits
Data Width: 64 bits
Size: 4096 MB
Form Factor: DIMM
Set: 1
Locator: CH1_DIMM0
Bank Locator: DIMM 1-1
Type: DDR2
Type Detail: Synchronous
Speed: 667 MHz
Manufacturer: CE00000000000000
Serial Number: 510B91BA
Asset Tag:
Part Number: M3 93T5166AZA-CE6

Handle 0x001A, DMI type 17, 27 bytes
Memory Device
Array Handle: 0x0017
Error Information Handle: No Error
Total Width: 72 bits
Data Width: 64 bits
Size: 4096 MB
Form Factor: DIMM
Set: 1
Locator: CH0_DIMM1
Bank Locator: DIMM 0-2
Type: DDR2
Type Detail: Synchronous
Speed: 667 MHz
Manufacturer: CE00000000000000
Serial Number: 510B91B7
Asset Tag:
Part Number: M3 93T5166AZA-CE6

Handle 0x001B, DMI type 17, 27 bytes
Memory Device
Array Handle: 0x0017
Error Information Handle: No Error
Total Width: 72 bits
Data Width: 64 bits
Size: 4096 MB
Form Factor: DIMM
Set: 1
Locator: CH1_DIMM1
Bank Locator: DIMM 1-2
Type: DDR2
Type Detail: Synchronous
Speed: 667 MHz
Manufacturer: CE00000000000000
Serial Number: 510B918E
Asset Tag:
Part Number: M3 93T5166AZA-CE6




(à chaque fois "No Error")
Et il dit ça d'un autre coté :

Handle 0x001E, DMI type 19, 15 bytes
Memory Array Mapped Address
Starting Address: 0x00000000000
Ending Address: 0x003FFFFFFFF
Range Size: 16 GB
Physical Array Handle: 0x0017
Partition Width: 0

Handle 0x001F, DMI type 20, 19 bytes
Memory Device Mapped Address
Starting Address: 0x00000000000
Ending Address: 0x000FFFFFFFF
Range Size: 4 GB
Physical Device Handle: 0x0018
Memory Array Mapped Address Handle: 0x001E
Partition Row Position: Unknown
Interleave Position: Unknown
Interleaved Data Depth: Unknown

Handle 0x0020, DMI type 20, 19 bytes
Memory Device Mapped Address
Starting Address: 0x00100000000
Ending Address: 0x001FFFFFFFF
Range Size: 4 GB
Physical Device Handle: 0x0019
Memory Array Mapped Address Handle: 0x001E
Partition Row Position: Unknown
Interleave Position: Unknown
Interleaved Data Depth: Unknown

Handle 0x0021, DMI type 20, 19 bytes
Memory Device Mapped Address
Starting Address: 0x00200000000
Ending Address: 0x002FFFFFFFF
Range Size: 4 GB
Physical Device Handle: 0x001A
Memory Array Mapped Address Handle: 0x001E
Partition Row Position: Unknown
Interleave Position: Unknown
Interleaved Data Depth: Unknown




Donc dans un premier temps il voit bien les 4x4 Go de RAM, mais dans le
second listing, il annonce 16 Go et décrit seulement 3 barrettes de 4Go.

Je suis circonspect... :)

patpro

--
A vendre : KVM IP 16 ports APC
http://patpro.net/blog/index.php/2008/01/12/133
Philippe Chevalier
Le #22729781
On Thu, 28 Oct 2010 07:41:54 +0200, patpro ~ patrick proniewski

Je suis circonspect... :)



man demidecode :

BUGS
More often than not, information contained in the DMI tables is
inaccurate, incomplete or simply wrong.

Désolé ^^

K.
--
Kyoko Otonashi's shrine / Le temple de Kyoko Otonashi
My tribute to Maison Ikkoku / Mon hommage a Maison Ikkoku
Visit http://www.kyoko.org/
patpro ~ Patrick Proniewski
Le #22729851
In article Philippe Chevalier
On Thu, 28 Oct 2010 07:41:54 +0200, patpro ~ patrick proniewski
>
> Je suis circonspect... :)

man demidecode :

BUGS
More often than not, information contained in the DMI tables is
inaccurate, incomplete or simply wrong.

DÈsolÈ ^^




crap. Merci quand meme pour la piste, en tout cas.

patpro

--
A vendre ! http://www.patpro.net/blog/index.php/2008/01/12/133
Publicité
Poster une réponse
Anonyme