OVH Cloud OVH Cloud

[HS]Avarie matérielle et messages d'erreurs

2 réponses
Avatar
commendatore
Bonjour la liste,
Je rencontre un petit souci concernant une machine serveur mont=E9e en RAID=
1.
Suite =E0 plusieurs pannes =E9lectriques (et donc coupures et tout ce qui s=
'en=20
suit), il est presque impossible au syst=E8me d'acc=E9der correctement au d=
isques=20
SATA. (l'onduleur est command=E9 depuis bient=F4t 2 mois maintenant !)
La machine est compos=E9e d'une carte m=E8re ASUS A7N8X-E Deluxe, d'un proc=
esseur=20
AMD, d'un disque dur IDE 80 Go et de 2 disque durs SATA Maxtor de 160 Go=20
mont=E9s en RAID1. /=3D IDE 80 Go, /home=3D/dev/sda1 (100 Go), /var=3D/dev/=
sda2 (60=20
Go).
Voici le genre de messages que j'ai lors d'un fsck sur sda1 :
Buffer I/O error on device hdb1, logical block 69
hdb: dma_intr: status=3D0x51 { DriveReady SeekComplete Error }
hdb: dma_intr: error=3D0x40 { UncorrectableError }, LBAsect=3D69, high=3D0,=
low=3D69,=20
sector=3D69
end_request: I/O error, dev hdb, sector 69
Et ceci =E0 tous les blocs logiques !!!

Lorsque la machine d=E9marre j'ai ceci :
kernel: scsi0: ERROR on channel 0, id 0, lun 0, CDB: Read (10) 00 03 f8 00 =
4f=20
00 00 08 00
kernel: Additional sense: Unrecovered read error - auto reallocate failed
(...)
kernel: Current sda: sense key Medium Error
kernel: end_request: I/O error, dev sda, sector xxxxxxx

De plus, impossible de faire un dd ou cp -a vers un autre disque pour=20
sauvegarder les donn=E9es. J'ai =E9galement essay=E9 de mettre l'un des dis=
ques=20
SATA sur une autre machine -> mis =E0 part quelques erreurs du FS, =E7a a l=
'air=20
de passer.

Donc, je pencherais pour un probl=E8me au niveau de la carte m=E8re elle-m=
=EAme=20
(contr=F4leur ou environs). Quelqu'un a t il d=E9j=E0 eu ce genre d'exp=E9r=
ience ?
Quelqu'un pourrait-il m'aider ou m'aiguiller sur l'origine de cette panne ?

Tristan.

2 réponses

Avatar
Jean-Luc Coulon (f5ibh)
--=-IPOpr48x89ZtCDNi826Y
Content-Type: text/plain; charset=iso-8859-15; DelSp=Yes; Format=Flowed
Content-Disposition: inline
Content-Transfer-Encoding: quoted-printable

Le 25.09.2005 11:53:15, a écrit :
Bonjour la liste,
Je rencontre un petit souci concernant une machine serveur montée en
RAID1.
Suite à plusieurs pannes électriques (et donc coupures et tout ce qui
s'en
suit), il est presque impossible au système d'accéder correctement au
disques
SATA. (l'onduleur est commandé depuis bientôt 2 mois maintenant !)
La machine est composée d'une carte mère ASUS A7N8X-E Deluxe, d'un
processeur
AMD, d'un disque dur IDE 80 Go et de 2 disque durs SATA Maxtor de 160
Go
montés en RAID1. /= IDE 80 Go, /home=/dev/sda1 (100 Go),
/var=/dev/sda2 (60
Go).
Voici le genre de messages que j'ai lors d'un fsck sur sda1 :
Buffer I/O error on device hdb1, logical block 69
hdb: dma_intr: status=0x51 { DriveReady SeekComplete Error }
hdb: dma_intr: error=0x40 { UncorrectableError }, LBAsecti, high= 0,
lowi,
sectori
end_request: I/O error, dev hdb, sector 69
Et ceci à tous les blocs logiques !!!

Lorsque la machine démarre j'ai ceci :
kernel: scsi0: ERROR on channel 0, id 0, lun 0, CDB: Read (10) 00 03
f8 00 4f
00 00 08 00
kernel: Additional sense: Unrecovered read error - auto reallocate
failed
(...)
kernel: Current sda: sense key Medium Error
kernel: end_request: I/O error, dev sda, sector xxxxxxx

De plus, impossible de faire un dd ou cp -a vers un autre disque pour
sauvegarder les données. J'ai également essayé de mettre l'un des
disques
SATA sur une autre machine -> mis à part quelques erreurs du FS, ça a
l'air
de passer.

Donc, je pencherais pour un problème au niveau de la carte mère
elle-même
(contrôleur ou environs). Quelqu'un a t il déjà eu ce genre
d'expérience ?
Quelqu'un pourrait-il m'aider ou m'aiguiller sur l'origine de cette
panne ?



Que donne mdadm -D /dev/md0 (ou md1, md2) en fonciton de
l'organisation de votre raid ?

Si un disque est endomagé ou si des données sont défectueuses sur un
disque, le raid doit tourner en mode dégradé sur l'autre disque. Si
votre problème est un problème de système de fichiers, il est possi ble
que les données soient cassées sur les deux disques.

Vous ne ctez pas de messages d'erreur sur le second disque, peut-être
est-il intère malgré tout ?


Tristan.



Jaen-Luc

--=-IPOpr48x89ZtCDNi826Y
Content-Type: application/pgp-signature

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.1 (GNU/Linux)

iD8DBQBDNoQcXit3lz9m7V4RAi1jAKCcHQaLgH/YgVowvCPipQRhSSeXXACgtdLR
PmPTnlfKqiA/ZV8oApQpHn0 =GVSD
-----END PGP SIGNATURE-----

--=-IPOpr48x89ZtCDNi826Y--



--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
Jean-Luc Coulon (f5ibh)
--=-IPOpr48x89ZtCDNi826Y
Content-Type: text/plain; charset=iso-8859-15; DelSp=Yes; Format=Flowed
Content-Disposition: inline
Content-Transfer-Encoding: quoted-printable

Le 25.09.2005 11:53:15, a écrit :
Bonjour la liste,
Je rencontre un petit souci concernant une machine serveur montée en
RAID1.
Suite à plusieurs pannes électriques (et donc coupures et tout ce qui
s'en
suit), il est presque impossible au système d'accéder correctement au
disques
SATA. (l'onduleur est commandé depuis bientôt 2 mois maintenant !)
La machine est composée d'une carte mère ASUS A7N8X-E Deluxe, d'un
processeur
AMD, d'un disque dur IDE 80 Go et de 2 disque durs SATA Maxtor de 160
Go
montés en RAID1. /= IDE 80 Go, /home=/dev/sda1 (100 Go),
/var=/dev/sda2 (60
Go).
Voici le genre de messages que j'ai lors d'un fsck sur sda1 :
Buffer I/O error on device hdb1, logical block 69
hdb: dma_intr: status=0x51 { DriveReady SeekComplete Error }
hdb: dma_intr: error=0x40 { UncorrectableError }, LBAsecti, high= 0,
lowi,
sectori
end_request: I/O error, dev hdb, sector 69
Et ceci à tous les blocs logiques !!!

Lorsque la machine démarre j'ai ceci :
kernel: scsi0: ERROR on channel 0, id 0, lun 0, CDB: Read (10) 00 03
f8 00 4f
00 00 08 00
kernel: Additional sense: Unrecovered read error - auto reallocate
failed
(...)
kernel: Current sda: sense key Medium Error
kernel: end_request: I/O error, dev sda, sector xxxxxxx

De plus, impossible de faire un dd ou cp -a vers un autre disque pour
sauvegarder les données. J'ai également essayé de mettre l'un des
disques
SATA sur une autre machine -> mis à part quelques erreurs du FS, ça a
l'air
de passer.

Donc, je pencherais pour un problème au niveau de la carte mère
elle-même
(contrôleur ou environs). Quelqu'un a t il déjà eu ce genre
d'expérience ?
Quelqu'un pourrait-il m'aider ou m'aiguiller sur l'origine de cette
panne ?



Que donne mdadm -D /dev/md0 (ou md1, md2) en fonciton de
l'organisation de votre raid ?

Si un disque est endomagé ou si des données sont défectueuses sur un
disque, le raid doit tourner en mode dégradé sur l'autre disque. Si
votre problème est un problème de système de fichiers, il est possi ble
que les données soient cassées sur les deux disques.

Vous ne ctez pas de messages d'erreur sur le second disque, peut-être
est-il intère malgré tout ?


Tristan.



Jaen-Luc

--=-IPOpr48x89ZtCDNi826Y
Content-Type: application/pgp-signature

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.1 (GNU/Linux)

iD8DBQBDNoQcXit3lz9m7V4RAi1jAKCcHQaLgH/YgVowvCPipQRhSSeXXACgtdLR
PmPTnlfKqiA/ZV8oApQpHn0 =GVSD
-----END PGP SIGNATURE-----

--=-IPOpr48x89ZtCDNi826Y--



--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact