Problème disque dure

4 réponses

ZarkXe

28/01/2012 à 15:08

Bonjours à tous,

J'ai un serveur dont il possède 4 disque dur : 3 disques en raid 5
(mdadm) et un autre tournant dans sont coin.

De temps en temps, un disque s’arrête quelque seconde (On entend un
petit bruit) puis il reprend son activité. Lorsque le disque "bug"
kernel affiche cette erreur :

-------------------%<--------------------------------------
Jan 28 14:53:58 serveur kernel: [ 962.040034] ata4: lost interrupt
(Status 0x50)
Jan 28 14:53:58 serveur kernel: [ 962.040051] ata4.00: exception Emask
0x10 SAct 0x0 SErr 0x4050002 action 0xe frozen
Jan 28 14:53:58 serveur kernel: [ 962.040055] ata4: SError: { RecovComm
PHYRdyChg CommWake DevExch }
Jan 28 14:53:58 serveur kernel: [ 962.040059] ata4.00: failed command:
READ DMA
Jan 28 14:53:58 serveur kernel: [ 962.040063] ata4.00: cmd
c8/00:e0:20:d3:98/00:00:00:00:00/e1 tag 0 dma 114688 in
Jan 28 14:53:58 serveur kernel: [ 962.040064] res
40/00:01:01:4f:c2/00:00:00:00:00/00 Emask 0x14 (ATA bus error)
Jan 28 14:53:58 serveur kernel: [ 962.040066] ata4.00: status: { DRDY }
Jan 28 14:53:58 serveur kernel: [ 962.040073] ata4: hard resetting link
Jan 28 14:53:59 serveur kernel: [ 962.950052] ata4: SATA link up 3.0
Gbps (SStatus 123 SControl 300)
Jan 28 14:53:59 serveur kernel: [ 963.056202] ata4.00: configured for
UDMA/133
Jan 28 14:53:59 serveur kernel: [ 963.066168] ata4: EH complete
--------------------%<-----------------------------------------

Cette erreur provoque le ralentissement de la machine.

Connaissais-vous ce type d'erreur ? Si ce n'est pas une erreur logiciel,
comment puis-je savoir qu'elle est le disque dure défectueux.

Merci à tous.

4 réponses

xavier

28/01/2012 à 16:07

ZarkXe wrote:

De temps en temps, un disque s'arrête quelque seconde (On entend un
petit bruit) puis il reprend son activité. Lorsque le disque "bug"
kernel affiche cette erreur :

Ce sont des erreurs matérielles. Ton disque est mort ou sur le point de
l'être. Fais rapidement un clone de ton disque et va en acheter un autre
(désolé pour les tarifs actuels, je sais, c'est pas le bon moment...)

Pour savoir duquel il s'agit, dmesg peut t'aider si ce ne sont pas tous
les mêmes modèles. Sinon, il reste la bonne vieille méthode essai et
erreur

Edit : ton RAID5 est logiciel ? Si oui, pas de bol, retour à l'étape
précédente, si non, le kernel indiquerait le device du contrôleur au
lieu de ata4, et le coupable serait donc le disque isolé.
--
XAv
In your pomp and all your glory you're a poorer man than me,
as you lick the boots of death born out of fear.
(Jethro Tull)

Yannick Palanque

28/01/2012 à 19:39

Bonjour,

Ã 2012-01-28T15:08:02+0100,
ZarkXe Ã©crivit :

Connaissais-vous ce type d'erreur ? Si ce n'est pas une erreur
logiciel, comment puis-je savoir qu'elle est le disque dure
dÃ©fectueux.

C'est typique d'un HDD en train de mourir.
Tu peux tester tes disques durs avec smartctl et voir les erreurs SMART.

ZarkXe

29/01/2012 à 15:07

Bonjour,

Pour chaque disque SMART me dit (smartctl -l selftest /dev/sdx)
"Completed without error"

On 01/28/2012 07:39 PM, Yannick Palanque wrote:

Bonjour,

À 2012-01-28T15:08:02+0100,
ZarkXe écrivit :

Connaissais-vous ce type d'erreur ? Si ce n'est pas une erreur
logiciel, comment puis-je savoir qu'elle est le disque dure
défectueux.

C'est typique d'un HDD en train de mourir.
Tu peux tester tes disques durs avec smartctl et voir les erreurs SMART.

Yannick Palanque

29/01/2012 à 15:21

Pour chaque disque SMART me dit (smartctl -l selftest /dev/sdx)
"Completed without error"

Ah. Et tu avais lancÃ© un test long avant ?
(smartctl -t long /dev/sdx)

Est-ce que ce disque est dans le RAID-5 ? Il n'y a pas dans les
journaux des erreurs Ã propos du RAID ?

Problème disque dure

4 réponses

Veuillez sélectionner un problème