Problème disque dure

Le
ZarkXe
Bonjours à tous,

J'ai un serveur dont il possède 4 disque dur : 3 disques en raid 5
(mdadm) et un autre tournant dans sont coin.

De temps en temps, un disque s’arrête quelque seconde (On entend un
petit bruit) puis il reprend son activité. Lorsque le disque "bug"
kernel affiche cette erreur :

-%<--
Jan 28 14:53:58 serveur kernel: [ 962.040034] ata4: lost interrupt
(Status 0x50)
Jan 28 14:53:58 serveur kernel: [ 962.040051] ata4.00: exception Emask
0x10 SAct 0x0 SErr 0x4050002 action 0xe frozen
Jan 28 14:53:58 serveur kernel: [ 962.040055] ata4: SError: { RecovComm
PHYRdyChg CommWake DevExch }
Jan 28 14:53:58 serveur kernel: [ 962.040059] ata4.00: failed command:
READ DMA
Jan 28 14:53:58 serveur kernel: [ 962.040063] ata4.00: cmd
c8/00:e0:20:d3:98/00:00:00:00:00/e1 tag 0 dma 114688 in
Jan 28 14:53:58 serveur kernel: [ 962.040064] res
40/00:01:01:4f:c2/00:00:00:00:00/00 Emask 0x14 (ATA bus error)
Jan 28 14:53:58 serveur kernel: [ 962.040066] ata4.00: status: { DRDY }
Jan 28 14:53:58 serveur kernel: [ 962.040073] ata4: hard resetting link
Jan 28 14:53:59 serveur kernel: [ 962.950052] ata4: SATA link up 3.0
Gbps (SStatus 123 SControl 300)
Jan 28 14:53:59 serveur kernel: [ 963.056202] ata4.00: configured for
UDMA/133
Jan 28 14:53:59 serveur kernel: [ 963.066168] ata4: EH complete
--%<--

Cette erreur provoque le ralentissement de la machine.

Connaissais-vous ce type d'erreur ? Si ce n'est pas une erreur logiciel,
comment puis-je savoir qu'elle est le disque dure défectueux.

Merci à tous.
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
xavier
Le #24202881
ZarkXe
De temps en temps, un disque s'arrête quelque seconde (On entend un
petit bruit) puis il reprend son activité. Lorsque le disque "bug"
kernel affiche cette erreur :



Ce sont des erreurs matérielles. Ton disque est mort ou sur le point de
l'être. Fais rapidement un clone de ton disque et va en acheter un autre
(désolé pour les tarifs actuels, je sais, c'est pas le bon moment...)

Pour savoir duquel il s'agit, dmesg peut t'aider si ce ne sont pas tous
les mêmes modèles. Sinon, il reste la bonne vieille méthode essai et
erreur

Edit : ton RAID5 est logiciel ? Si oui, pas de bol, retour à l'étape
précédente, si non, le kernel indiquerait le device du contrôleur au
lieu de ata4, et le coupable serait donc le disque isolé.
--
XAv
In your pomp and all your glory you're a poorer man than me,
as you lick the boots of death born out of fear.
(Jethro Tull)
Yannick Palanque
Le #24203481
Bonjour,

À 2012-01-28T15:08:02+0100,
ZarkXe
Connaissais-vous ce type d'erreur ? Si ce n'est pas une erreur
logiciel, comment puis-je savoir qu'elle est le disque dure
défectueux.



C'est typique d'un HDD en train de mourir.
Tu peux tester tes disques durs avec smartctl et voir les erreurs SMART.
ZarkXe
Le #24204911
Bonjour,

Pour chaque disque SMART me dit (smartctl -l selftest /dev/sdx)
"Completed without error"

On 01/28/2012 07:39 PM, Yannick Palanque wrote:
Bonjour,

À 2012-01-28T15:08:02+0100,
ZarkXe
Connaissais-vous ce type d'erreur ? Si ce n'est pas une erreur
logiciel, comment puis-je savoir qu'elle est le disque dure
défectueux.



C'est typique d'un HDD en train de mourir.
Tu peux tester tes disques durs avec smartctl et voir les erreurs SMART.

Yannick Palanque
Le #24204971
Bonjour,

À 2012-01-29T15:07:58+0100,
ZarkXe
Pour chaque disque SMART me dit (smartctl -l selftest /dev/sdx)
"Completed without error"



Ah. Et tu avais lancé un test long avant ?
(smartctl -t long /dev/sdx)

Est-ce que ce disque est dans le RAID-5 ? Il n'y a pas dans les
journaux des erreurs à propos du RAID ?
Publicité
Poster une réponse
Anonyme