OVH Cloud OVH Cloud

Latences importantes sur un disque dur, et blocages applicatifs

9 réponses
Avatar
Hugues
Bonjour à tous,

soupçonnant un problème matériel, mais n'en étant pas 100% certain, je
X-poste sur fcolc et fcsp.

J'ai, depuis un peu plus d'un an, un système linux installé sur deux
disques Western Digital en RAID-1 logiciel (sda et sdc, ça servira par
la suite).
Jusqu'ici, tout va bien.

Il y a peu (un peu plus d'1 mois), SMARTd a commencé à me remonter des
erreurs sur le premier disque (sda), de façon assez régulière.
Je l'ai donc remplacé au bout de quelques jours par un Hitachi, même
capacité, même géométrie (coup de chance ;-)).
(C'est ce qui apparaît Semaine #18 dans les graphiques :
http://www.hiegel.fr/~hugues/Photos/stats/
)


À ce moment là, j'en ai profité pour faire un peu de ménage, et déplacer
les partitions de données qui traînaient sur d'autres disques, sur *ce*
RAID là.


Or, peu de temps après ces manipulations, j'ai constaté que mon système
était parfois *TRES* lent à réagir, à chaque fois que j'effectuais une
opération d'écriture sur le disque.. (les applis restent réactives, sauf
celles qui étaient bloquées sur une écriture fichier... Particulièrement
pénible).
Ce blocage pouvait durer jusqu'à.. 4 minutes !


Pourtant, SMARTd ne me remontait aucune erreur sur l'autre disque
Western Digital (sdc). En tout désespoir, j'ai fini par retirer ce
disque du RAID-1.
J'ai laissé tourner une semaine : *AUCUN* blocage système n'a été à
déplorer..

J'ai réinséré ce WD dans le RAID-1 hier, et je pense avoir observé
quelques ralentissements, mais c'est beaucoup moins flagrant...


On note que le disque Hitachi a une latence *incroyablement* inférieure
aux Western Digital (invisible sur le graphique /mois, dans le graphique
/jour on note des latences de l'ordre 20ms (en raid) à 50ms (avec le
raid sans sdc))
Ces derniers ont pourtant eu cette latence de 3 à 4s durant toute l'année,
sans ralentissements notoires sur le système...

Est-ce lié ? Dois-je regarder d'autres paramètres ? Mon disque a-t-il un problème ?
Qu'il en ait un ou pas, devrais-je plutôt le remplacer par un autre
Hitachi pour avoir une meilleure "fluidité système" ?


Merci pour vos conseil/lumières...

--
Hugues Hiegel [http://www.hiegel.fr/~hugues/]

9 réponses

Avatar
Hugues
Ce cher Hugues a posté :

Bonjour à tous,

soupçonnant un problème matériel, mais n'en étant pas 100% certain, je
X-poste sur fcolc et fcsp.

J'ai, depuis un peu plus d'un an, un système linux installé sur deux
disques Western Digital en RAID-1 logiciel (sda et sdc, ça servira par
la suite).
Jusqu'ici, tout va bien.



Je viens de lire le thread "Quel ver a piqué mon disque ?" sur fcsp,
et j'y lis que les WD EADS/EARS sont des merdes épouvantables.

$ hdparm -i /dev/sdc | grep Model
Model=WDC WD10EARS-22Y5B1, FwRev€.00A80, SerialNo=WD-WCAV5C162510
$


Hum.
Bon bah j'ai plus qu'à sortir les pépettes. ;-)

(C'est quand même un scandale, +de 50€ pour un disque qui ne tient même pas
un an... Faut que je repêche mes factures, voir s'ils sont toujours sous
garantie -ce dont je doute- ..)



Merci de m'avoir lu !

--
Hugues Hiegel [http://www.hiegel.fr/~hugues/]
Avatar
Yannick Palanque
(attention, suivi sur fcsp)


Bonjour,

À 2011-05-26T11:35:27+0200,
Hugues écrivit :

Je viens de lire le thread "Quel ver a piqué mon disque ?" sur fcsp,
et j'y lis que les WD EADS/EARS sont des merdes épouvantables.



Il y a surtout un problème avec l'Advanced Format, non ?


(C'est quand même un scandale, +de 50€ pour un disque qui ne tient
même pas un an... Faut que je repêche mes factures, voir s'ils sont
toujours sous garantie -ce dont je doute- ..)



Les constructeurs de HDD les garantissent en général pour 3 ans, non ?







(non ?)
Avatar
Williamhoustra
Après mûre réflexion, Hugues a écrit :
Ce cher Hugues a posté :

Bonjour à tous,

soupçonnant un problème matériel, mais n'en étant pas 100% certain, je
X-poste sur fcolc et fcsp.

J'ai, depuis un peu plus d'un an, un système linux installé sur deux
disques Western Digital en RAID-1 logiciel (sda et sdc, ça servira par
la suite).
Jusqu'ici, tout va bien.



Je viens de lire le thread "Quel ver a piqué mon disque ?" sur fcsp,
et j'y lis que les WD EADS/EARS sont des merdes épouvantables.

$ hdparm -i /dev/sdc | grep Model
Model=WDC WD10EARS-22Y5B1, FwRev€.00A80, SerialNo=WD-WCAV5C162510
$


Hum.
Bon bah j'ai plus qu'à sortir les pépettes. ;-)

(C'est quand même un scandale, +de 50¤ pour un disque qui ne tient même pas
un an... Faut que je repêche mes factures, voir s'ils sont toujours sous
garantie -ce dont je doute- ..)



Bienvenue au club ! Il est sûr que ces disques n'ont pas une bonne
réputation (chez moi ils étaient infichus de lire une vidéo sans
saccades). On a un peu l'impression que pour des particuliers tous les
disques se valent, que nenni ! L'ennui c'est que les caractéristiques
ne sont pas documentées sur les sites des vendeurs. Seul materiel.net
distinguent les disques en catégories "système" "stockage"
"écologiques" (le mot hochet employé pour tout et n'importe quoi) et
les "RAID". En plus des spéciaux serveurs.
http://www.materiel.net/disque-dur-3-5-pouces/
Avatar
Fabien LE LEZ
On Fri, 27 May 2011 08:25:56 +0200, Williamhoustra
:

On a un peu l'impression que pour des particuliers tous les
disques se valent, que nenni !



Ne t'inquiète pas, ça risque de venir. La seule marque que j'aimais
bien était Samsung, mais apparemment ils ferment.
Avatar
Olivier V
Fabien LE LEZ wrote:

On Fri, 27 May 2011 08:25:56 +0200, Williamhoustra
:

On a un peu l'impression que pour des particuliers tous les
disques se valent, que nenni !



Ne t'inquiète pas, ça risque de venir. La seule marque que j'aimais
bien était Samsung, mais apparemment ils ferment.



J'avais un samsung 320 Go 2.5 pouces qui m'a fait à peine plus d'un an
(juste après la garantie) à raison d'une sauvegarde par mois ...

Donc je ne rachète plus samsung ;)

Olivier V
Avatar
Emmanuel Florac
Le Fri, 27 May 2011 22:31:18 +0200, Olivier V a écrit:


J'avais un samsung 320 Go 2.5 pouces qui m'a fait à peine plus d'un an
(juste après la garantie) à raison d'une sauvegarde par mois ...



Le problème c'est que statistiquement, il y a entre 3 et 5% de panne par
an sur les disques durs. Donc il est absolument aberrant de juger une
marque sur un seul exemplaire :)

--
L'Algérie était au bord du gouffre, aujourd'hui elle a fait un grand pas
en avant.
Kaid Ahmed.
Avatar
Emmanuel Florac
Le Thu, 26 May 2011 21:32:08 +0200, Yannick Palanque a écrit:


Il y a surtout un problème avec l'Advanced Format, non ?



Pas bête, si les partitions ne sont pas alignées avec les blocs, paf les
performances! :)

--
Le livre, comme livre, appartient à l'auteur, mais comme pensée, il
appartient - le mot n'est pas trop vaste - au genre humain. Toutes les
intelligences y ont droit. Si l'un des deux droits, le droit de
l'écrivain et le droit de l'esprit humain, devait être sacrifié, ce
serait, certes, le droit de l'écrivain, car l'intérêt public est notre
préoccupation unique, et tous, je le déclare, doivent passer avant nous.
Victor Hugo.
Avatar
Fabien LE LEZ
Ajoutons qu'avant de passer un disque dur neuf en production, il faut
le faire "chauffer" un peu (badblocks pendant 72 à 96 heures devrait
suffire), histoire de repérer immédiatement s'il a un défaut évident.
Avatar
Hugues
Ce cher Hugues a posté :

Ce cher Hugues a posté :

Bonjour à tous,

soupçonnant un problème matériel, mais n'en étant pas 100% certain, je
X-poste sur fcolc et fcsp.

J'ai, depuis un peu plus d'un an, un système linux installé sur deux
disques Western Digital en RAID-1 logiciel [...]



Je viens de lire le thread "Quel ver a piqué mon disque ?" sur fcsp,
et j'y lis que les WD EADS/EARS sont des merdes épouvantables.

$ hdparm -i /dev/sdc | grep Model
Model=WDC WD10EARS-22Y5B1, FwRev€.00A80, SerialNo=WD-WCAV5C162510
$



Disques durs remplacés par Western Digital après passage en SAV chez surcouf.
Je me retrouve de nouveau avec deux EARS.
Sceptique, je n'en ai monté qu'un seul dans ma tour.

J'agrandis mon RAID-1 de 2 disques (Hitachi, je ne suis pas fou..) à 3.
Je rajoute un des nouveaux WD dans le RAID, et la synchronisation se
lance (même géométrie que les Hitachi si mes souvenirs sont bons).
Quelques heures plus tard, à 99,9% de la synchro, *PAF* le disque !

Je le vire du RAID, tente de le re-ajouter, rien à faire.
Les infos MD ont disparu de la partition.
Une horreur, jugez plutôt :

[2860113.535560] end_request: I/O error, dev sdc, sector 0
[2860113.535653] sd 1:0:0:0: [sdc] Unhandled error code
[2860113.535675] sd 1:0:0:0: [sdc] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[2860113.535711] sd 1:0:0:0: [sdc] CDB: Read(10): 28 00 00 00 00 00 00 00 08 00
(J'ai 500 messages de ce type, sur plein d'autres secteurs..)

[2860113.535776] end_request: I/O error, dev sdc, sector 0
[2860122.143820] sd 1:0:0:0: [sdc] READ CAPACITY(16) failed
[2860122.143851] sd 1:0:0:0: [sdc] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[2860122.143889] sd 1:0:0:0: [sdc] Sense not available.
[2860122.143952] sd 1:0:0:0: [sdc] READ CAPACITY failed
[2860122.143973] sd 1:0:0:0: [sdc] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[2860122.144106] sd 1:0:0:0: [sdc] Sense not available.
[2860122.144337] sd 1:0:0:0: [sdc] Asking for cache data failed
[2860122.144359] sd 1:0:0:0: [sdc] Assuming drive cache: write through

À tout hasard, je lance un hdparm -z :

[2860122.144385] sdc: detected capacity change from 1000204886016 to 0

Wow. :-)

[2860178.972568] sd 1:0:0:0: [sdc] READ CAPACITY(16) failed
[2860178.972600] sd 1:0:0:0: [sdc] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[2860178.972638] sd 1:0:0:0: [sdc] Sense not available.
[2860178.972702] sd 1:0:0:0: [sdc] READ CAPACITY failed
[2860178.972723] sd 1:0:0:0: [sdc] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[2860178.977245] sd 1:0:0:0: [sdc] Sense not available.
[2860178.977337] sd 1:0:0:0: [sdc] Asking for cache data failed
[2860178.977360] sd 1:0:0:0: [sdc] Assuming drive cache: write through


Bon. Pas la peine de vous demander comment récupérer le disque, je suppose :-)
Durée de vie totale : moins de 4 heures. Joli score ! :D


--
Hugues Hiegel [http://www.hiegel.fr/~hugues/]