raid soft erreur

Le
Christophe PEREZ
Bonjour,

Ce qui devait arriver semble être arrivé, mon raid soft m'indique un
problème.
(je ne sais pas si c'est normal, mais j'ai reçu un mail pour chaque
partition du raid 1)
# cat /proc/mdstat
Personalities : [raid0] [raid1]
md1 : active raid1 sdb1[2](F) sda1[0]
24000 blocks [2/1] [U_]
bitmap: 0/3 pages [0KB], 4KB chunk

md2 : active raid1 sdb2[2](F) sda2[0]
20000832 blocks [2/1] [U_]
bitmap: 6/153 pages [24KB], 64KB chunk

md3 : active raid1 sdb3[2](F) sda3[0]
2000000 blocks [2/1] [U_]
bitmap: 0/123 pages [0KB], 8KB chunk

md5 : active raid1 sdb5[2](F) sda5[0]
2995968 blocks [2/1] [U_]
bitmap: 7/183 pages [28KB], 8KB chunk

md6 : active raid1 sdb6[2](F) sda6[0]
30001280 blocks [2/1] [U_]
bitmap: 54/229 pages [216KB], 64KB chunk

md7 : active raid1 sdb7[2](F) sda7[0]
60002624 blocks [2/1] [U_]
bitmap: 36/229 pages [144KB], 128KB chunk

md8 : active raid1 sdb8[2](F) sda8[0]
861734528 blocks [2/1] [U_]
bitmap: 1/206 pages [4KB], 2048KB chunk

unused devices: <none>

Toutes les partitions ont un problème ?!?

# smartctl -a /dev/sdb
smartctl 5.42 2011-10-20 r3458 [x86_64-linux-2.6.32-openvz-feoktistov.1]
(local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

Short INQUIRY response, skip product id
A mandatory SMART command failed: exiting. To continue, add one or more '-
T permissive' options.

# smartctl -a -T permissive /dev/sdb
smartctl 5.42 2011-10-20 r3458 [x86_64-linux-2.6.32-openvz-feoktistov.1]
(local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

Short INQUIRY response, skip product id
SMART Health Status: OK
Read defect list: asked for grown list but didn't get it

Error Counter logging not supported
scsiModePageOffset: response length too short, resp_lenG offsetP
bd_lenF
Device does not support Self Test logging

Par contre :
# smartctl -a /dev/sda
smartctl 5.42 2011-10-20 r3458 [x86_64-linux-2.6.32-openvz-feoktistov.1]
(local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

START OF INFORMATION SECTION
Model Family: Seagate Barracuda 7200.12
Device Model: ST31000528AS
Serial Number: 9VP0G8JR
LU WWN Device Id: 5 000c50 014ef5ce3
Firmware Version: CC34
User Capacity: 1 000 204 886 016 bytes [1,00 TB]
Sector Size: 512 bytes logical/physical
Device is: In smartctl database [for details use: -P show]
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 4
Local Time is: Mon Apr 1 18:57:59 2013 AST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

START OF READ SMART DATA SECTION
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine
completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 609) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off
support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 198) minutes.
Conveyance self-test routine
recommended polling time: ( 2) minutes.
SCT capabilities: (0x103f) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE
UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 119 099 006 Pre-fail
Always - 234830234
3 Spin_Up_Time 0x0003 095 095 000 Pre-fail
Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age
Always - 184
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail
Always - 13
7 Seek_Error_Rate 0x000f 083 060 030 Pre-fail
Always - 233811271
9 Power_On_Hours 0x0032 089 089 000 Old_age
Always - 10345
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail
Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age
Always - 184
183 Runtime_Bad_Block 0x0000 100 100 000 Old_age
Offline - 0
184 End-to-End_Error 0x0032 100 100 099 Old_age
Always - 0
187 Reported_Uncorrect 0x0032 099 099 000 Old_age
Always - 1
188 Command_Timeout 0x0032 100 092 000 Old_age
Always - 65931
189 High_Fly_Writes 0x003a 100 100 000 Old_age
Always - 0
190 Airflow_Temperature_Cel 0x0022 067 058 045 Old_age
Always - 33 (Min/Max 30/37)
194 Temperature_Celsius 0x0022 033 042 000 Old_age
Always - 33 (0 20 0 0 0)
195 Hardware_ECC_Recovered 0x001a 044 020 000 Old_age
Always - 234830234
197 Current_Pending_Sector 0x0012 100 100 000 Old_age
Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age
Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age
Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age
Offline - 178168128350801
241 Total_LBAs_Written 0x0000 100 253 000 Old_age
Offline - 894359103
242 Total_LBAs_Read 0x0000 100 253 000 Old_age
Offline - 2947947955

SMART Error Log Version: 1
ATA Error Count: 1
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DDÚys, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 1 occurred at disk power-on lifetime: 6173 hours (257 days + 5
hours)
When the command that caused the error occurred, the device was doing
SMART Offline or Self-test.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 33 31 b6 0d Error: UNC at LBA = 0x0db63133 = 230043955

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- - --
60 00 80 01 3f b6 4d 00 21d+11:26:20.618 READ FPDMA QUEUED
60 00 80 81 3e b6 4d 00 21d+11:26:20.617 READ FPDMA QUEUED
60 00 00 81 3d b6 4d 00 21d+11:26:20.600 READ FPDMA QUEUED
60 00 00 81 3c b6 4d 00 21d+11:26:20.599 READ FPDMA QUEUED
60 00 00 81 3b b6 4d 00 21d+11:26:20.597 READ FPDMA QUEUED

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime
(hours) LBA_of_first_error
# 1 Short offline Completed without error 00%
8077 -
# 2 Short offline Completed without error 00%
8053 -
# 3 Short offline Completed without error 00%
8029 -
# 4 Short offline Completed without error 00%
8014 -
# 5 Short offline Completed without error 00%
8004 -
# 6 Short offline Completed without error 00%
7978 -
# 7 Short offline Completed without error 00%
7954 -
# 8 Short offline Completed without error 00%
7930 -
# 9 Short offline Completed without error 00%
7896 -
#10 Short offline Completed without error 00%
7872 -
#11 Short offline Completed without error 00%
7854 -
#12 Short offline Completed without error 00%
7830 -
#13 Short offline Completed without error 00%
7806 -
#14 Short offline Completed without error 00%
7782 -
#15 Short offline Completed without error 00%
7758 -
#16 Short offline Completed without error 00%
7738 -
#17 Short offline Completed without error 00%
7700 -
#18 Short offline Completed without error 00%
7676 -
#19 Short offline Completed without error 00%
7652 -
#20 Short offline Completed without error 00%
7628 -
#21 Short offline Completed without error 00%
7604 -

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute
delay.

Les 2 disques sont du même modèle.
C'est mon sdb qui est totalement mort comme ça subitement ?
Je n'ai jamais eu de remontée d'erreur de smart
J'avoue que je n'y connais vraiment pas grand chose à tout ça, et qu'en
plus le hard n'est pas mon fort.

Si ça vous parle, tant mieux et merci d'avance.
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses Page 1 / 3
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Emmanuel Florac
Le #25315442
Le Mon, 01 Apr 2013 23:00:05 +0000, Christophe PEREZ a écrit:

Bonjour,

Ce qui devait arriver semble être arrivé, mon raid soft m'indique un
problème.
(je ne sais pas si c'est normal, mais j'ai reçu un mail pour chaque
partition du raid 1)
# cat /proc/mdstat
Personalities : [raid0] [raid1]
md1 : active raid1 sdb1[2](F) sda1[0]
24000 blocks [2/1] [U_]
bitmap: 0/3 pages [0KB], 4KB chunk



Toutes les partitions ont un problème ?!?




Ce ne sont pas des partitions, mais des RAID distincts. Au lieu de faire
un raid avec sda et sdb, puis de le partitionner, tu as partitionné sda
et sdb et créé une foultitude de RAID. Du coup, si un disque tousse, tu
as autant d'alertes, normal.


SMART Self-test log structure revision number 1 Num Test_Description
Status Remaining LifeTime (hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 8077



Pas mal d'erreurs mais c'est pas très clair, avec la justification qui
bouffe la sortie.

Les 2 disques sont du même modèle.



Seagate Barracuda, la plus sombre merde fabriquée ce siècle-ci. Le seul
disque garanti un an (au lieu de 3 ou 5). Le truc à ne jamais acheter.
Désolé.

C'est mon sdb qui est totalement mort comme ça subitement ? Je n'ai
jamais eu de remontée d'erreur de smart... J'avoue que je n'y connais
vraiment pas grand chose à tout ça, et qu'en plus le hard n'est pas mon
fort.

Si ça vous parle, tant mieux... et merci d'avance.



Il faut que tu relises les résultats du test smart après qu'il ait fait
son self-test. En cas de doute, le plus simple est sûrement de tester le
disque avec Seatools.


--
Ph'nglui mglw'nafh Cthulhu R'lyeh wgah'nagl fhtagn.
Christophe PEREZ
Le #25316002
Le Tue, 02 Apr 2013 07:35:51 +0000, Emmanuel Florac a écrit :

Au lieu de faire
un raid avec sda et sdb, puis de le partitionner, tu as partitionné sda
et sdb et créé une foultitude de RAID.



Ah, ben je pensais avoir fait ce qu'il fallait... et comme c'est suggéré
dans les multiples docs que j'avais lues.


Seagate Barracuda, la plus sombre merde fabriquée ce siècle-ci. Le seul
disque garanti un an (au lieu de 3 ou 5). Le truc à ne jamais acheter.
Désolé.



3 ans pour le mien (je crois) mais bon, datant de 2006, c'est mort depuis
lgtps.
Ceci dit, j'ai consciemment et volontairement pris du seagate depuis plusieurs
années parce que justement, je les trouvais fiables, vu de ma propre expérience.

Il faut que tu relises les résultats du test smart après qu'il ait fait
son self-test. En cas de doute, le plus simple est sûrement de tester le
disque avec Seatools.



Euh... là je ne comprends pas, vu que smartctl ne donne rien pour ce
disque :
# smartctl -a /dev/sdb
smartctl 5.42 2011-10-20 r3458 [x86_64-linux-2.6.32-openvz-feoktistov.1] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

Short INQUIRY response, skip product id
A mandatory SMART command failed: exiting. To continue, add one or more '-T permissive' options.


et :
# smartctl -T permissive -a /dev/sdb
smartctl 5.42 2011-10-20 r3458 [x86_64-linux-2.6.32-openvz-feoktistov.1] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

Short INQUIRY response, skip product id
SMART Health Status: OK
Read defect list: asked for grown list but didn't get it

Error Counter logging not supported
scsiModePageOffset: response length too short, resp_lenG offsetP bd_lenF
Device does not support Self Test logging



Et même :
# fdisk -l /dev/sdb
fdisk: impossible d'ouvrir /dev/sdb: Erreur d'entrée/sortie


Bon, à part une réponse et solution miracle ici, je suis bien parti
pour devoir changer ce disque, mais je me pose une question sur le choix.
Dans l'idéal, je devrais reprendre le même modèle à l'identique non ?
Et sinon, avoir un disque dont la géométrie est la même non ?
Parce que si je ne reprends pas du seagate (tu suggères quoi à la place ?),
et si j'ai bien compris, il me faut au moins la même dimension (pour que
mon raid actuel "rentre" dedans) et pas vraiment plus parce que ça sera de la
place perdue (à moins d'avoir vraiment plus et de faire une partition hors raid).
Bref, les recommandations pour le choix du disque de remplacement...
Emmanuel Florac
Le #25316902
Le Tue, 02 Apr 2013 13:48:52 +0000, Christophe PEREZ a écrit:


Et même :
# fdisk -l /dev/sdb
fdisk: impossible d'ouvrir /dev/sdb: Erreur d'entrée/sortie



En effet pas de doute, il est mort et bien mort.

Bon, à part une réponse et solution miracle ici, je suis bien parti pour
devoir changer ce disque, mais je me pose une question sur le choix.
Dans l'idéal, je devrais reprendre le même modèle à l'identique non ?



Sauf qu'il n'est plus fabriqué depuis longtemps, donc ça risque d'être
dur. Les Barracuda plus récents sont les pires de tous.

Et
sinon, avoir un disque dont la géométrie est la même non ? Parce que si
je ne reprends pas du seagate (tu suggères quoi à la place ?), et si
j'ai bien compris, il me faut au moins la même dimension (pour que mon
raid actuel "rentre" dedans) et pas vraiment plus parce que ça sera de
la place perdue (à moins d'avoir vraiment plus et de faire une partition
hors raid). Bref, les recommandations pour le choix du disque de
remplacement...



Les HGST sont légèrement plus gros que les seagate à capacité égale.
Sinon tu peux prendre du Seagate, mais du Constellation (qui fonctionnent
apparemment correctement).

--
The bearing of a child takes 9 months, no matter how many women are
assigned.
Fred Brooks
Christophe PEREZ
Le #25317202
Le Tue, 02 Apr 2013 21:52:05 +0000, Emmanuel Florac a écrit :


En effet pas de doute, il est mort et bien mort.



Mais, je n'ai jamais vu un disque disparaitre de la sorte d'un coup.
C'est plus un problème électrique alors ?
Le problème ne peut pas provenir d'ailleurs que le disque ? Je ne sais
pas, je dis n'importe quoi, nappe, port sata, alim...
Parce que ça serait embêtant de tout mettre en oeuvre pour m'en commander
un en chronopost, pour finir par me rendre compte que le pb est ailleurs.
Pour l'instant, je n'ai pas encore voulu stopper le serveur, par besoin.

Sauf qu'il n'est plus fabriqué depuis longtemps, donc ça risque d'être
dur. Les Barracuda plus récents sont les pires de tous.



Merci pour l'info.

Les HGST sont légèrement plus gros que les seagate à capacité égale.
Sinon tu peux prendre du Seagate, mais du Constellation (qui
fonctionnent apparemment correctement).



Je le note aussi. Mais concernant sa taille, j'avais juste dans mes
interprétations ?
Emmanuel Florac
Le #25318352
Le Wed, 03 Apr 2013 03:43:13 +0000, Christophe PEREZ a écrit:

Le Tue, 02 Apr 2013 21:52:05 +0000, Emmanuel Florac a écrit :


En effet pas de doute, il est mort et bien mort.



Mais, je n'ai jamais vu un disque disparaitre de la sorte d'un coup.



Ça arrive. Surtout avec les Barracuda :)


Les HGST sont légèrement plus gros que les seagate à capacité égale.
Sinon tu peux prendre du Seagate, mais du Constellation (qui
fonctionnent apparemment correctement).



Je le note aussi. Mais concernant sa taille, j'avais juste dans mes
interprétations ?



Pour des grosses grappes RAID, oui. Pour du RAID-1 simple avec deux
disques, je ne pense pas que ça fasse de grosse différence.

--
De longs désirs, une longue admiration sans espérance, voilà le moyen
d'adorer les femmes, et de rendre l'amour une passion délicieuse!
N. Rétif de la Bretonne.
Christophe PEREZ
Le #25318792
Le Wed, 03 Apr 2013 18:20:56 +0000, Emmanuel Florac a écrit :

Mais, je n'ai jamais vu un disque disparaitre de la sorte d'un coup.



Ça arrive. Surtout avec les Barracuda



Ah ben mince.

Pour des grosses grappes RAID, oui. Pour du RAID-1 simple avec deux
disques, je ne pense pas que ça fasse de grosse différence.



Je n'ai pas du être clair. Je tente de reprendre.
Mon disque fait 1To. Mais, j'ai en mémoire que selon les fabriquants, la
taille théorique n'est pas réellement respectée à l'octet près.
Donc, si j'achète un disque de 1To, mais qu'il fasse très légèrement
moins que le mien, je vais avoir un problème pour partitionner de façon
identique pour remettre mon raid en place non ?
Si oui, il faut donc que ce disque fasse au moins exactement la même
taille, ce qui pourrait donc être un hasard, et donc, il faut qu'il fasse
plus. Mais s'il fait à peine plus, le plus sera perdu. S'il fait beaucoup
plus, à la limite, je peux y faire une partition hors raid, sans bien en
avoir le besoin.
J'ai faux quelque part ?
C'est une question que je me suis toujours posée. Je fais un raid 1 avec
2 disques identiques, mais le jour ou l'un des 2 lâche, et que je ne
trouve pas le même modèle à l'identique, par quoi je le remplace ?
Emmanuel Florac
Le #25318832
Le Thu, 04 Apr 2013 04:03:50 +0000, Christophe PEREZ a écrit:

Si oui, il faut donc que ce disque fasse au moins exactement la même
taille,



Oui, mais les Seagate de même capacité (1 To) font toujours la même
taille, et les Hitachi/HGST sont légèrement plus gros (de 1 ou 2 Mo). Donc
si tu prends un Seagate ou un HGST, pas de problème.


--
It always takes longer than you expect, even when you take into account
Hofstadter's Law.
Hofstadter's Law
Christophe PEREZ
Le #25319252
Le Thu, 04 Apr 2013 07:09:52 +0000, Emmanuel Florac a écrit :

Oui, mais les Seagate de même capacité (1 To) font toujours la même
taille, et les Hitachi/HGST sont légèrement plus gros (de 1 ou 2 Mo).
Donc si tu prends un Seagate ou un HGST, pas de problème.



Ah ok, là c'est définitivement clair pour moi ;)

Par contre, j'ai regardé chez ldlc, les constellations sont bien plus
chers que les barracuda. Quasi le double...
Il y a 2 hitachi 1To. Un à 3Gb/s et l'autre à 6Gb/s. Les 2 au même prix,
mais évidemment, le second est en rupture...
Dans mon cas, la différence se feraient sentir ou pas ? (je trouve les
accès disques lents).
Emmanuel Florac
Le #25320332
Le Thu, 04 Apr 2013 13:53:22 +0000, Christophe PEREZ a écrit:

Le Thu, 04 Apr 2013 07:09:52 +0000, Emmanuel Florac a écrit :

Oui, mais les Seagate de même capacité (1 To) font toujours la même
taille, et les Hitachi/HGST sont légèrement plus gros (de 1 ou 2 Mo).
Donc si tu prends un Seagate ou un HGST, pas de problème.



Ah ok, là c'est définitivement clair pour moi ;)

Par contre, j'ai regardé chez ldlc, les constellations sont bien plus
chers que les barracuda. Quasi le double...



Tout est relatif : même à moitié prix le barracuda est trop cher pour une
pareille daube :)

Il y a 2 hitachi 1To. Un à
3Gb/s et l'autre à 6Gb/s. Les 2 au même prix, mais évidemment, le second
est en rupture... Dans mon cas, la différence se feraient sentir ou pas
? (je trouve les accès disques lents).



Aucune différence, les disques SATA vont 120-140 Mo/s max, alors déjà 3
Gb/s (environ 300 Mo/s) c'est déjà plus qu'il n'en faut.


--
It always takes longer than you expect, even when you take into account
Hofstadter's Law.
Hofstadter's Law
Christophe PEREZ
Le #25320382
Le Thu, 04 Apr 2013 19:23:33 +0000, Emmanuel Florac a écrit :

Aucune différence, les disques SATA vont 120-140 Mo/s max, alors déjà 3
Gb/s (environ 300 Mo/s) c'est déjà plus qu'il n'en faut.



LDLC vient de me répondre, ils me proposent un WD http://www.ldlc.com/
fiche/PB00134121.html
Mais là se repose la question de la capacité exacte...
Publicité
Poster une réponse
Anonyme