Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Problème avec mon Raid 1

8 réponses
Avatar
Sebastien
Bonjour,

On dirait que j'ai un probleme avec mon raid1
de mon serveur linux.

[root@e-smith root]# cat /proc/mdstat
Personalities : [raid1]
read_ahead 1024 sectors
md0 : active raid1 hdd1[1] <<<<<<<< !!
199141632 blocks [2/1] [_U]

unused devices: <none>


!! En effet j'ai deux disques sur ce raid : hdb1
qui n apparait pas ici.
[root@e-smith root]# cat /etc/raidtab
raiddev /dev/md0
raid-level 1
nr-raid-disks 2
nr-spare-disks 0
persistent-superblock 1
chunk-size 32
device /dev/hdb1
raid-disk 0
device /dev/hdd1
raid-disk 1

Que dois je faire pour réparer ça. Je croyais que cela
se réparerait automatiquement.
J'ai lu sur un site qu il faut faire mkraid -R /dev/md0 mais
les messages d'avertissement m'incite à la prudence.
J ai besoin d aide.
Merci d avance.

8 réponses

Avatar
Claude EMERY
"Sebastien" a écrit dans le message de news:
419e32ad$0$31410$
Bonjour,

On dirait que j'ai un probleme avec mon raid1
de mon serveur linux.

[ root]# cat /proc/mdstat
Personalities : [raid1]
read_ahead 1024 sectors
md0 : active raid1 hdd1[1] <<<<<<<< !!
199141632 blocks [2/1] [_U]

unused devices: <none>


!! En effet j'ai deux disques sur ce raid : hdb1
qui n apparait pas ici.
[ root]# cat /etc/raidtab
raiddev /dev/md0
raid-level 1
nr-raid-disks 2
nr-spare-disks 0
persistent-superblock 1
chunk-size 32
device /dev/hdb1
raid-disk 0
device /dev/hdd1
raid-disk 1

Que dois je faire pour réparer ça. Je croyais que cela
se réparerait automatiquement.
J'ai lu sur un site qu il faut faire mkraid -R /dev/md0 mais
les messages d'avertissement m'incite à la prudence.
J ai besoin d aide.
Merci d avance.






Bonjour


Effectivement, il semble que le disk hdb1 ne monte pas dans le raid
Au boot de la maachine, comment est le disk hdb1 ?
Que donne la resynchro du raid
# raidhotadd /dev/md0 /dev/hdb1 (resynchro du disk hdb1 dans raid md0)

Claude

Avatar
Sebastien
Bonjour Claude,

J ai effectué la manip raidhotadd et pas de message d erreur
la commande s execute apparement.

Je verifie :
[ root]# cat /proc/mdstat
Personalities : [raid1]
read_ahead 1024 sectors
md0 : active raid1 hdb1[2](F) hdd1[1]
199141632 blocks [2/1] [_U]

unused devices: <none>

Voila, je vois que hdb est dans mon raid mais qu il est défaillant. (F);

Sinon au démarrage :

Nov 19 18:40:36 e-smith kernel: md: autorun ...
Nov 19 18:40:36 e-smith kernel: md: considering hdd1 ...
Nov 19 18:40:36 e-smith kernel: md: adding hdd1 ...
Nov 19 18:40:36 e-smith kernel: md: adding hdb1 ...
Nov 19 18:40:36 e-smith kernel: md: created md0
Nov 19 18:40:36 e-smith kernel: md: bind<hdb1,1>
Nov 19 18:40:36 e-smith kernel: md: bind<hdd1,2>
Nov 19 18:40:36 e-smith kernel: md: running: <hdd1><hdb1>
Nov 19 18:40:36 e-smith kernel: md: hdd1's event counter: 00000027
Nov 19 18:40:36 e-smith kernel: md: hdb1's event counter: 00000001
Nov 19 18:40:36 e-smith kernel: md: superblock update time inconsistency --
using the most recent one
Nov 19 18:40:36 e-smith kernel: md: freshest: hdd1
Nov 19 18:40:36 e-smith kernel: md: kicking non-fresh hdb1 from array!
Nov 19 18:40:36 e-smith kernel: md: unbind<hdb1,1>
Nov 19 18:40:36 e-smith kernel: md: export_rdev(hdb1)
Nov 19 18:40:36 e-smith kernel: md: RAID level 1 does not need chunksize!
Continuing anyway.
Nov 19 18:40:36 e-smith kernel: md0: max total readahead window set to 124k
Nov 19 18:40:36 e-smith kernel: md0: 1 data-disks, max readahead per
data-disk: 124k
Nov 19 18:40:36 e-smith kernel: raid1: device hdd1 operational as mirror 1
Nov 19 18:40:36 e-smith kernel: raid1: md0, not all disks are operational --
trying to recover array
Nov 19 18:40:36 e-smith kernel: raid1: raid set md0 active with 1 out of 2
mirrors
Nov 19 18:40:37 e-smith kernel: md: updating md0 RAID superblock on device
Nov 19 18:40:37 e-smith kernel: md: hdd1 [events: 00000028]<6>(write) hdd1's
sb offset: 199141632
Nov 19 18:40:37 e-smith kernel: md: recovery thread got woken up ...
Nov 19 18:40:37 e-smith kernel: md0: no spare disk to reconstruct array! --
continuing in degraded mode
Nov 19 18:40:37 e-smith kernel: md: recovery thread finished ...
Nov 19 18:40:37 e-smith kernel: md: ... autorun DONE.



Ce que j'ai remarqué c'est : Nov 19 18:40:36 e-smith kernel: md: kicking
non-fresh hdb1 from array!
Donc hdb1 n est pas a jour dans ses superblock.


Dans mes log, la commande raidhotadd rends bcp de ligne voici un extrait que
j ai selectionné :

ov 21 12:48:53 e-smith kernel: md: updating md0 RAID superblock on device
Nov 21 12:48:53 e-smith kernel: md: hdb1 [events: 00000029]<6>(write) hdb1's
sb offset: 199141632
Nov 21 12:48:53 e-smith kernel: md: hdd1 [events: 00000029]<6>(write) hdd1's
sb offset: 199141632
Nov 21 12:48:53 e-smith kernel: md: recovery thread got woken up ...
Nov 21 12:48:53 e-smith kernel: md0: resyncing spare disk hdb1 to replace
failed disk
Nov 21 12:48:53 e-smith kernel: RAID1 conf printout:
Nov 21 12:48:53 e-smith kernel: --- wd:1 rd:2 nd:2
Nov 21 12:48:53 e-smith kernel: disk 0, s:0, o:0, n:0 rd:0 us:1 dev:[dev
00:00]
Nov 21 12:48:53 e-smith kernel: disk 1, s:0, o:1, n:1 rd:1 us:1 dev:hdd1
..................................................
Nov 21 12:48:54 e-smith kernel: disk 26, s:0, o:0, n:0 rd:0 us:0 dev:[dev
00:00]
Nov 21 12:48:54 e-smith kernel: RAID1 conf printout:
Nov 21 12:48:54 e-smith kernel: --- wd:1 rd:2 nd:2
Nov 21 12:48:54 e-smith kernel: disk 0, s:0, o:0, n:0 rd:0 us:1 dev:[dev
00:00]
Nov 21 12:48:54 e-smith kernel: disk 1, s:0, o:1, n:1 rd:1 us:1 dev:hdd1
Nov 21 12:48:54 e-smith kernel: disk 2, s:1, o:1, n:2 rd:2 us:1 dev:hdb1
.................................................
Nov 21 12:48:56 e-smith kernel: disk 26, s:0, o:0, n:0 rd:0 us:0 dev:[dev
00:00]
Nov 21 12:48:56 e-smith kernel: md: syncing RAID array md0
Nov 21 12:48:56 e-smith kernel: md: minimum _guaranteed_ reconstruction
speed: 100 KB/sec/disc.
Nov 21 12:48:56 e-smith kernel: md: using maximum available idle IO bandwith
(but not more than 10000 KB/sec) for reconstruction.
Nov 21 12:48:56 e-smith kernel: md: using 124k window, over a total of
199141632 blocks.
Nov 21 12:49:34 e-smith kernel: hdb: dma_timer_expiry: dma status == 0x61
Nov 21 12:49:44 e-smith kernel: hdb: timeout waiting for DMA <!!!!!!!!!
Nov 21 12:49:44 e-smith kernel: hdb: timeout waiting for DMA <!!!!!!!!!!!
Nov 21 12:49:44 e-smith kernel: hdb: (__ide_dma_test_irq) called while not
waiting <!!!!!!!!!!!!!!!!
Nov 21 12:49:50 e-smith kernel: hdb: status timeout: status=0xd0 { Busy }
Nov 21 12:49:50 e-smith kernel:
Nov 21 12:49:50 e-smith kernel: hda: DMA disabled
Nov 21 12:49:50 e-smith kernel: hdb: drive not ready for command
Nov 21 12:50:22 e-smith kernel: ide0: reset timed-out, status=0xd0
Nov 21 12:50:23 e-smith kernel: hdb: status error: status=0x7f { DriveReady
DeviceFault SeekComplete DataRequest CorrectedError Index Error }
Nov 21 12:50:23 e-smith kernel: hdb: status error: error=0x7f {
DriveStatusError UncorrectableError SectorIdNotFound TrackZeroNotFound
AddrMarkNotFound }, LBAsect2488995241855, highx96959, lowƒ55711,
sector7392
Nov 21 12:50:23 e-smith kernel: hdb: drive not ready for command
Nov 21 12:50:56 e-smith kernel: ide0: reset timed-out, status=0xd0
Nov 21 12:50:56 e-smith kernel: blk: queue c0378584, I/O limit 4095Mb (mask
0xffffffff)
Nov 21 12:50:57 e-smith kernel: end_request: I/O error, dev 03:41 (hdb),
sector 187392
Nov 21 12:50:57 e-smith kernel: raid1: Disk failure on hdb1, disabling
device.
Nov 21 12:50:57 e-smith kernel: ^IOperation continuing on 1 devices
Nov 21 12:50:58 e-smith kernel: md: updating md0 RAID superblock on device
Nov 21 12:50:58 e-smith kernel: md: (skipping faulty hdb1 )
Nov 21 12:50:58 e-smith kernel: md: hdd1 [events: 0000002a]<6>(write) hdd1's
sb offset: 199141632

Pourtant dma est activé . Le test hdparm -d /dev/hdb retourne ON.

Désolé si y a trop de log. Qu y a t il a faire ? ( retour sav ?)


Merci d avance.
Avatar
Sebastien
Désolé si y a trop de log. Qu y a t il a faire ? ( retour sav ?)


bon, j ai voulu testé fdisk sur le supposé défaillant :

[ root]# raidhotremove /dev/md0 /dev/hdb
/dev/md0: can not hot-remove disk: disk not in array!
[ root]# fdisk /dev/hdb

Impossible de lire /dev/hdb <<!!!

Donc là c'est SAV ! c'est pas possible. C est un disque
qui a 7 mois. Dans mon serveur, il y a un disque de 1go
(1995) qui tourne encore , et en plus dessus c est le
systeme , le swap . les deux sont maxtor.

Bon bah voila, reste plus qu a fait le colis :-(

seb.

Avatar
Claude EMERY
"Sebastien" a écrit dans le message de news:
41a08a0a$0$12646$

Désolé si y a trop de log. Qu y a t il a faire ? ( retour sav ?)


bon, j ai voulu testé fdisk sur le supposé défaillant :

[ root]# raidhotremove /dev/md0 /dev/hdb
/dev/md0: can not hot-remove disk: disk not in array!
[ root]# fdisk /dev/hdb

Impossible de lire /dev/hdb <<!!!

Donc là c'est SAV ! c'est pas possible. C est un disque
qui a 7 mois. Dans mon serveur, il y a un disque de 1go
(1995) qui tourne encore , et en plus dessus c est le
systeme , le swap . les deux sont maxtor.

Bon bah voila, reste plus qu a fait le colis :-(

seb.


Re-bonjour

Puisque la machine tourne avec un hda1 et que je suppose que hdd1 est un
disk de data (/home peut etre)
Tu peux essayer d'enlever hdb1 du raid
De casser les partitions de hdb1 puis de les recréer et voir comment réagit
hdb1
Si OK , tu peux tenter de le remettre dans le raid
Si BAD => Retour SAV

Claude


Avatar
Sebastien
"Claude EMERY"

Re-bonjour

Puisque la machine tourne avec un hda1 et que je suppose que hdd1 est un
disk de data (/home peut etre)


Exact.

1> Tu peux essayer d'enlever hdb1 du raid
2> De casser les partitions de hdb1 puis de les recréer et voir comment
réagit
hdb1


Est ce que cela correspond aux manip que j'ai effecté dans le précedent
message ?
1>[ root]# raidhotremove /dev/md0 /dev/hdb
/dev/md0: can not hot-remove disk: disk not in array!
2>[ root]# fdisk /dev/hdb
Impossible de lire /dev/hdb <<!!!


Par ce que je ne peux pas acceder avec fdisk au disque donc
impossible de toucher aux partition.

Seb.


Avatar
Sebastien
"Sebastien"

2>[ root]# fdisk /dev/hdb
Impossible de lire /dev/hdb <<!!!


Bon je rectifie. Jai ressayé fdisk apres le message precedent
et j ai eu acces a fdisk.
Donc suppression de la partition (unique), puis ecriture
de la modification. Ensuite la resynchronisation s est lancé
de suite.

A suivre ,

Seb.

Avatar
Claude EMERY
"Sebastien" a écrit dans le message de news:
41a2221b$0$4570$

"Sebastien"

2>[ root]# fdisk /dev/hdb
Impossible de lire /dev/hdb <<!!!


Bon je rectifie. Jai ressayé fdisk apres le message precedent
et j ai eu acces a fdisk.
Donc suppression de la partition (unique), puis ecriture
de la modification. Ensuite la resynchronisation s est lancé
de suite.

A suivre ,

Seb.



Bonsoir Seb


Va faire un tour l'adresse ci-dessous, et regarde le pdf ...
http://www.lea-linux.org/books/LeaBook-admin_raid.pdf

Claude


Avatar
Sebastien
Va faire un tour l'adresse ci-dessous, et regarde le pdf ...
http://www.lea-linux.org/books/LeaBook-admin_raid.pdf



Merci Claude, je connaissais cette page. C'est grace a elle
que j ai monté mon raid. Par contre, le site n est pas détaillé
pour les cas de panne.
Mais maintenant ca tourne :

[ root]# cat /proc/mdstat
Personalities : [raid1]
read_ahead 1024 sectors
md0 : active raid1 hdb1[2] hdd1[1]
199141632 blocks [2/1] [_U]
[=================>...] recovery = 89.5% (178339328/199141632)
finish5.0min speed˜87K/sec

Donc ca à l air de rouler. Merci en tout cas pour ton aide.

Seb.