disque malade et lvm en mode mirror

Le
Daniel Caillibaud
Bonjour,

J'ai probablement un disque bien malade, et je doute de la meilleure soluti=
on pour m'en sortir
sans trop de pertes.

J'ai tout en lvm sauf /boot, avec un vg sur sda pour / et /home (wheezy ave=
c grub sur sda),
tous en ext4

- sda : ssd avec /boot, plus un vg pour les lv / et /home
- sdb : sata 2TB, pv lvm, utilisé dans un vg commun avec sdc
- sdc : sata 1TB dans le vg commun avec sdb

J'ai des lv en mirror, montés dans des dossiers de /, et d'autres sans mi=
rror qui doivent donc être
sur sdb (mais je laisse lvm faire sa cuisine).

Je suppose que la meilleure solution est de démonter toutes les partition=
s concernées
(et les virer du fstab pour pouvoir rebooter), acheter un disque, l'ajouter=
dans le vg
puis retirer le pv du disque malade, mais
- ça peut achever le disque malade, et je sais pas s'il y a une solution =
moins risquée.
- vaut-il mieux lancer fsck avant de toucher au lvm

Merci pour vos avis !




Question subsidiaire, j'ai lu http://www.admin-debian.com/les-systemes-de-f=
ichiers-linux/lvm-2-logical-volume-management/
et http://debian-handbook.info/browse/stable/advanced-administration.html#s=
ect.lvm, parcouru le man
mais si vous avez un lien vers de la doc qui explique comment récupérer=
les options de création des
lv, et comment les modifier ensuite (lvs m'indique les lv en mirror, mais j=
e sais pas trop interpréter
tout ce que raconte lvmdump), ou comment optimiser / sécuriser le journal=
, je suis preneur.



Et les détails du pb :

Au boot, j'ai fsck qui me dit qu'il y a des pbs et qu'il va tenter de rép=
arer, me dit qu'il y
arrive pas et qu'il faudra le faire manuellement, puis ça reste planté =
là avec des messages qui
sentent mauvais (toutes les 5~10s un nouveau message d'erreur I/O sans avoi=
r de shell de maintenance).
Évidemment je les ai pas noté et plus sous les yeux, et ils sont pas da=
ns les logs, mais ça
ressemblait à ce que j'ai trouvé ensuite dans le syslog (pour le boot r=
éussi)

ata3.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata3.01: failed command: READ DMA EXT
ata3.01: cmd 25/00:08:b7:01:c0/00:00:12:00:00/f0 tag 0 dma 4096 in
res 51/40:00:b8:01:c0/40:00:12:00:00/f0 Emask 0x9 (media error)
ata3.01: status: { DRDY ERR }
ata3.01: error: { UNC }


Maintenant, je peux voir dans syslog

Jun 4 06:34:50 quad kernel: [ 1.821746] sd 3:0:0:0: [sdc] 1953525168 51=
2-byte logical blocks: (1.00 TB/931 GiB)
Jun 4 06:34:50 quad kernel: [ 1.821749] sd 2:0:1:0: [sdb] 3907029168 51=
2-byte logical blocks: (2.00 TB/1.81 TiB)
Jun 4 06:34:50 quad kernel: [ 1.821764] sd 2:0:0:0: [sda] 125045424 512=
-byte logical blocks: (64.0 GB/59.6 GiB)

1re surprise, il voit sdc, comme si l'avoir débranché dans le bios ne c=
hangait rien,
mais pourtant ça a permis de booter (peut-être un hasard mais c'est =
curieux)

Les erreurs arrivent ensuite

Jun 4 06:34:50 quad kernel: [ 4.401704] EXT4-fs (dm-0): re-mounted. Opt=
s: (null)
Jun 4 06:34:50 quad kernel: [ 4.433963] EXT4-fs (dm-0): re-mounted. Opt=
s: discard,barrier=1,errors=remount-ro
Jun 4 06:34:50 quad kernel: [ 4.457868] loop: module loaded
Jun 4 06:34:50 quad kernel: [ 11.246913] ata3.01: exception Emask 0x0 SA=
ct 0x0 SErr 0x0 action 0x0
Jun 4 06:34:50 quad kernel: [ 11.246989] ata3.01: failed command: READ D=
MA EXT
Jun 4 06:34:50 quad kernel: [ 11.247050] ata3.01: cmd 25/00:08:b7:01:c0/=
00:00:12:00:00/f0 tag 0 dma 4096 in
Jun 4 06:34:50 quad kernel: [ 11.247051] res 51/40:00:b8:01:c0/=
40:00:12:00:00/f0 Emask 0x9 (media error)
Jun 4 06:34:50 quad kernel: [ 11.247187] ata3.01: status: { DRDY ERR }
Jun 4 06:34:50 quad kernel: [ 11.247242] ata3.01: error: { UNC }
Jun 4 06:34:50 quad kernel: [ 11.260207] ata3.00: configured for UDMA/100
Jun 4 06:34:50 quad kernel: [ 11.268829] ata3.01: configured for UDMA/133
Jun 4 06:34:50 quad kernel: [ 11.268839] ata3: EH complete
Jun 4 06:34:50 quad kernel: [ 11.282947] ata3.01: exception Emask 0x0 SA=
ct 0x0 SErr 0x0 action 0x0
Jun 4 06:34:50 quad kernel: [ 11.283014] ata3.01: failed command: READ D=
MA EXT
Jun 4 06:34:50 quad kernel: [ 11.283080] ata3.01: cmd 25/00:08:b7:01:c0/=
00:00:12:00:00/f0 tag 0 dma 4096 in
Jun 4 06:34:50 quad kernel: [ 11.283081] res 51/40:00:b8:01:c0/=
40:00:12:00:00/f0 Emask 0x9 (media error)
Jun 4 06:34:50 quad kernel: [ 11.283312] ata3.01: status: { DRDY ERR }
Jun 4 06:34:50 quad kernel: [ 11.283398] ata3.01: error: { UNC }
Jun 4 06:34:50 quad kernel: [ 11.296200] ata3.00: configured for UDMA/100
Jun 4 06:34:50 quad kernel: [ 11.304861] ata3.01: configured for UDMA/133
Jun 4 06:34:50 quad kernel: [ 11.304868] ata3: EH complete

ça continue comme ça jusqu'à

Jun 4 06:34:50 quad kernel: [ 13.190762] ata3.01: exception Emask 0x0 SA=
ct 0x0 SErr 0x0 action 0x0
Jun 4 06:34:50 quad kernel: [ 13.190865] ata3.01: failed command: READ D=
MA EXT
Jun 4 06:34:50 quad kernel: [ 13.190957] ata3.01: cmd 25/00:08:b7:01:c0/=
00:00:12:00:00/f0 tag 0 dma 4096 in
Jun 4 06:34:50 quad kernel: [ 13.190959] res 51/40:00:b8:01:c0/=
40:00:12:00:00/f0 Emask 0x9 (media error)
Jun 4 06:34:50 quad kernel: [ 13.191221] ata3.01: status: { DRDY ERR }
Jun 4 06:34:50 quad kernel: [ 13.191307] ata3.01: error: { UNC }
Jun 4 06:34:50 quad kernel: [ 13.204201] ata3.00: configured for UDMA/100
Jun 4 06:34:50 quad kernel: [ 13.212685] ata3.01: configured for UDMA/133
Jun 4 06:34:50 quad kernel: [ 13.212695] sd 2:0:1:0: [sdb] Unhandled sen=
se code
Jun 4 06:34:50 quad kernel: [ 13.212697] sd 2:0:1:0: [sdb] Result: host=
byte=DID_OK driverbyte=DRIVER_SENSE
Jun 4 06:34:50 quad kernel: [ 13.212701] sd 2:0:1:0: [sdb] Sense Key : =
Medium Error [current] [descriptor]
Jun 4 06:34:50 quad kernel: [ 13.212705] Descriptor sense data with sens=
e descriptors (in hex):
Jun 4 06:34:50 quad kernel: [ 13.212707] 72 03 11 04 00 00 00 0c=
00 0a 80 00 00 00 00 00
Jun 4 06:34:50 quad kernel: [ 13.212716] 12 c0 01 b8
Jun 4 06:34:50 quad kernel: [ 13.212720] sd 2:0:1:0: [sdb] Add. Sense: =
Unrecovered read error - auto reallocate failed
Jun 4 06:34:50 quad kernel: [ 13.212725] sd 2:0:1:0: [sdb] CDB: Read(10)=
: 28 00 12 c0 01 b7 00 00 08 00
Jun 4 06:34:50 quad kernel: [ 13.212733] end_request: I/O error, dev sdb=
, sector 314573240
Jun 4 06:34:50 quad kernel: [ 13.212837] device-mapper: raid1: Primary m=
irror (254:1) failed while out-of-sync: Reads may fail.
Jun 4 06:34:50 quad kernel: [ 13.212976] device-mapper: raid1: Read fail=
ure on mirror device 254:1. Failing I/O.
Jun 4 06:34:50 quad kernel: [ 13.213109] device-mapper: raid1: Mirror re=
ad failed.
Jun 4 06:34:50 quad kernel: [ 13.213200] Buffer I/O error on device dm-3=
, logical block 39321599
Jun 4 06:34:50 quad kernel: [ 13.213301] ata3: EH complete
Jun 4 06:34:50 quad kernel: [ 13.213308] device-mapper: raid1: Mirror re=
ad failed.
Jun 4 06:34:50 quad kernel: [ 13.213414] Buffer I/O error on device dm-3=
, logical block 39321599
Jun 4 06:34:50 quad kernel: [ 13.213679] device-mapper: raid1: Mirror re=
ad failed.
Jun 4 06:34:50 quad kernel: [ 13.213771] Buffer I/O error on device dm-3=
, logical block 39321599
Jun 4 06:34:50 quad kernel: [ 13.213878] device-mapper: raid1: Mirror re=
ad failed.
Jun 4 06:34:50 quad kernel: [ 13.213970] Buffer I/O error on device dm-3=
, logical block 39321599
Jun 4 06:34:50 quad kernel: [ 13.214075] device-mapper: raid1: Mirror re=
ad failed.
Jun 4 06:34:50 quad kernel: [ 13.214167] Buffer I/O error on device dm-3=
, logical block 39321599
Jun 4 06:34:50 quad kernel: [ 13.214272] device-mapper: raid1: Mirror re=
ad failed.
Jun 4 06:34:50 quad kernel: [ 13.214364] Buffer I/O error on device dm-3=
, logical block 39321599
Jun 4 06:34:50 quad kernel: [ 13.214468] device-mapper: raid1: Mirror re=
ad failed.
Jun 4 06:34:50 quad kernel: [ 13.214560] Buffer I/O error on device dm-3=
, logical block 39321599
Jun 4 06:34:50 quad kernel: [ 13.214666] device-mapper: raid1: Mirror re=
ad failed.
Jun 4 06:34:50 quad kernel: [ 13.214758] Buffer I/O error on device dm-3=
, logical block 39321592
Jun 4 06:34:50 quad kernel: [ 13.214870] device-mapper: raid1: Mirror re=
ad failed.
Jun 4 06:34:50 quad kernel: [ 13.214962] Buffer I/O error on device dm-3=
, logical block 39321599
Jun 4 06:34:50 quad kernel: [ 13.215068] Buffer I/O error on device dm-3=
, logical block 39321599

En résumé ça donne
Jun 4 06:34:50 quad kernel: [ 13.212701] sd 2:0:1:0: [sdb] Sense Key : =
Medium Error [current] [descriptor]
Jun 4 06:34:50 quad kernel: [ 13.212720] sd 2:0:1:0: [sdb] Add. Sense: =
Unrecovered read error - auto reallocate failed
Jun 4 06:34:50 quad kernel: [ 13.212733] end_request: I/O error, dev sdb=
, sector 314573240
Jun 4 06:34:50 quad kernel: [ 13.213200] Buffer I/O error on device dm-3=
, logical block 39321599
[répété 7 fois]
Jun 4 06:34:50 quad kernel: [ 13.215068] Buffer I/O error on device dm-3=
, logical block 39321599
Jun 4 06:34:50 quad kernel: [ 61.572741] EXT4-fs (sda1): mounted filesys=
tem with ordered data mode. Opts: errors=remount-ro
Jun 4 06:34:50 quad kernel: [ 61.640486] JBD2: IO error reading journal =
superblock
Jun 4 06:34:50 quad kernel: [ 61.640578] EXT4-fs (dm-3): error loading j=
ournal
Jun 4 06:34:50 quad kernel: [ 69.579744] EXT4-fs (dm-8): warning: mounti=
ng fs with errors, running e2fsck is recommended

Jun 4 06:39:37 quad kernel: [ 369.632009] EXT4-fs (dm-8): error count: 5
Jun 4 06:39:37 quad kernel: [ 369.632013] EXT4-fs (dm-8): initial error a=
t 1401703303: __ext4_get_inode_loc:3678: inode 68207603: block 272632927
Jun 4 06:39:37 quad kernel: [ 369.632018] EXT4-fs (dm-8): last error at 1=
401797435: __ext4_get_inode_loc:3678: inode 76686780: block 306709115

dm-3 est un lv en mirror, dm-8 sur sdb

--
Daniel

Il y a trois temps qui déplaisent souverainement aux jardiniers :
le temps sec, le temps pluvieux et le temps en général.
Pierre Daninos

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers debian-user-french-REQUEST@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmaster@lists.debian.org
Archive: https://lists.debian.org/20140604084947.50a4de3f@quad.lairdutemps.org
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Fabrice Regnier
Le #26176222
'lut,

J'ai probablement un disque bien malade, et je doute de la meilleure solution pour m'en sortir
sans trop de pertes.


Sans vraiment répondre à la question: pourquoi ne pars-tu pas de ta
sauvegarde ?

a+

f.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: https://lists.debian.org/538ecbf7$0$2118$
Daniel Caillibaud
Le #26176232
Le 04/06/14 à 09:34, Fabrice Regnier
FR> 'lut,
FR>
FR> > J'ai probablement un disque bien malade, et je doute de la meilleure solution pour m'en
FR> > sortir sans trop de pertes.

FR> Sans vraiment répondre à la question: pourquoi ne pars-tu pas de ta
FR> sauvegarde ?

C'est un disque utilisé par la sauvegarde ;-)

C'est pas un drame de le perdre, les trucs importants sont aussi ailleurs e t le mirroring
devrait limiter la casse, mais ça change rien au pb de refaire un lvm cle an (la meilleure
manière de remplacer le disque dans le vg).

--
Daniel

Il n'est pas de vent favorable pour celui qui ne sait où il va.
Sénèque

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: https://lists.debian.org/
Daniel Caillibaud
Le #26187012
Le 04/06/14 à 08:49, Daniel Caillibaud DC> Bonjour,
DC>
DC> J'ai probablement un disque bien malade, et je doute de la meilleure so lution pour m'en
DC> sortir sans trop de pertes.

[...]

DC> J'ai des lv en mirror, montés dans des dossiers de /, et d'autres san s mirror qui doivent
DC> donc être sur sdb (mais je laisse lvm faire sa cuisine).
DC>
DC> Je suppose que la meilleure solution est de démonter toutes les parti tions concernées
DC> (et les virer du fstab pour pouvoir rebooter), acheter un disque, l'ajo uter dans le vg
DC> puis retirer le pv du disque malade, mais
DC> - ça peut achever le disque malade, et je sais pas s'il y a une solut ion moins risquée.
DC> - vaut-il mieux lancer fsck avant de toucher au lvm

Pour info si qqun tombe là dessus...

S'il n'y a que des lv miroir, le plus simple est de virer proprement le pv du disque malade,
ajouter le pv du nouveau disque, et attendre que lvm reconstruise son miroi r tout seul (tout
reste utilisable pendant ce temps là).

Dans mon cas, je voulais aussi récupérer des datas sans miroir sur le p v malade et j'ai donc
tenté
- ajouter le nouveau disque au vg
- pvmove du pv du disque malade vers le nouveau pv
mais ça n'a pas marché et probablement achevé le disque.

Le pb est que je me suis retrouvé avec un vg tout cassé (il cherchait d es uuid qui n'existaient
plus tellement le disque était HS), et impossible à modifier (probablem ent parce que
j'ai pas su lui virer ce qu'il trouvait pas).
J'ai donc reinitialisé le disque neuf dans un nouveau vg et récupér é mes datas des lv en miroir
par recopie bête et méchante.

J'aurais aussi pu essayer de monter les volumes abimés à la place du pv move et tenter de
récupérer des trucs dedans, mais quand j'ai testé ça c'était trop tard (ça montait mais
ensuite rien de lisible dedans).

Mais finalement je me sens plus léger avec cette purge de qq centaines de Go : c'était tout ce
que j'avais enregistré sur la freebox et pas eu le temps de regarder depu is 2 ans (trop gros et
pas assez important pour être mirroré), donc ça devait pas être si important !

--
Daniel

Si ceux qui disent du mal de moi, savaient exactement ce que je
pense d'eux, il en diraient bien d'avantage.
Sacha Guitry

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: https://lists.debian.org/
Publicité
Poster une réponse
Anonyme