OVH Cloud OVH Cloud

erreurs sur un systeme de fichiers XFS

11 réponses
Avatar
Eric Belhomme
Bonjour,

Soit un serveur sous Debian Lenny avec une carte 3ware 9650-16SE et 12
disques en RAID6 avec des stripes de 256k.

le volume RAID6 contient en autre un gros volume LVM de 5T, formaté en
XFS.
Ce volume me fait des misères depuis vendredi dernier, avec ceci dans les
logs :

[18280.085219] xfs_imap_to_bp: xfs_trans_read_buf()returned an error 5 on
dm-2. Returning error.
[18280.085219] xfs_imap_to_bp: xfs_trans_read_buf()returned an error 5 on
dm-2. Returning error.
[18280.085254] xfs_imap_to_bp: xfs_trans_read_buf()returned an error 5 on
dm-2. Returning error.
[18280.085254] xfs_imap_to_bp: xfs_trans_read_buf()returned an error 5 on
dm-2. Returning error.

Je démonte alors tous lees volumes formatés en XFS, je décharge le module
xfs, j'ai ça dans les logs :

[18796.865785] BUG: soft lockup - CPU#2 stuck for 481s! [swapper:0]
[18796.865785] Modules linked in: xfs nfsd auth_rpcgss exportfs nfs lockd
nfs_acl sunrpc ipv6 bonding loop usbhid pl2303 usbserial i2c_i801 snd_pcm
snd_timer snd soundcore pcspkr hid i2c_core snd_page_alloc ff_memless
button evdev ext3 jbd mbcache dm_mirror dm_log dm_snapshot dm_mod sd_mod
ehci_hcd uhci_hcd 3w_9xxx scsi_mod igb thermal processor fan thermal_sys
[last unloaded: xfs]
[18796.868415] CPU 2:
[18796.868415] Modules linked in: xfs nfsd auth_rpcgss exportfs nfs lockd
nfs_acl sunrpc ipv6 bonding loop usbhid pl2303 usbserial i2c_i801 snd_pcm
snd_timer snd soundcore pcspkr hid i2c_core snd_page_alloc ff_memless
button evdev ext3 jbd mbcache dm_mirror dm_log dm_snapshot dm_mod sd_mod
ehci_hcd uhci_hcd 3w_9xxx scsi_mod igb thermal processor fan thermal_sys
[last unloaded: xfs]

Avec un call trace du crash du module...

Je recharge le module XFS, et remonte le volume qui fait péter xfs
(toujours le même). Il monte des fois sans problème (avec récupération du
log) et fois, je suis obligé de faire un cfs_repair -L

Je redémonte le volume, je (re)lance un xfs_repair sur mon volume foireux,
et ça repart pour un moment... puis rebelotte ! xfs repart en vrille !

Je ne sais plus quoi faire pour réparer définitivement ce FS, étant
entendu qu'il m'est impossible de backuper les 5TB de données stockées
sur ce volume, et que bien entendu ces données sont critiques...

quelques détails :
- Debian Lenny amd64, avec un noyau standard (2.6.26)
- 3dm et 3ware CLI 10.2, dernier firmware à jour

Voila, des idées ?

--
Rico

1 réponse

1 2
Avatar
Eric Belhomme
Le Tue, 28 Jun 2011 10:24:36 +0000, Emmanuel Florac a écrit :

C'est normal, utilise plutôt xfs_repair -n /dev/xxx/yyy Tu es en 32 bits
je suppose?



non, amd64, G de RAM, et 8 cores Xeon L5506 (cores Nehalem)
Le xfr_repair fonctionne bien lui, heureusement !

--
Rico
La hiérarchie est une échelle qui permet de lâcher ses ordures sur
ceux d'en dessous.
1 2