OVH Cloud OVH Cloud

XServe RAID: volume ne monte plus

15 réponses
Avatar
J.P. Poindessault
Bonsoir,

J'ai un pb avec un volume RAID qui ne monte plus.
Je n'ai pas de sauvegarde derrière et ce volume contenait environ 200 Go
d'images de microscopie confocale ou de données d'expériences difficiles
à refaire.
Panique à bord, même si les utilisateurs savaient que ce serveur n'avait
pour vocation que d'avoir une copie de leurs fichiers ailleurs et
d'échanger entre eux.

Vos suggestions de test et de réparation sont les bienvenues pour
m'aider à récupérer ce volume.

Merci

Jean-Pierre
---------------------

Config:
- XServe sous OS X server 10.3.9
- XServe RAID
5 disques en baie de gauche, en RAID 5 = PBSRaid0, monte OK
RAID Admin > capacité 517,66 GB
4 disques en baie de droite, en RAID 5 = ne monte plus (était
PBSRaid1).
RAID Admin > capacité 467.52 GB

Les deux volumes sont en HFS+ journalisé.

J'ai eu le panic log suivant:
===========
Thu Jan 18 17:28:58 2007
panic(cpu 0): HFS: corrupt VH on PBSRaid1, sig 0x4100, ver 0, blksize 0
................
Kernel version:
Darwin Kernel Version 7.9.0:
Wed Mar 30 20:11:17 PST 2005; root:xnu/xnu-517.12.7.obj~1/RELEASE_PPC
===========

Le lendemain, 19/01, tous les indicateurs RAID Admin sont OK: pas de pb
hardware

Dans les "events log" du XServe RAID, je n'ai trouvé que ce qui suit
d'anormal mais daté du 09/01/2007 et sans réapparition après:
=========
Lower Controller 01/09/07 19:16:55 RAID Controller 2 Communication
Failure
==========
le contrôleur 2 est celui qui contrôle la baie où se trouve le volume
qui ne monte pas.

infos par DiskUtil 10.4:
==========
Verifying volume ³disk2s3²
Checking HFS Plus volume.
Checking Extents Overflow file.
Checking Catalog file.
Invalid extent entry
The volume PBSRaid1 needs to be repaired.

Volume check failed.
==========
La réparation est alors impossible avec DiskUtil

infos par pdisk:
==========
pbsxserve:~ admin$ sudo pdisk /dev/disk3 -dump
/dev/disk3 map block size=512
#: type name length base (
size )
1: Apple_partition_map Apple 63 @ 1
2: Apple_Free 0+@ 64
3: Apple_HFS Apple_HFS_Untitled_2 980189104 @ 262208
(467.4G)
4: Apple_Free 0+@ 980451312

Device block size=512, Number of Blocks=980451328
DeviceType=0x0, DeviceId=0x0
==========
Je ne comprends pas bien l'existence de la partition 2 de longueur 0
alors que la base de la suivante est à 262208.

Sur le RAID qui va bien, j'ai:
==========
pbsxserve:~ admin$ sudo pdisk /dev/disk5 -dump
Password:
/dev/disk5 map block size=512
#: type name length base (
size )
1: Apple_partition_map Apple 63 @ 1
2: Apple_HFS PBSRaid0 1085620152 @ 64
(517.7G)
3: Apple_Free 0+@ 1085620216

Device block size=512, Number of Blocks=1085620224
DeviceType=0x0, DeviceId=0x0
==========

5 réponses

1 2
Avatar
Nicolas.MICHEL
jean-pierre poindessault
wrote:

vos suggestions sont les bienvenues.


Suivant la valeur des données, soit tenter de remonter le raid (risqué),
ou plutôt t'adresser au service pro de Apple, ou encore envoyer tes
disques chez un spécialiste.

Si ça avait été du raid1, tu aurais pû tenter un utilitaire quelconque
sur un des disque, mais en raid5, ça me semble iréaliste si le raid ne
déponds pas. Bon, je ne suis pas spécialiste note.

Ceci dit, ça montre que plus on monte une machine complexe, plus il faut
faire des choix clairs : Pas de backup = assumer le risque du crash.
--
Nicolas

Avatar
J.P. Poindessault
In article <1hsq6mg.1m61eid8uwt1jN%,
(Laurent Pertois) wrote:

J.P. Poindessault wrote:

Vos suggestions de test et de réparation sont les bienvenues pour
m'aider à récupérer ce volume.


Est-ce que tout va bien sur la connectique :

- contrôleur
- carte Fibre Channel
- câbles Fibre Channel

Ce sont les choses à regarder également.


-------------
DiskUtil voit le disque et désigne le volume qui ne montae pas par un label
genre "disk03s5".
RAID ADmin donne tous les voyants au vert, arrays, disques, contôelurs, ethernet.
Je suppose donc que tout est OK côté hard.

Jean-Pierre


Avatar
J.P. Poindessault
In article ,
patpro ~ Patrick Proniewski wrote:

In article
,
"J.P. Poindessault" wrote:

Vos suggestions de test et de réparation sont les bienvenues pour
m'aider à récupérer ce volume.


qu'en est-il des status de chaque disque physique ? (en gros un RAID 5
meurt à partir de 2 disques physiques perdus)


patpro
-----------

Chaque disque est OK (indiqué par RAID Admin)

Jean-Pierre


Avatar
J.P. Poindessault
In article

s.com>,
jean-pierre poindessault wrote:

In article ,
patpro ~ Patrick Proniewski wrote:

In article
,
"J.P. Poindessault" wrote:

Vos suggestions de test et de réparation sont les bienvenues pour
m'aider à récupérer ce volume.


qu'en est-il des status de chaque disque physique ? (en gros un RAID 5
meurt à partir de 2 disques physiques perdus)


patpro


Aucun pb hardware relevé dans le log du XServe RAID via RAID Admin, en
dehors du défaut de communication du contrôleur 2 du 9/01

Jean-Pierre


-------------------
Last news, better news !

Le "Guerrier du disque" (DW 4.0) m'a construit et monté sur le bureau un
dossier preview du RAID qui ne montait plus avec, apparement, tous les fichiers
dûment localisés dans leurs dossiers d'origine avec seulement 3 fichiers dans un
dossier "Rescued".

Juste après qu'il ait récupéré cela, le disque 9 (2éme de la baie en défaut) est
tombé en panne franche alors que les logs RAID Admin indiquent une série de
défauts du contrôleur 2 juste avant.
Ayant déjà perdu un disque il y a quelques mois mais sans ces indications de
défaut de contrôleur, j'ai bien le sentiment d'être en face d'une double panne:
- disque 9, ça c'est sûr
- contrôleur 2 (lower controller) ectopique

DW est assez surprenant car dès que j'ai vu monter son dossier de preview (avec
le nom exact du volume, PBSRaid1, qui n'apparaissait plus dans DiskUtil ou
FSCK_HFS), j'ai commencé à faire des copies de sauvegarde des fichiers
"récupérés" par DW dans ce dossier.
Ce n'est qu'après, surpris par la lenteur des copies, que je me suis aperçu de
la panne du disque 9 et de la recontruction en cours du RAID !

J'ai arrêté mes copies et laisse le RAID se reconstruire pendant que je vais
prendre un apéro bien mérité !

Salut

Jean-Pierre



Avatar
J.P. Poindessault
Problème règlé grâce à DiskWarrior.
Sur quelques milliers de fichiers, seuls 3 se sont retrouvés dans un dossier
"Rescued files".
Les droits ont été conservés, les liens symboliques sur les partages ont été
conservés.

Jean-Pierre
1 2