Cherche expert mdadm ...

Le
Hinault
Bonjour,

Je suis un peu en crise car mon raid vient de me planter très
méchamment sur ma Debian Squeeze.

Sur un poste, j'avais mis un raid miroir entre deux disques. L'un
d'eux a décidé de m’embêter il a une dizaine de jours : il avait de=
s
secteurs abimé (ou autres) et les tests smart s'arrêtait à 90%. Je
l'ai donc sorti physiquement du raid (bien sûr en oubliant de faire
set-faulty et removed ). Je l'ai mis sur un autre poste où je l'ai
testé avec l'utilitaire du constructeur (DxDiag de Western Digital)
avant de le renvoyer. Et Là miracle l'utilitaire a trouvé un moyen de
me le réparer ! J'étais bien aise, plus d'erreur plus de bug sous
smart. Je l'ai donc remis dans mon poste et ai fait un mdadm --add
(blablabla..) pour le remettre dans le raid. Il a tourné quelques
heures en rebuild et à la fin je n'avais plus le raid comme avant : Le
premier disque est resté en active sync et le second en spare Je
crois qu'il ne manquait plus qu'a faire "mdadm --assemble" mais
sans certitude.

Pas eu le temps de vérifier, aujourd'hui, je ne sais pas ce qui est
arrivé au premier disque mais il s'est lui complètement planté :
disque HS, même plus reconnu par le bios. D'un coup sans avertissement
et sans même une alerte smart. J'avoue que je suis un peu vert là.

Bref je me dis que le second disque est quand même encore bon. Mais
non mdadm ne me le reconnait pas du tout et je ne sais pas quoi faire
:s

Quelques résultats de commandes mdadm :

# mdadm-startall
W: mdadm: using ARRAYs defined in existing mdadm.conf.
Generating udev events for MD arraysdone.

# cat /proc/mdstat
Personalities : [raid1]
unused devices: <none>

# mdadm --examine --scan
ARRAY /dev/md1 UUID=e6d41a96:ca63711a:333fb2a5:6fcb4886
   spares=1

# mdadm --assemble /dev/md0 /dev/dm-5
mdadm: No suitable drives found for /dev/md0


Et pourtant si je fais un examen du disque, il est ok mais son state
est a "spare".
# mdadm --examine /dev/dm-5
/dev/dm-5:
          Magic : a92b4efc
        Version : 0.90.00
           UUID : e6d41a96:ca63711a:333fb2a5:6fcb4886 (=
local to host loki)
  Creation Time : Thu Feb 11 22:39:46 2010
     Raid Level : raid1
  Used Dev Size : 976759360 (931.51 GiB 1000.20 GB)
     Array Size : 976759360 (931.51 GiB 1000.20 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 1

    Update Time : Sat May  7 12:04:57 2011
          State : clean
 Active Devices : 1
Working Devices : 2
 Failed Devices : 1
  Spare Devices : 1
       Checksum : d102c881 - correct
         Events : 1153340


      Number   Major   Minor   RaidDevice State
this     2     253        5      =
  2      spare   /dev/dm-5

   0     0     253        4    =
    0      active sync
   1     1       0        0   =
     1      faulty removed
   2     2     253        5    =
    2      spare   /dev/dm-5



La configuration qui marchait jusque là :

# cat /etc/mdadm/mdadm.conf
DEVICE partitions
CREATE owner=root group=disk mode=0660 auto=yes
HOMEHOST <system>
MAILADDR hinault@gmail.com
# This file was auto-generated on Wed, 31 Mar 2010 22:14:09 +0200
# by mkconf 3.0.3-2
ARRAY /dev/md0 level=raid1 num-devices=2 metadata=0.90 spares=0
UUID=e6d41a96:ca63711a:333fb2a5:6fcb4886
devices=/dev/dm-4,/dev/dm-5

L'UUID de mon disque semble bon aussi :
# blkid /dev/dm-5
/dev/dm-5: UUID="e6d41a96-ca63-711a-333f-b2a56fcb4886" TYPE="linux_raid=
_member"


Je ne sais plus quoi faire donc si quelqu'un a des pistes à me
proposer ce sera avec une grande joie !!!

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers debian-user-french-REQUEST@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmaster@lists.debian.org
Archive: http://lists.debian.org/BANLkTiksLjKG9PafmRx8VHGTj3arw37Etg@mail.gmail.com
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Le Bris Pascal
Le #23342511
Le 07/05/2011 15:43, Hinault a écrit :
Bonjour,



Bonjour
Pas trop d'idée, mais le mdadm --examine donne /dev/md1 et par la
suite le fichier de conf donne /dev/md0
Il n'y aurait une inversion ?

A+

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Hinault
Le #23342721
Le 7 mai 2011 18:51, Le Bris Pascal

Il n'y aurait une inversion ?




Ben j'y ais pensé aussi, j'ai modifié le fichier en mettant md1 mais
ca n'a rien changé. Je ne sais pas où examine va chercher le md1, j'en
ai jamais eu.

Merci de l'idée

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/BANLkTim_Yw2cHvVktQg53eZx6b7LJ7Y+
Le Bris Pascal
Le #23342781
Le 07/05/2011 19:56, Hinault a écrit :
Le 7 mai 2011 18:51, Le Bris Pascal
Il n'y aurait une inversion ?



Ben j'y ais pensé aussi, j'ai modifié le fichier en mettant md1 mais
ca n'a rien changé. Je ne sais pas où examine va chercher le md1, j'en
ai jamais eu.

Merci de l'idée



Et que 'voit' le système ?
ls -l /dev/md*

Chez moi j'ai (j'avais donné des label a mes partitions) :
:~# ls -l /dev/md*
brw-rw---- 1 root disk 9, 125 30 avril 16:33 /dev/md125
brw-rw---- 1 root disk 9, 126 30 avril 16:33 /dev/md126
brw-rw---- 1 root disk 9, 127 30 avril 16:33 /dev/md127

/dev/md:
total 0
lrwxrwxrwx 1 root root 8 30 avril 16:33 dom0 -> ../md127
lrwxrwxrwx 1 root root 8 30 avril 16:33 swap -> ../md126
lrwxrwxrwx 1 root root 8 30 avril 16:33 xen -> ../md125

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Frédéric MASSOT
Le #23343321
Le 07/05/2011 15:43, Hinault a écrit :
Bonjour,

Je suis un peu en crise car mon raid vient de me planter très
méchamment sur ma Debian Squeeze.

Sur un poste, j'avais mis un raid miroir entre deux disques. L'un
d'eux a décidé de m’embêter il a une dizaine de jours : il avait des
secteurs abimé (ou autres) et les tests smart s'arrêtait à 90%. Je
l'ai donc sorti physiquement du raid (bien sûr en oubliant de faire
set-faulty et removed ...). Je l'ai mis sur un autre poste où je l'ai
testé avec l'utilitaire du constructeur (DxDiag de Western Digital)
avant de le renvoyer. Et Là miracle l'utilitaire a trouvé un moyen de
me le réparer ! J'étais bien aise, plus d'erreur plus de bug sous
smart.[


[...]
Je ne sais plus quoi faire donc si quelqu'un a des pistes à me
proposer ce sera avec une grande joie !!!



Je n'ai pas de solution à ton problème, mais pour les erreurs de
secteurs il faut tester le disque avant de l'utiliser pour le RAID
logiciel ou après qu'il est été viré de la grappe et avant de le
ré-insérer :

while (1); do
/sbin/mkfs.ext2 -ccv /dev/ton_disque
done

Les options "-cc" demandent de faire un test en lecture / écriture sur
le disque, test destructeur qui va écrire et vérifier différents motifs.

Tu laisses tourner le formatage un à deux jours, selon la taille du
disque et la vitesse d'écriture pour réaliser plus d'une dizaine de
formatage.

Le but est que le firmware du disque note tous les secteurs défectueux.

La roadmap du développeur de mdadm prévoit enfin l'ajout d'un journal
des secteurs défectueux pour éviter qu'un disque soit éjecter de la
grappe au moindre secteur défectueux :

http://lwn.net/Articles/428206

http://neil.brown.name/blog/20110216044002

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Hinault
Le #23343801
Ah zut j'ai répondu en privé... Pardon Pascal je réitère mon mail :

Le 7 mai 2011 20:11, Le Bris Pascal
Et que 'voit' le système ?
ls -l /dev/md*




Justement rien :s

# ls -l /dev/md*
total 0

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Hinault
Le #23343811
Le 8 mai 2011 00:25, Frédéric MASSOT
Les options "-cc" demandent de faire un test en lecture / écriture sur le
disque, test destructeur qui va écrire et vérifier différents motif s.

Tu laisses tourner le formatage un à deux jours, selon la taille du dis que
et la vitesse d'écriture pour réaliser plus d'une dizaine de formatag e.

Le but est que le firmware du disque note tous les secteurs défectueux.




Merci ! La prochaine fois je le saurais :)

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/BANLkTi=
Publicité
Poster une réponse
Anonyme