Souci avec Raid 10

Le
jerome moliere
Bonjour à tous,
je viens de réussir à redémarrer un serveur de VM Xen qui av=
ait des
soucis de chauffe et en rebootant je m'aperçois que le Raid 10 reporte
des soucis sur un disque
vmserver:~# cat /proc/mdstat
Personalities : [raid10]
md0 : active (auto-read-only) raid10 sda1[1] sde1[5] sdc1[4] sdd1[3] sdb1[2=
]
2930279808 blocks 64K chunks 2 near-copies [6/5] [_UUUUU]


Il semblerait que seuls 5 des 6 disques soient reconnus actifs dans
mon RAID non?

Ce que me confirme un message présent au boot
Dec 11 12:00:13 vmserver kernel: [ 31.720079] md: raid10 personality
registered for level 10
Dec 11 12:00:13 vmserver kernel: [ 31.738196] md: md0 stopped.
Dec 11 12:00:13 vmserver kernel: [ 31.739641] md: bind<sdb1>
Dec 11 12:00:13 vmserver kernel: [ 31.739761] md: bind<sdd1>
Dec 11 12:00:13 vmserver kernel: [ 31.739875] md: bind<sdc1>
Dec 11 12:00:13 vmserver kernel: [ 31.740002] md: bind<sde1>
Dec 11 12:00:13 vmserver kernel: [ 31.740109] md: bind<sda1>
Dec 11 12:00:13 vmserver kernel: [ 31.742161] raid10: raid set md0
active with 5 out of 6 devices
Dec 11 12:00:13 vmserver kernel: [ 31.742186] md0: detected capacity
change from 0 to 3000606523392
Dec 11 12:00:13 vmserver kernel: [ 31.743066] md0: unknown partition tab=
le
Dec 11 12:00:13 vmserver kernel: [ 31.748911] device-mapper: uevent:
version 1.0.3
Dec 11 12:00:13 vmserver kernel: [ 31.749148] device-mapper: ioctl:
4.15.0-ioctl (2009-04-01) initialised: dm-devel@redhat.com

Cela induit il forcément un souci matériel ou cela peut il ê=
tre dû à
une config de LVM ou autre ?
Puis je tenter de le faire rentrer au bercail d'une manière soft ou
dois je le remplacer ?


J'ai regardé avec smartctl mais il semble qu'un disque n'apparaisse pa=
s
vmserver:~# smartctl --scan
/dev/sda -d scsi [SCSI]
/dev/sdb -d scsi [SCSI]
/dev/sdc -d scsi [SCSI]
/dev/sdd -d scsi [SCSI]
/dev/sde -d scsi [SCSI]
/dev/sdf -d scsi [SCSI]

Là je dois dire que vos précieux conseils me dépanneraient =
..Je vais
laisser la machine telle quelle en attendant d'y voir plus clair et
d'intervenir dessus.

J'ai essayé de monter la data sur les volumes et elle semble être=
là


Jerome
J.MOLIERE - Mentor/J
auteur Eyrolles
blog: http://romjethoughts.blogspot.com

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers debian-user-french-REQUEST@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmaster@lists.debian.org
Archive: http://lists.debian.org/CAEGYFEJgWd7noKXHKYP-ZrA44C-qzksNEjXstfcG=bLdvSoJ2g@mail.gmail.com
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses Page 1 / 2
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Bernard Schoenacker
Le #24056981
Le Sun, 11 Dec 2011 12:47:43 +0100,
jerome moliere
Bonjour à tous,
je viens de réussir à redémarrer un serveur de VM Xen qui avait des
soucis de chauffe et en rebootant je m'aperçois que le Raid 10 reporte
des soucis sur un disque ...
vmserver:~# cat /proc/mdstat
Personalities : [raid10]
md0 : active (auto-read-only) raid10 sda1[1] sde1[5] sdc1[4] sdd1[3]
sdb1[2] 2930279808 blocks 64K chunks 2 near-copies [6/5] [_UUUUU]


Il semblerait que seuls 5 des 6 disques soient reconnus actifs dans
mon RAID non?

Ce que me confirme un message présent au boot...
Dec 11 12:00:13 vmserver kernel: [ 31.720079] md: raid10 personality
registered for level 10
Dec 11 12:00:13 vmserver kernel: [ 31.738196] md: md0 stopped.
Dec 11 12:00:13 vmserver kernel: [ 31.739641] md: bind<sdb1>
Dec 11 12:00:13 vmserver kernel: [ 31.739761] md: bind<sdd1>
Dec 11 12:00:13 vmserver kernel: [ 31.739875] md: bind<sdc1>
Dec 11 12:00:13 vmserver kernel: [ 31.740002] md: bind<sde1>
Dec 11 12:00:13 vmserver kernel: [ 31.740109] md: bind<sda1>
Dec 11 12:00:13 vmserver kernel: [ 31.742161] raid10: raid set md0
active with 5 out of 6 devices
Dec 11 12:00:13 vmserver kernel: [ 31.742186] md0: detected capacity
change from 0 to 3000606523392
Dec 11 12:00:13 vmserver kernel: [ 31.743066] md0: unknown
partition table Dec 11 12:00:13 vmserver kernel: [ 31.748911]
device-mapper: uevent: version 1.0.3
Dec 11 12:00:13 vmserver kernel: [ 31.749148] device-mapper: ioctl:
4.15.0-ioctl (2009-04-01) initialised:

Cela induit il forcément un souci matériel ou cela peut il être dû à
une config de LVM ou autre ?
Puis je tenter de le faire rentrer au bercail d'une manière soft ou
dois je le remplacer ?


J'ai regardé avec smartctl mais il semble qu'un disque n'apparaisse
pas ... vmserver:~# smartctl --scan
/dev/sda -d scsi [SCSI]
/dev/sdb -d scsi [SCSI]
/dev/sdc -d scsi [SCSI]
/dev/sdd -d scsi [SCSI]
/dev/sde -d scsi [SCSI]
/dev/sdf -d scsi [SCSI]

Là je dois dire que vos précieux conseils me dépanneraient ..Je vais
laisser la machine telle quelle en attendant d'y voir plus clair et
d'intervenir dessus....

J'ai essayé de monter la data sur les volumes et elle semble être
là...


Jerome
J.MOLIERE - Mentor/J
auteur Eyrolles
blog: http://romjethoughts.blogspot.com





bonjour,


serait il possible de connaitre les gheures de marche des
disques durs ?


à titre d'info :

un roulement à bille est donné pour 50 000 heures


donc si tu atteind cette zone et que la surchauffe est
régulière, essayes de trouver la solution themique à ton
problème et ensuite résoudre la suite qui en découle ...

en tout cas, il serait sage de prévoir un remplacement
de la grappe ....


slt
bernard

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Jean-Yves F. Barbier
Le #24057071
On Sun, 11 Dec 2011 12:47:43 +0100
jerome moliere
vmserver:~# cat /proc/mdstat
Personalities : [raid10]
md0 : active (auto-read-only) raid10 sda1[1] sde1[5] sdc1[4] sdd1[3] sdb1 [2]
2930279808 blocks 64K chunks 2 near-copies [6/5] [_UUUUU]
Il semblerait que seuls 5 des 6 disques soient reconnus actifs dans
mon RAID non?



Vi

Dec 11 12:00:13 vmserver kernel: [ 31.742186] md0: detected capacity
change from 0 to 3000606523392
Dec 11 12:00:13 vmserver kernel: [ 31.743066] md0: unknown partition t able



Apparemment il ne reconnaît pas la table des partitions.

Ca peut être dû à +sieurs cas de figure, tels que HD ayant u n PB,
arrêt sauvage, micro-coupure pendant une opération d'écritur e, etc.


Cela induit il forcément un souci matériel ou cela peut il à ªtre dû à
une config de LVM ou autre ?



Mon expérience de mixer les 2 date, mais c'est un mélange que je ne
referai jamais sans au minimum plusieurs jours de stress-test (perte
complète des données).

Puis je tenter de le faire rentrer au bercail d'une manière soft ou
dois je le remplacer ?



Avant d'envisager les grands moyens, essaye déjà de le re-param étrer
correctement et de le réinsérer - après tu verras bien s'il est
victime d'un kick-out ou non (et pour quell(s) raison(s)).

J'ai regardé avec smartctl mais il semble qu'un disque n'apparaisse pas ...
vmserver:~# smartctl --scan
/dev/sda -d scsi [SCSI]
/dev/sdb -d scsi [SCSI]
/dev/sdc -d scsi [SCSI]
/dev/sdd -d scsi [SCSI]
/dev/sde -d scsi [SCSI]
/dev/sdf -d scsi [SCSI]



Bensikilélà: /dev/sdf (à moins que ça ne soit le HD sys tem).

Là je dois dire que vos précieux conseils me dépanneraien t ..Je vais
laisser la machine telle quelle en attendant d'y voir plus clair et
d'intervenir dessus....



* Arrêter le svr et contrôler toutes les liaisons filaires, ainsi
que les câbles (enfoncement et clipage correct, frottements,
pliures > 60°, coupures, ...)

* Le redémarrer, puis vérifier que tous les HDz sont bien là et
reconnus,

si non: il est kaput => chgt

si vi: tu le re-paramètres et tu le réinsères dans l'array, puis tu
stresses le tout pour voir s'il tient le coup, et en final
tu crées suffisamment de fichiers à coup de dd pour rempl ir
l'array, histoire de voir si une zone HS est responsable du
kick-out.

J'ai essayé de monter la data sur les volumes et elle semble êt re là...



? jèpabiencomprendukesketadi; si tu veux dire que l'array fautif se
monte, c'est normal puisqu'il est tjrs à 1/2 opérationnel.

Et pour la technique, ça fait déjà un certain nombre d'ann ées que les
roulements standards ont été remplacé par des paliers roto-f luides
pour des raisons de fiabilité évidentes aux vitesses de rotation des
plateaux actuelles.

--
Graduate students and most professors are no smarter than undergrads.
They're just older.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Frederic MASSOT
Le #24057651
Le 11/12/2011 14:05, Jean-Yves F. Barbier a écrit :
On Sun, 11 Dec 2011 12:47:43 +0100
jerome moliere
vmserver:~# cat /proc/mdstat
Personalities : [raid10]
md0 : active (auto-read-only) raid10 sda1[1] sde1[5] sdc1[4] sdd1[3] sdb1[2]
2930279808 blocks 64K chunks 2 near-copies [6/5] [_UUUUU]
Il semblerait que seuls 5 des 6 disques soient reconnus actifs dans
mon RAID non?



Vi

Dec 11 12:00:13 vmserver kernel: [ 31.742186] md0: detected capacity
change from 0 to 3000606523392
Dec 11 12:00:13 vmserver kernel: [ 31.743066] md0: unknown partition table



Apparemment il ne reconnaît pas la table des partitions.



Ce message est normal, si md0 est directement utilisé comme volume
physique sans être partitionné. Je l'ai sur tous les serveurs qui
utilisent md et lvm. Ce message est apparu avec le noyau 2.6.28 qui
permettait de partitionner tous les périphériques de type bloc.


--
============================================= | FRÉDÉRIC MASSOT |
| http://www.juliana-multimedia.com |
| mailto: |
==========================Þbian=GNU/Linux==
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Jean-Yves F. Barbier
Le #24057741
On Sun, 11 Dec 2011 16:33:43 +0100
Frederic MASSOT
> Apparemment il ne reconnaît pas la table des partitions.

Ce message est normal, si md0 est directement utilisé comme volume
physique sans être partitionné. Je l'ai sur tous les serveurs q ui
utilisent md et lvm. Ce message est apparu avec le noyau 2.6.28 qui
permettait de partitionner tous les périphériques de type bloc.



Ca n'est pas un risque que je prendrais, ne serais-ce que pour être
capable de relire le HS SANS RAID...

--
Living in Hollywood is like living in a bowl of granola. What ain't
fruits and nuts is flakes.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Frederic MASSOT
Le #24057731
Le 11/12/2011 12:47, jerome moliere a écrit :
Bonjour à tous,
je viens de réussir à redémarrer un serveur de VM Xen qui avait des
soucis de chauffe et en rebootant je m'aperçois que le Raid 10 reporte
des soucis sur un disque ...
vmserver:~# cat /proc/mdstat
Personalities : [raid10]
md0 : active (auto-read-only) raid10 sda1[1] sde1[5] sdc1[4] sdd1[3] sdb1[2]
2930279808 blocks 64K chunks 2 near-copies [6/5] [_UUUUU]


Il semblerait que seuls 5 des 6 disques soient reconnus actifs dans
mon RAID non?



Oui, il manque un disque, d'après l'état "[_UUUUU]" il s'agirait du
premier disque. Regarde bien les logs dans "/var/log/dmesg", pour être
sur du disque.


Ce que me confirme un message présent au boot...
Dec 11 12:00:13 vmserver kernel: [ 31.720079] md: raid10 personality
registered for level 10
Dec 11 12:00:13 vmserver kernel: [ 31.738196] md: md0 stopped.
Dec 11 12:00:13 vmserver kernel: [ 31.739641] md: bind<sdb1>
Dec 11 12:00:13 vmserver kernel: [ 31.739761] md: bind<sdd1>
Dec 11 12:00:13 vmserver kernel: [ 31.739875] md: bind<sdc1>
Dec 11 12:00:13 vmserver kernel: [ 31.740002] md: bind<sde1>
Dec 11 12:00:13 vmserver kernel: [ 31.740109] md: bind<sda1>
Dec 11 12:00:13 vmserver kernel: [ 31.742161] raid10: raid set md0
active with 5 out of 6 devices
Dec 11 12:00:13 vmserver kernel: [ 31.742186] md0: detected capacity
change from 0 to 3000606523392
Dec 11 12:00:13 vmserver kernel: [ 31.743066] md0: unknown partition table
Dec 11 12:00:13 vmserver kernel: [ 31.748911] device-mapper: uevent:
version 1.0.3
Dec 11 12:00:13 vmserver kernel: [ 31.749148] device-mapper: ioctl:
4.15.0-ioctl (2009-04-01) initialised:

Cela induit il forcément un souci matériel ou cela peut il être dû à
une config de LVM ou autre ?



C'est un problème matériel, le disque n'est pas détecté, prévoit un
disque de rechange.

Puis je tenter de le faire rentrer au bercail d'une manière soft ou
dois je le remplacer ?



S'il n'est pas détecté après un reboot, tu peux essayer d'arrêter la
machine, puis de la démarrer pour que les disques soient arrêtés et
démarrés. Si le disque n'est toujours pas détecté il faut le changer.


--
============================================= | FRÉDÉRIC MASSOT |
| http://www.juliana-multimedia.com |
| mailto: |
==========================Þbian=GNU/Linux==
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Frederic MASSOT
Le #24057931
Le 11/12/2011 16:45, Jean-Yves F. Barbier a écrit :
On Sun, 11 Dec 2011 16:33:43 +0100
Frederic MASSOT
Apparemment il ne reconnaît pas la table des partitions.



Ce message est normal, si md0 est directement utilisé comme volume
physique sans être partitionné. Je l'ai sur tous les serveurs qui
utilisent md et lvm. Ce message est apparu avec le noyau 2.6.28 qui
permettait de partitionner tous les périphériques de type bloc.



Ca n'est pas un risque que je prendrais, ne serais-ce que pour être
capable de relire le HS SANS RAID...



Les disques ont été partitionnés, d'après ses logs on voit sda1, sdb1,
etc. Les partitions sda1, sdb1, etc ont ensuite été assemblées en RAID10
et la grappe est disponible par le périphérique bloc md0. C'est md0 qui
n'a pas été partionnné et directement utilisé comme volume physique, pas
les disques. Il peut donc essayer de relire le HS sans RAID.


--
============================================= | FRÉDÉRIC MASSOT |
| http://www.juliana-multimedia.com |
| mailto: |
==========================Þbian=GNU/Linux==
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Jean-Yves F. Barbier
Le #24058011
On Sun, 11 Dec 2011 17:23:20 +0100
Frederic MASSOT

Les disques ont été partitionnés, d'après ses logs on voit sda1, sdb1,
etc. Les partitions sda1, sdb1, etc ont ensuite été assemblà ©es en RAID10
et la grappe est disponible par le périphérique bloc md0. C'est md0 qui
n'a pas été partionnné et directement utilisé comme v olume physique, pas
les disques.



Vi, mais même là j'suis pas trop pour.
Perso, je n'utiliserai LVM qu'en tout dernier recours, suite à une
erreur d'appréciation de taille au départ par ex.

Il peut donc essayer de relire le HS sans RAID.



Ca serait d'ailleurs bien qu'il nous dise où il est est...

JERÔME, BOSSE UN PEU!

--
As in certain cults it is possible to kill a process if you know its
true name. -- Ken Thompson and Dennis M. Ritchie

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Goldy
Le #24058131
Bonjour,

Le 11/12/2011 12:47, jerome moliere a écrit :
Bonjour à tous,
je viens de réussir à redémarrer un serveur de VM Xen qui avait des
soucis de chauffe et en rebootant je m'aperçois que le Raid 10 reporte
des soucis sur un disque ...
vmserver:~# cat /proc/mdstat
Personalities : [raid10]
md0 : active (auto-read-only) raid10 sda1[1] sde1[5] sdc1[4] sdd1[3] sdb1[2]
2930279808 blocks 64K chunks 2 near-copies [6/5] [_UUUUU]


Il semblerait que seuls 5 des 6 disques soient reconnus actifs dans
mon RAID non?



Efectivement. Il en manque un.


Ce que me confirme un message présent au boot...
Dec 11 12:00:13 vmserver kernel: [ 31.720079] md: raid10 personality
registered for level 10
Dec 11 12:00:13 vmserver kernel: [ 31.738196] md: md0 stopped.
Dec 11 12:00:13 vmserver kernel: [ 31.739641] md: bind<sdb1>
Dec 11 12:00:13 vmserver kernel: [ 31.739761] md: bind<sdd1>
Dec 11 12:00:13 vmserver kernel: [ 31.739875] md: bind<sdc1>
Dec 11 12:00:13 vmserver kernel: [ 31.740002] md: bind<sde1>
Dec 11 12:00:13 vmserver kernel: [ 31.740109] md: bind<sda1>
Dec 11 12:00:13 vmserver kernel: [ 31.742161] raid10: raid set md0
active with 5 out of 6 devices
Dec 11 12:00:13 vmserver kernel: [ 31.742186] md0: detected capacity
change from 0 to 3000606523392
Dec 11 12:00:13 vmserver kernel: [ 31.743066] md0: unknown partition table
Dec 11 12:00:13 vmserver kernel: [ 31.748911] device-mapper: uevent:
version 1.0.3
Dec 11 12:00:13 vmserver kernel: [ 31.749148] device-mapper: ioctl:
4.15.0-ioctl (2009-04-01) initialised:

Cela induit il forcément un souci matériel ou cela peut il être dû à
une config de LVM ou autre ?
Puis je tenter de le faire rentrer au bercail d'une manière soft ou
dois je le remplacer ?



Si le disque apparait toujours dans le système, il est possible de le
réintégrer dans la grappe raid, pour voir s'il n'en a pas été éjecté par
accident (ça m'est déjà arrivé). S'il n'apparait plus, il est sans doute
tombé en panne (ce qui n'est pas terrible en ce moment vu le prix des
disques durs....)



J'ai regardé avec smartctl mais il semble qu'un disque n'apparaisse pas ...
vmserver:~# smartctl --scan
/dev/sda -d scsi [SCSI]
/dev/sdb -d scsi [SCSI]
/dev/sdc -d scsi [SCSI]
/dev/sdd -d scsi [SCSI]
/dev/sde -d scsi [SCSI]
/dev/sdf -d scsi [SCSI]




Que contient sdf ? Il est censé faire partie de la grappe raid ? Si
c'est le cas, alors il est toujours là, tu peux essayer de le réintégrer
dans la grappe manuellement après avoir regardé l'état smart, c'est
toujours utile. Si le disque manquant n'est pas là, soit c'est un soucis
de câblage (ça m'est déjà arrivé qu'un câble sata se débranche
accidentellement), soit il est très probablement tombé en panne.

Là je dois dire que vos précieux conseils me dépanneraient ..Je vais
laisser la machine telle quelle en attendant d'y voir plus clair et
d'intervenir dessus....

J'ai essayé de monter la data sur les volumes et elle semble être là...


Jerome
J.MOLIERE - Mentor/J
auteur Eyrolles
blog: http://romjethoughts.blogspot.com




--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Jean-Yves F. Barbier
Le #24058271
On Sun, 11 Dec 2011 13:33:40 +0100
Goldy
S'il n'apparait plus, il est sans doute
tombé en panne (ce qui n'est pas terrible en ce moment vu le prix des
disques durs....)



Ben si justement: 'gade les prix! (à cause des inondations en
Thaïlande:(

--
X-rated movies are all alike ... the only thing they leave to the
imagination is the plot.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Goldy
Le #24058421
Le 11/12/2011 19:05, Jean-Yves F. Barbier a écrit :
On Sun, 11 Dec 2011 13:33:40 +0100
Goldy
S'il n'apparait plus, il est sans doute
tombé en panne (ce qui n'est pas terrible en ce moment vu le prix des
disques durs....)



Ben si justement: 'gade les prix! (à cause des inondations en
Thaïlande:(




L'expression "n'est pas terrible" est à prendre au sens négatif du terme
(j'aurais du en choisir une autre, effectivement).

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Publicité
Poster une réponse
Anonyme