Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

raid 1 qui foire ?

38 réponses
Avatar
steve
Salut la liste,

Après moult recherches sur le net concernant ce problème, je me tourne
vers vous. J'ai deux « arrays » en raid1 qui ont sauté lors du
redémarrage de la machine. Dans le syslog voici ce qu'on peut lire :

localhost smartd[5019]: Device: /dev/sda, 571 Currently
unreadable (pending) sectors
localhost smartd[5019]: Device: /dev/sda, 584 Offline
uncorrectable sectors

puis :

localhost kernel: [248148.527763] ata1.00: exception
Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
localhost kernel: [248148.527766] ata1.00: irq_stat
0x40000001
localhost kernel: [248148.527772] ata1.00: cmd
c8/00:08:f4:d1:8c/00:00:00:00:00/e5 tag 0 dma 4096 in
localhost kernel: [248148.527774] res
51/01:00:f4:d1:8c/25:00:05:00:00/e5 Emask 0x1 (device error)
localhost kernel: [248148.527777] ata1.00: status: {
DRDY ERR }
localhost kernel: [248148.529039] ata1.00: configured
for UDMA/33
localhost kernel: [248148.529046] ata1: EH complete
Aug 9 09:26:51 localhost kernel: [248150.327559] ata1.00: exception
Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
localhost kernel: [248150.327562] ata1.00: irq_stat
0x40000001
localhost kernel: [248150.327569] ata1.00: cmd
c8/00:08:f4:d1:8c/00:00:00:00:00/e5 tag 0 dma 4096 in
localhost kernel: [248150.327570] res
51/01:00:f4:d1:8c/25:00:05:00:00/e5 Emask 0x1 (device error)
el: [248150.327573] ata1.00: status: {
DRDY ERR }
localhost kernel: [248150.328835] ata1.00: configured
for UDMA/33
localhost kernel: [248150.328841] ata1: EH complete

Les partitions touchées sont /home et /tmp. Pour /home, c'est pénible
car tout est extrêmement ralenti (genre écrire ce message).

Pour reconstruire le raid1, ça a été la croix et la bannière, le disque
/dev/sda était occupé (« busy ») alors que j'avais démonté la partition.
Mais je m'en suis finalement sorti et /home est remonté.

Je me demande si le disque n'est pas en train de mourir (il est
relativement jeune, maximum 2 ans). Je me demande aussi si ce n'est pas
un problème du noyau 2.6.30 (mes partitions sont marquées « unknown »
depuis que je l'ai installé, alors qu'elles sont en ext3).

Qu'en pensez-vous ?

merci de votre aide et bon dimanche,
steve

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers debian-user-french-REQUEST@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmaster@lists.debian.org

10 réponses

1 2 3 4
Avatar
Pascal Hambourg
Jean-Yves F. Barbier a écrit :
Pascal Hambourg a écrit :
...
badblocks a beaucoup moins d'options (et sa page de manuel est beaucoup
plus courte) que mke2fs. Je ne trouve pas que "-w" soit plus rébarbatif
que "-c -c". C'est peut-être une question de préférence personnelle.



tu oublies la taille de block, elle passe à l'as avec mke2fs



La taille de bloc n'a d'importance que si on veut exploiter les
positions des blocs défectueux. On peut laisser la valeur par défaut si
on veut juste tester s'il y a des secteurs défectueux et accessoirement
forcer leur réallocation automatique par le disque.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Avatar
steve
Bonjour la liste,

Bon je suis de retour et je me suis attaqué au remplacement du disque
dur (sda) qui me donnait des soucis. La procédure est maintenant terminée avec
succès. Pour les archives et pour ceux qui se retrouveraient dans la même
situation que moi, voici comment j'ai fait.

1) mise en fail et retrait du disque défaillant

mdadm /dev/md0 --fail /dev/sda1
mdadm /dev/md0 --remove /dev/sda1

et pareil pour tous les 8 autres (j'en avais 9). Le système ne tourne
maintenant que sur une patte, croisons les doigts...

2) Remplacement du disque dur

Alors que la machine est toujours allumée, je retire l'alimentation et
le câble sata de l'ancien disque, le retire, et le remplace par le
nouveau, le connecte et branche l'alimentation. syslog me montre que le
nouveau disque est vu sous le nom /dev/sdc. (Au premier redémarrage, il
deviendra /dev/sda, mais pour le moment c'est sdc.)

3) Création des partitions sur le nouveau disque.

Pour ne pas faire de bêtise, j'utilise sfdisk pour reprendre la même
configuration du disque qui tourne pour la mettre sur le nouveau.

sfdisk --dump /dev/sdb | sfdisk /dev/sdc

4) Reconstruction

Il faut maintenant reconstruire les arrays

mdadm --manage /dev/md0 --add /dev/sdc1

et ainsi de suite pour les 8 autres. Un

watch cat /proc/mdstat

permet de voir l'évolution de la reconstruction en direct. Cette étape
prend du temps bien évidemment. Après une heure environ, tous mes arrays
sont reconstruits.

5) Renseignement de /etc/mdadm/mdadm.conf

Ce fichier contient la description des disque utilisés pour le raid, il
est donc actuellement obsolète. Un

mdadm --detail --scan >> /etc/mdadm/mdadm.conf

ajoute à la fin du fichier les bonnes valeurs. J'ai commenté les
anciennes juste au-dessus. Aussi cette commande ajoute un champs «
metadata.90 » dont je ne connais pas la signification mais qui
renvoie une erreur au redémarrage de la machine. Je les ai effacé (mais
pas encore redémarré depuis...).

6) Grub

Pour pouvoir quand même redémarrer au cas où un disque me lâche, il faut
installer grub dans les deux disques.

# grub
root (hd0,0)
setup (hd0)
root (hd1,0)
setup (hd1)
exit



Et ajouter une ligne dans le /boot/grum/menu.lst (merci Daniel !)

default 0
fallback 1

et ajouter une entrée en deuxième position :

title Debian GNU/Linux, kernel 2.6.30-1-amd64
root (hd0,0)
kernel /vmlinuz-2.6.30-1-amd64 root=/dev/md1 ro
initrd /initrd.img-2.6.30-1-amd64

title Debian GNU/Linux, kernel 2.6.30-1-amd64
root (hd1,0)
kernel /vmlinuz-2.6.30-1-amd64 root=/dev/md1 ro
initrd /initrd.img-2.6.30-1-amd64


Observez la ligne root.

Voilà tout semble prêt pour un redémarrage. Ce que je fait, mais le
système se bloque sur un kernel panic dû à un problème de swap. Pas
grave j'éteins sauvagement et rallume. Le système démarre bien mais les
arrays sont maintenant dégradés et il faut donc les resynchroniser, ce
qui se fait tous seul maintenant.


Mon système semble maintenant en parfaite santé, je vais pouvoir aller
dormir du sommeil du Sage (si mon petit dernier de 5 mois me laisse,
mais ça c'est une autre histoire...)


Avec le disque dur qui me donnait des soucis, je ne sais pas encore ce
que je vais faire, peut-être une grosse partition test, on verra. Si
vous avez des idées, n'hésitez pas à m'en faire part.

Merci à tous pour vos conseils avisés.


Steve


PS : quelle est la meilleure traduction en français de « array » ?

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Avatar
Sylvain Sauvage
steve, dimanche 23 août 2009, 22:27:06 CEST

Bonjour la liste,



’soir,

[…]
PS : quelle est la meilleure traduction en français de « array » ?



Dans ce cas, « matrice (de disque) ».

Cf. http://www.granddictionnaire.com (Office québécois de la
langue française, les propositions sont parfois un peu, euh, on
dira belles-provinciales mais c’est bien fait.)

--
Sylvain Sauvage

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Avatar
steve
Le 23-08-2009, à 23:32:23 +0200, Sylvain Sauvage () a écrit :

steve, dimanche 23 août 2009, 22:27:06 CEST
>
> Bonjour la liste,

’soir,

>[…]
> PS : quelle est la meilleure traduction en français de « array » ?

Dans ce cas, « matrice (de disque) ».

Cf. http://www.granddictionnaire.com (Office québécois de la
langue française, les propositions sont parfois un peu, euh, on
dira belles-provinciales mais c’est bien fait.)




Merci.



--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Avatar
Frédéric Massot
steve a écrit :
Bonjour la liste,

Bon je suis de retour et je me suis attaqué au remplacement du disque
dur (sda) qui me donnait des soucis. La procédure est maintenant terminée avec
succès. Pour les archives et pour ceux qui se retrouveraient dans la même
situation que moi, voici comment j'ai fait.



[...]

2) Remplacement du disque dur

Alors que la machine est toujours allumée, je retire l'alimentation et
le câble sata de l'ancien disque, le retire, et le remplace par le
nouveau, le connecte et branche l'alimentation. syslog me montre que le
nouveau disque est vu sous le nom /dev/sdc. (Au premier redémarrage, il
deviendra /dev/sda, mais pour le moment c'est sdc.)



Tu as remplacé les disques à chaud, tu as un système hotplug ?

Le SATA est sensé supporter le hotplug, mais tout les chipsets et
drivers ne le supporte pas : http://linux-ata.org/driver-status.html

http://linux-ata.org/software-status.html#hotplug

PS : quelle est la meilleure traduction en français de « array » ?



Matrice ou grappe, c'est selon que l'on préfère les mathématiques ou les
fruits.

--
============================================= | FRÉDÉRIC MASSOT |
| http://www.juliana-multimedia.com |
| mailto: |
==========================Þbian=GNU/Linux==
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Avatar
steve
Le 24-08-2009, à 10:06:52 +0200, Frédéric Massot () a écrit :

steve a écrit :
> Bonjour la liste,
>
> Bon je suis de retour et je me suis attaqué au remplacement du disque
> dur (sda) qui me donnait des soucis. La procédure est maintenant terminée avec
> succès. Pour les archives et pour ceux qui se retrouveraient dans la même
> situation que moi, voici comment j'ai fait.
>
[...]
>
> 2) Remplacement du disque dur
>
> Alors que la machine est toujours allumée, je retire l'alimentation et
> le câble sata de l'ancien disque, le retire, et le remplace par le
> nouveau, le connecte et branche l'alimentation. syslog me montre que le
> nouveau disque est vu sous le nom /dev/sdc. (Au premier redémarrage, il
> deviendra /dev/sda, mais pour le moment c'est sdc.)

Tu as remplacé les disques à chaud, tu as un système hotplug ?



Je ne sais pas si j'ai un système hotplug (comment vérifier ?), mais je
l'ai effectivement fait à chaud (mais après avoir noté comme "failed" le
disque sda). J'avais fait une tentative sans le faire, et le système a
tenu environ 2 minutes avant de se geler complètement. J'ai dû éteindre
sauvagement puis redémarrer, sans gros problème.

Le SATA est sensé supporter le hotplug, mais tout les chipsets et
drivers ne le supporte pas : http://linux-ata.org/driver-status.html

http://linux-ata.org/software-status.html#hotplug



Bon vu ce lien, il doit être hotplug.

> PS : quelle est la meilleure traduction en français de « array » ?

Matrice ou grappe, c'est selon que l'on préfère les mathématiques ou les
fruits.



J'apprécie les deux ;-)

steve

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Avatar
steve
Salut,

Je reviens sur ce message car vu mes problèmes de lenteur j'ai décidé de
faire des tests avec un nouveau HD. En relisant ce fil, je suis tombé
sur ce message et j'ai une question.

Le 10-08-2009, à 15:19:31 +0200, Jean-Yves F. Barbier () a écrit :

Lignes : 25

steve a écrit :
...
> J'avais créer mes md* lors de l'installation avec l'installateur debian.

d'où l'intérêt du formatage version longue, avec vérification de chaque secteur
AVANT toute construction RAID.



C'est quoi « un formatage version longue » ? Comment on fait ça ?

Merci.

Steve

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Avatar
Jean-Yves F. Barbier
steve a écrit :
Salut,

Je reviens sur ce message car vu mes problèmes de lenteur j'ai décidé de
faire des tests avec un nouveau HD. En relisant ce fil, je suis tombé
sur ce message et j'ai une question.

Le 10-08-2009, à 15:19:31 +0200, Jean-Yves F. Barbier () a écrit :

Lignes : 25

steve a écrit :
...
J'avais créer mes md* lors de l'installation avec l'installateur debian.


d'où l'intérêt du formatage version longue, avec vérification de chaque secteur
AVANT toute construction RAID.



C'est quoi « un formatage version longue » ? Comment on fait ça ?



mke2fs -c -c, le 2nd -c déclenchant, en plus de la lecture des secteurs,
leur écriture avec différent pattern (6 ou 8, jsèpu) qui sont aussi relus
afin de vérifier que le secteur est Ok.

--
Q. How do you keep an Aggie busy at a terminal?
A. While he's not looking, switch it to "local".

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Avatar
steve
Le 22-09-2009, à 20:46:46 +0200, Jean-Yves F. Barbier () a écrit :

steve a écrit :
> Salut,
>
> Je reviens sur ce message car vu mes problèmes de lenteur j'ai décidé de
> faire des tests avec un nouveau HD. En relisant ce fil, je suis tombé
> sur ce message et j'ai une question.
>
> Le 10-08-2009, à 15:19:31 +0200, Jean-Yves F. Barbier () a écrit :
>
>> Lignes : 25
>>
>> steve a écrit :
>> ...
>>> J'avais créer mes md* lors de l'installation avec l'installateur debian.
>> d'où l'intérêt du formatage version longue, avec vérification de chaque secteur
>> AVANT toute construction RAID.
>
> C'est quoi « un formatage version longue » ? Comment on fait ça ?

mke2fs -c -c, le 2nd -c déclenchant, en plus de la lecture des secteurs,
leur écriture avec différent pattern (6 ou 8, jsèpu) qui sont aussi relus
afin de vérifier que le secteur est Ok.



Ok. Maintenant juste pour être sûr, je vais recréer mon Raid 1 avec un
nouveau HD, je fais :

sfdisk --dump /dev/sdb | sfdisk /dev/sdc

ce qui recrée les partitions sur sdc à l'image de sdb. Mais est-ce que,
*avant* de reconstruire le Raid1, je dois faire un

# mkfs.etx3 -c -c /dev/sdc$i

(avec $i=1..9)

? Car Jusque là je ne l'ai pas fait.

Est-ce que cela expliquerait pourquoi quand je fais un

#fdisk -l

j'ai des lignes me disant

Disk /dev/md6 doesn't contain a valid partition table ?

Parce que je n'ai pas créé de filesystem avant de construire la matrice
Raid ?

steve

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Avatar
Jean-Yves F. Barbier
steve a écrit :
Le 22-09-2009, à 20:46:46 +0200, Jean-Yves F. Barbier () a écrit :

steve a écrit :
Salut,

Je reviens sur ce message car vu mes problèmes de lenteur j'ai décidé de
faire des tests avec un nouveau HD. En relisant ce fil, je suis tombé
sur ce message et j'ai une question.

Le 10-08-2009, à 15:19:31 +0200, Jean-Yves F. Barbier () a écrit :

Lignes : 25

steve a écrit :
...
J'avais créer mes md* lors de l'installation avec l'installateur debian.


d'où l'intérêt du formatage version longue, avec vérification de chaque secteur
AVANT toute construction RAID.


C'est quoi « un formatage version longue » ? Comment on fait ça ?


mke2fs -c -c, le 2nd -c déclenchant, en plus de la lecture des secteurs,
leur écriture avec différent pattern (6 ou 8, jsèpu) qui sont aussi relus
afin de vérifier que le secteur est Ok.



Ok. Maintenant juste pour être sûr, je vais recréer mon Raid 1 avec un
nouveau HD, je fais :

sfdisk --dump /dev/sdb | sfdisk /dev/sdc



non, étant donné que les HDz ne sont pas de la même marque, il-y-a 99%
de chances que le CHS soit différent (même des HDz de même marque ET
même références peuvent présenter des divergences.)
il faut utiliser cfdisk ou fdisk sur chaque HD, s'il-y-a disparité de tailles,
l'array se règlera sur la plus petite des tailles.

ce qui recrée les partitions sur sdc à l'image de sdb. Mais est-ce que,
*avant* de reconstruire le Raid1, je dois faire un

# mkfs.etx3 -c -c /dev/sdc$i



mke2fs -c -c -v -j -m1 (plus, éventuellement -t xxx ou -N nnn en fonction des besoins
en nombre de fichiers) /dev...

(avec $i=1..9)

? Car Jusque là je ne l'ai pas fait.

Est-ce que cela expliquerait pourquoi quand je fais un

#fdisk -l

j'ai des lignes me disant

Disk /dev/md6 doesn't contain a valid partition table ?



?? mdX est un array RAID, ça ne serait pas plutôt /dev/sdXN ?

Parce que je n'ai pas créé de filesystem avant de construire la matrice
Raid ?



Il ne s'agit pas ici de créer un FS, mais de vérifier l'intégrité des HDz,
UN-PAR-UN; RAID-1 assure l'intégrité des données par redondance des
partoches (mirroir), PAS l'intégrité physique des HDz.

--
"A power so great, it can only be used for Good or Evil!"
-- Firesign Theatre, "The Giant Rat of Summatra"

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
1 2 3 4