[Long] smartctl et reallocation bad sector

Le
Doug713705
Bonjour à toutes, tous,

D'un seul coup d'un seul le système de fichier de la partition /home de
mon utilisateur c'est mise "d'elle même" en RO.

Je m'en suis aperçu lorsque relevant mes mails mon MUA n'a pas voulu
écrire les mails sur le disque arguant un manque de permissions.

Un rapide coup d'oeil à dmesg me révèle toute l'horreur de la situation:

[21041.025709] REISERFS error (device dm-6): vs-13070 reiserfs_read_locked_inode:
i/o failure occurred trying to find stat data of [943514 1199089 0x0 SD]
[21041.025713] REISERFS (device dm-6): Remounting filesystem read-only

Le tout répété un certain nombre de fois par nécessairement consécutives et
espacées dans le temps.

Je décide de lancer quelques contrôles avec l'aide de smartctl et par
prudence je deloggue mon utilisateur et demonte la partition /home (mais
ça ne change pas grand chose car ce portable ne dispose que d'un seul
disque doté d'une seule partition LVM sur laquelle un seul VG et 4 LV ont
été créés).

Je lance donc un smartctl -a qui donne le résultat disponible ici:
https://framabin.org/?860344bac4ead01c#YTeUv1RuxtztXl64GP5yKyoL+rYKhlDUf3l0oN43ATg=

Comme je ne sais pas vraiment interpréter ces données, je lance un
self-test short et lis les logs qui apparaissent également dans le
lien plus haut.

Du coup, il me semble qu'il y a quelque chose qui cloche mais quoi
exactement ? Est-ce grave docteur ? et ce genre de choses

Pour information, ce portable est essentiellement utilisé comme un poste
fixe, sous-tension et allumé en permanence. J'ai donc profité de cet
incident pour l'éteindre et en démonter le disque qui était _brulant_.

Depuis, redémarrage et c'est reparti comme en 40. Plus aucune erreur.

Comment interpréter correctement les informations smartcl ? La doc que
j'ai trouvé à ce sujet m'a laissé confus.

Parmi ces informations smartctl où se situe le nombre de secteurs
défectueux réalloués ?

Mon disque est-il en train de mourir de sa belle mort ?

Merci pour votre aide et d'avoir lu jusqu'ici.

XP+FU2 fr.comp.stockage
--
N'oubliez pas de me faire envoyer la liste
des erreurs constatées au F 756 du 72 03 10
-- H.F. Thiéfaine, L'ascenceur de 22H43
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Nicolas George
Le #26445846
Doug713705 , dans le message écrit :
Parmi ces informations smartctl où se situe le nombre de secteurs
défectueux réalloués ?

5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0
Donc zéro. Mais je trouve ça plus inquiétant :
# 1 Short offline Completed: read failure 90% 18378 1472169448
Mon disque est-il en train de mourir de sa belle mort ?

Peut-être. Si tu tiens à tes données et ton temps, remplace-le dès que
possible.
Doug713705
Le #26445849
Le 28-09-2017, Nicolas George nous expliquait dans
fr.comp.stockage
(
Doug713705 , dans le message écrit :
Parmi ces informations smartctl où se situe le nombre de secteurs
défectueux réalloués ?

5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0
Donc zéro. Mais je trouve ça plus inquiétant :
# 1 Short offline Completed: read failure 90% 18378 1472169448

C'est bien ce qui me trouble. Aucun secteur réalloué mais
l'impossibilité de compléter un short self-test.
Je suis en train d'effectuer un offline test en esperant que ça apporte
plus d'éclairage. Résultat dans ~ 3 heures.
Mon disque est-il en train de mourir de sa belle mort ?

Peut-être. Si tu tiens à tes données et ton temps, remplace-le dès que
possible.

Tout n'est pas si simple de ce coté de la planète... S'il pouvait tenir
3 mois de plus le temps que je rentre en métropole ce serait cool. Raison
pour laquelle j'essaie d'évaluer le risque car en effet je n'ai qu'une
seule envie: remplacer ce disque par un SSD qui pourrait bien redonner
un coup de jeunesse à ce "vieux" portable.
--
Je ne connaîtrai rien de tes habitudes
Il se peut même que tu sois décédée
Mais j'demanderai ta main pour la couper
-- H.F. Thiéfaine, L'ascenceur de 22H43
Lucas Levrel
Le #26445851
Le 28 septembre 2017, à 09:10, Nicolas George a écrit :
Doug713705 , dans le message écrit :
Parmi ces informations smartctl où se situe le nombre de secteurs
défectueux réalloués ?

5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0
Donc zéro.

N'est-ce pas normal compte-tenu de :
(0x00) Offline data collection activity was never started.
Auto Offline Data Collection: Disabled.
?
Mais je trouve ça plus inquiétant :
# 1 Short offline Completed: read failure 90% 18378 1472169448


À Doug : le fait qu'il n'y ait pas eu d'erreur après refroidissement et
reboot est peut-être une coïncidence, le système n'a peut-être simplement
pas essayé d'accéder aux secteurs défectueux. Tu as relancé un self-test ?
--
LL
Ἕν οἶδα ὅτι οὐδὲν οἶδα (Σωκράτης)
Nicolas George
Le #26445850
Doug713705 , dans le message écrit :
C'est bien ce qui me trouble. Aucun secteur réalloué mais
l'impossibilité de compléter un short self-test.

Un secteur ne peut être réalloué que lors d'une écriture. Lors d'une
lecture, il n'est pas possible de faire quoi que ce soit.
Tout n'est pas si simple de ce coté de la planète... S'il pouvait tenir
3 mois de plus le temps que je rentre en métropole ce serait cool.

Désolé pour toi, bonne chance.
seule envie: remplacer ce disque par un SSD qui pourrait bien redonner
un coup de jeunesse à ce "vieux" portable.

Ne t'attends pas à un résultat extraordinaire : la vitesse du disque
n'est un facteur que pour quelques aspects.
Pascal Hambourg
Le #26445854
Le 28/09/2017 à 11:05, Doug713705 a écrit :
[21041.025709] REISERFS error (device dm-6): vs-13070 reiserfs_read_locked_inode:
i/o failure occurred trying to find stat data of [943514 1199089 0x0 SD]
[21041.025713] REISERFS (device dm-6): Remounting filesystem read-only
Le tout répété un certain nombre de fois par nécessairement consécutives et
espacées dans le temps.

Cette erreur concerne le système de fichiers. Avant cela il doit aussi y
avoir des erreurs de lecture/écriture du disque lui-même ?
Je lance donc un smartctl -a qui donne le résultat disponible ici:
https://framabin.org/?860344bac4ead01c#YTeUv1RuxtztXl64GP5yKyoL+rYKhlDUf3l0oN43ATg (...)
Du coup, il me semble qu'il y a quelque chose qui cloche mais quoi
exactement ? Est-ce grave docteur ? et ce genre de choses...

Ça :
197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 4
4 secteurs auxquels le système hôte a essayé d'accéder n'ont pas pu être
lus.
Le premier est à l'adresse LBA 1472169448. Comme ce disque a des
secteurs physiques de 4096 octets regroupant les données de 8 secteurs
logiques consécutifs de 512 octets, c'est à chaque fois au moins un
groupe de 8 secteurs logiques qui est affecté.
Tant qu'on ne cherche pas à lire ces secteurs défectueux et s'il n'y en
a pas d'autres qui n'avaient pas encore été identifiés, il n'y aura pas
d'erreur.
Pour information, ce portable est essentiellement utilisé comme un poste
fixe, sous-tension et allumé en permanence. J'ai donc profité de cet
incident pour l'éteindre et en démonter le disque qui était _brulant_.

194 Temperature_Celsius 0x0002 055 037 000 Old_age Always - 45 (Min/Max
18/63)
Température maxi 63 °C, c'est un peu trop. La température actuelle de 45
°C est correcte.
Parmi ces informations smartctl où se situe le nombre de secteurs
défectueux réalloués ?

5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0
196 Reallocated_Event_Count 0x0032 252 252 000 Old_age Always - 0
Mon disque est-il en train de mourir de sa belle mort ?

Pas forcément. L'apparition de secteurs défectueux peut être due à un
événement ponctuel comme une surchauffe. Il arrive aussi que des
secteurs redevenus lisibles soient encore comptés par SMART. J'ai un
disque dont SMART rapporte un secteur illisible mais badblocks ne trouve
aucune erreur.
La commande badblocks en lecture seule peut être utilisée pour
identifier tous les secteurs illisibles sur tout le disque ou une
partition ou volume logique.
Ecrire dans ces secteurs à bas niveau avec hdparm (dangereux !) peut
forcer leur réallocation avec des secteurs de réserve, mais ça ne marche
pas toujours.
e2fsck a l'option -c pour faire appel implicitement à badblocks afin de
détecter et marquer les blocs défectueux, mais je ne connais pas assez
reiserfs pour savoir s'il y a une option équivalente.
Pascal Hambourg
Le #26445853
Le 28/09/2017 à 11:33, Nicolas George a écrit :
Un secteur ne peut être réalloué que lors d'une écriture. Lors d'une
lecture, il n'est pas possible de faire quoi que ce soit.

Sauf si par miracle une tentative de lecture finit par réussir. Le
contrôleur intégré peut alors en profiter pour réallouer le secteur.
Doug713705
Le #26446215
Le 28-09-2017, Pascal Hambourg nous expliquait dans
fr.comp.stockage
(
Le 28/09/2017 à 11:33, Nicolas George a écrit :
Un secteur ne peut être réalloué que lors d'une écriture. Lors d'une
lecture, il n'est pas possible de faire quoi que ce soit.

Sauf si par miracle une tentative de lecture finit par réussir. Le
contrôleur intégré peut alors en profiter pour réallouer le secteur.

Je n'ai pas attendu que le miracle ait lieu (ou pas).
J'ai changé le disque sans plus attendre car il était devenu impossible
d'écrire dans le LVM qui me sert de /home.
La restauration des données sur le nouveau disque est encore en cours et
ne s'est pas faite sans certains bruits plus qu'inquiétants.
--
Orgie de silence et de propreté ou celui qui aurait encore
Quelque chose à dire préfère se taire plutôt que d'avoir
À utiliser leurs formulaires d'autorisation de délirer...
-- H.F. Thiéfaine, Autorisation de délirer
Publicité
Poster une réponse
Anonyme