D'un seul coup d'un seul le système de fichier de la partition /home de
mon utilisateur c'est mise "d'elle même" en RO.
Je m'en suis aperçu lorsque relevant mes mails mon MUA n'a pas voulu
écrire les mails sur le disque arguant un manque de permissions.
Un rapide coup d'oeil à dmesg me révèle toute l'horreur de la situation:
[21041.025709] REISERFS error (device dm-6): vs-13070 reiserfs_read_locked_inode:
i/o failure occurred trying to find stat data of [943514 1199089 0x0 SD]
[21041.025713] REISERFS (device dm-6): Remounting filesystem read-only
Le tout répété un certain nombre de fois par nécessairement consécutives et
espacées dans le temps.
Je décide de lancer quelques contrôles avec l'aide de smartctl et par
prudence je deloggue mon utilisateur et demonte la partition /home (mais
ça ne change pas grand chose car ce portable ne dispose que d'un seul
disque doté d'une seule partition LVM sur laquelle un seul VG et 4 LV ont
été créés).
Je lance donc un smartctl -a qui donne le résultat disponible ici:
https://framabin.org/?860344bac4ead01c#YTeUv1RuxtztXl64GP5yKyoL+rYKhlDUf3l0oN43ATg=
Comme je ne sais pas vraiment interpréter ces données, je lance un
self-test short et lis les logs qui apparaissent également dans le
lien plus haut.
Du coup, il me semble qu'il y a quelque chose qui cloche mais quoi
exactement ? Est-ce grave docteur ? et ce genre de choses...
Pour information, ce portable est essentiellement utilisé comme un poste
fixe, sous-tension et allumé en permanence. J'ai donc profité de cet
incident pour l'éteindre et en démonter le disque qui était _brulant_.
Depuis, redémarrage et c'est reparti comme en 40. Plus aucune erreur.
Comment interpréter correctement les informations smartcl ? La doc que
j'ai trouvé à ce sujet m'a laissé confus.
Parmi ces informations smartctl où se situe le nombre de secteurs
défectueux réalloués ?
Mon disque est-il en train de mourir de sa belle mort ?
Merci pour votre aide et d'avoir lu jusqu'ici.
XP+FU2 fr.comp.stockage
--
N'oubliez pas de me faire envoyer la liste
des erreurs constatées au F 756 du 72 03 10
-- H.F. Thiéfaine, L'ascenceur de 22H43
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
Nicolas George
Doug713705 , dans le message <oqie0j$pao$, a écrit :
Parmi ces informations smartctl où se situe le nombre de secteurs défectueux réalloués ?
5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0 Donc zéro. Mais je trouve ça plus inquiétant : # 1 Short offline Completed: read failure 90% 18378 1472169448
Mon disque est-il en train de mourir de sa belle mort ?
Peut-être. Si tu tiens à tes données et ton temps, remplace-le dès que possible.
Doug713705 , dans le message <oqie0j$pao$1@golgoth99.redatomik.org>, a
écrit :
Parmi ces informations smartctl où se situe le nombre de secteurs
défectueux réalloués ?
Doug713705 , dans le message <oqie0j$pao$, a écrit :
Parmi ces informations smartctl où se situe le nombre de secteurs défectueux réalloués ?
5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0 Donc zéro. Mais je trouve ça plus inquiétant : # 1 Short offline Completed: read failure 90% 18378 1472169448
Mon disque est-il en train de mourir de sa belle mort ?
Peut-être. Si tu tiens à tes données et ton temps, remplace-le dès que possible.
Doug713705
Le 28-09-2017, Nicolas George nous expliquait dans fr.comp.stockage (<59ccbc90$0$3718$) :
Doug713705 , dans le message <oqie0j$pao$, a écrit :
Parmi ces informations smartctl où se situe le nombre de secteurs défectueux réalloués ?
5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0 Donc zéro. Mais je trouve ça plus inquiétant : # 1 Short offline Completed: read failure 90% 18378 1472169448
C'est bien ce qui me trouble. Aucun secteur réalloué mais l'impossibilité de compléter un short self-test. Je suis en train d'effectuer un offline test en esperant que ça apporte plus d'éclairage. Résultat dans ~ 3 heures.
Mon disque est-il en train de mourir de sa belle mort ?
Peut-être. Si tu tiens à tes données et ton temps, remplace-le dès que possible.
Tout n'est pas si simple de ce coté de la planète... S'il pouvait tenir 3 mois de plus le temps que je rentre en métropole ce serait cool. Raison pour laquelle j'essaie d'évaluer le risque car en effet je n'ai qu'une seule envie: remplacer ce disque par un SSD qui pourrait bien redonner un coup de jeunesse à ce "vieux" portable. -- Je ne connaîtrai rien de tes habitudes Il se peut même que tu sois décédée Mais j'demanderai ta main pour la couper -- H.F. Thiéfaine, L'ascenceur de 22H43
Le 28-09-2017, Nicolas George nous expliquait dans
fr.comp.stockage
(<59ccbc90$0$3718$426a74cc@news.free.fr>) :
Doug713705 , dans le message <oqie0j$pao$1@golgoth99.redatomik.org>, a
écrit :
Parmi ces informations smartctl où se situe le nombre de secteurs
défectueux réalloués ?
# 1 Short offline Completed: read failure 90% 18378 1472169448
C'est bien ce qui me trouble. Aucun secteur réalloué mais
l'impossibilité de compléter un short self-test.
Je suis en train d'effectuer un offline test en esperant que ça apporte
plus d'éclairage. Résultat dans ~ 3 heures.
Mon disque est-il en train de mourir de sa belle mort ?
Peut-être. Si tu tiens à tes données et ton temps, remplace-le dès que
possible.
Tout n'est pas si simple de ce coté de la planète... S'il pouvait tenir
3 mois de plus le temps que je rentre en métropole ce serait cool. Raison
pour laquelle j'essaie d'évaluer le risque car en effet je n'ai qu'une
seule envie: remplacer ce disque par un SSD qui pourrait bien redonner
un coup de jeunesse à ce "vieux" portable.
--
Je ne connaîtrai rien de tes habitudes
Il se peut même que tu sois décédée
Mais j'demanderai ta main pour la couper
-- H.F. Thiéfaine, L'ascenceur de 22H43
Le 28-09-2017, Nicolas George nous expliquait dans fr.comp.stockage (<59ccbc90$0$3718$) :
Doug713705 , dans le message <oqie0j$pao$, a écrit :
Parmi ces informations smartctl où se situe le nombre de secteurs défectueux réalloués ?
5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0 Donc zéro. Mais je trouve ça plus inquiétant : # 1 Short offline Completed: read failure 90% 18378 1472169448
C'est bien ce qui me trouble. Aucun secteur réalloué mais l'impossibilité de compléter un short self-test. Je suis en train d'effectuer un offline test en esperant que ça apporte plus d'éclairage. Résultat dans ~ 3 heures.
Mon disque est-il en train de mourir de sa belle mort ?
Peut-être. Si tu tiens à tes données et ton temps, remplace-le dès que possible.
Tout n'est pas si simple de ce coté de la planète... S'il pouvait tenir 3 mois de plus le temps que je rentre en métropole ce serait cool. Raison pour laquelle j'essaie d'évaluer le risque car en effet je n'ai qu'une seule envie: remplacer ce disque par un SSD qui pourrait bien redonner un coup de jeunesse à ce "vieux" portable. -- Je ne connaîtrai rien de tes habitudes Il se peut même que tu sois décédée Mais j'demanderai ta main pour la couper -- H.F. Thiéfaine, L'ascenceur de 22H43
Lucas Levrel
Le 28 septembre 2017, à 09:10, Nicolas George a écrit :
Doug713705 , dans le message <oqie0j$pao$, a écrit :
Parmi ces informations smartctl où se situe le nombre de secteurs défectueux réalloués ?
N'est-ce pas normal compte-tenu de : (0x00) Offline data collection activity was never started. Auto Offline Data Collection: Disabled. ?
Mais je trouve ça plus inquiétant : # 1 Short offline Completed: read failure 90% 18378 1472169448
À Doug : le fait qu'il n'y ait pas eu d'erreur après refroidissement et reboot est peut-être une coïncidence, le système n'a peut-être simplement pas essayé d'accéder aux secteurs défectueux. Tu as relancé un self-test ? -- LL Ἕν οἶδα ὅτι οὐδὲν οἶδα (Σωκράτης)
Le 28 septembre 2017, à 09:10, Nicolas George a écrit :
Doug713705 , dans le message <oqie0j$pao$1@golgoth99.redatomik.org>, a
écrit :
Parmi ces informations smartctl où se situe le nombre de secteurs
défectueux réalloués ?
N'est-ce pas normal compte-tenu de :
(0x00) Offline data collection activity was never started.
Auto Offline Data Collection: Disabled.
?
Mais je trouve ça plus inquiétant :
# 1 Short offline Completed: read failure 90% 18378 1472169448
À Doug : le fait qu'il n'y ait pas eu d'erreur après refroidissement et
reboot est peut-être une coïncidence, le système n'a peut-être simplement
pas essayé d'accéder aux secteurs défectueux. Tu as relancé un self-test ?
N'est-ce pas normal compte-tenu de : (0x00) Offline data collection activity was never started. Auto Offline Data Collection: Disabled. ?
Mais je trouve ça plus inquiétant : # 1 Short offline Completed: read failure 90% 18378 1472169448
À Doug : le fait qu'il n'y ait pas eu d'erreur après refroidissement et reboot est peut-être une coïncidence, le système n'a peut-être simplement pas essayé d'accéder aux secteurs défectueux. Tu as relancé un self-test ? -- LL Ἕν οἶδα ὅτι οὐδὲν οἶδα (Σωκράτης)
Nicolas George
Doug713705 , dans le message <oqifb9$pao$, a écrit :
C'est bien ce qui me trouble. Aucun secteur réalloué mais l'impossibilité de compléter un short self-test.
Un secteur ne peut être réalloué que lors d'une écriture. Lors d'une lecture, il n'est pas possible de faire quoi que ce soit.
Tout n'est pas si simple de ce coté de la planète... S'il pouvait tenir 3 mois de plus le temps que je rentre en métropole ce serait cool.
Désolé pour toi, bonne chance.
seule envie: remplacer ce disque par un SSD qui pourrait bien redonner un coup de jeunesse à ce "vieux" portable.
Ne t'attends pas à un résultat extraordinaire : la vitesse du disque n'est un facteur que pour quelques aspects.
Doug713705 , dans le message <oqifb9$pao$2@golgoth99.redatomik.org>, a
écrit :
C'est bien ce qui me trouble. Aucun secteur réalloué mais
l'impossibilité de compléter un short self-test.
Un secteur ne peut être réalloué que lors d'une écriture. Lors d'une
lecture, il n'est pas possible de faire quoi que ce soit.
Tout n'est pas si simple de ce coté de la planète... S'il pouvait tenir
3 mois de plus le temps que je rentre en métropole ce serait cool.
Désolé pour toi, bonne chance.
seule envie: remplacer ce disque par un SSD qui pourrait bien redonner
un coup de jeunesse à ce "vieux" portable.
Ne t'attends pas à un résultat extraordinaire : la vitesse du disque
n'est un facteur que pour quelques aspects.
Doug713705 , dans le message <oqifb9$pao$, a écrit :
C'est bien ce qui me trouble. Aucun secteur réalloué mais l'impossibilité de compléter un short self-test.
Un secteur ne peut être réalloué que lors d'une écriture. Lors d'une lecture, il n'est pas possible de faire quoi que ce soit.
Tout n'est pas si simple de ce coté de la planète... S'il pouvait tenir 3 mois de plus le temps que je rentre en métropole ce serait cool.
Désolé pour toi, bonne chance.
seule envie: remplacer ce disque par un SSD qui pourrait bien redonner un coup de jeunesse à ce "vieux" portable.
Ne t'attends pas à un résultat extraordinaire : la vitesse du disque n'est un facteur que pour quelques aspects.
Pascal Hambourg
Le 28/09/2017 à 11:05, Doug713705 a écrit :
[21041.025709] REISERFS error (device dm-6): vs-13070 reiserfs_read_locked_inode: i/o failure occurred trying to find stat data of [943514 1199089 0x0 SD] [21041.025713] REISERFS (device dm-6): Remounting filesystem read-only Le tout répété un certain nombre de fois par nécessairement consécutives et espacées dans le temps.
Cette erreur concerne le système de fichiers. Avant cela il doit aussi y avoir des erreurs de lecture/écriture du disque lui-même ?
Je lance donc un smartctl -a qui donne le résultat disponible ici: https://framabin.org/?860344bac4ead01c#YTeUv1RuxtztXl64GP5yKyoL+rYKhlDUf3l0oN43ATg (...) Du coup, il me semble qu'il y a quelque chose qui cloche mais quoi exactement ? Est-ce grave docteur ? et ce genre de choses...
Ça : 197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 4 4 secteurs auxquels le système hôte a essayé d'accéder n'ont pas pu être lus. Le premier est à l'adresse LBA 1472169448. Comme ce disque a des secteurs physiques de 4096 octets regroupant les données de 8 secteurs logiques consécutifs de 512 octets, c'est à chaque fois au moins un groupe de 8 secteurs logiques qui est affecté. Tant qu'on ne cherche pas à lire ces secteurs défectueux et s'il n'y en a pas d'autres qui n'avaient pas encore été identifiés, il n'y aura pas d'erreur.
Pour information, ce portable est essentiellement utilisé comme un poste fixe, sous-tension et allumé en permanence. J'ai donc profité de cet incident pour l'éteindre et en démonter le disque qui était _brulant_.
194 Temperature_Celsius 0x0002 055 037 000 Old_age Always - 45 (Min/Max 18/63) Température maxi 63 °C, c'est un peu trop. La température actuelle de 45 °C est correcte.
Parmi ces informations smartctl où se situe le nombre de secteurs défectueux réalloués ?
Mon disque est-il en train de mourir de sa belle mort ?
Pas forcément. L'apparition de secteurs défectueux peut être due à un événement ponctuel comme une surchauffe. Il arrive aussi que des secteurs redevenus lisibles soient encore comptés par SMART. J'ai un disque dont SMART rapporte un secteur illisible mais badblocks ne trouve aucune erreur. La commande badblocks en lecture seule peut être utilisée pour identifier tous les secteurs illisibles sur tout le disque ou une partition ou volume logique. Ecrire dans ces secteurs à bas niveau avec hdparm (dangereux !) peut forcer leur réallocation avec des secteurs de réserve, mais ça ne marche pas toujours. e2fsck a l'option -c pour faire appel implicitement à badblocks afin de détecter et marquer les blocs défectueux, mais je ne connais pas assez reiserfs pour savoir s'il y a une option équivalente.
Le 28/09/2017 à 11:05, Doug713705 a écrit :
[21041.025709] REISERFS error (device dm-6): vs-13070 reiserfs_read_locked_inode:
i/o failure occurred trying to find stat data of [943514 1199089 0x0 SD]
[21041.025713] REISERFS (device dm-6): Remounting filesystem read-only
Le tout répété un certain nombre de fois par nécessairement consécutives et
espacées dans le temps.
Cette erreur concerne le système de fichiers. Avant cela il doit aussi y
avoir des erreurs de lecture/écriture du disque lui-même ?
Je lance donc un smartctl -a qui donne le résultat disponible ici:
https://framabin.org/?860344bac4ead01c#YTeUv1RuxtztXl64GP5yKyoL+rYKhlDUf3l0oN43ATg (...)
Du coup, il me semble qu'il y a quelque chose qui cloche mais quoi
exactement ? Est-ce grave docteur ? et ce genre de choses...
4 secteurs auxquels le système hôte a essayé d'accéder n'ont pas pu être
lus.
Le premier est à l'adresse LBA 1472169448. Comme ce disque a des
secteurs physiques de 4096 octets regroupant les données de 8 secteurs
logiques consécutifs de 512 octets, c'est à chaque fois au moins un
groupe de 8 secteurs logiques qui est affecté.
Tant qu'on ne cherche pas à lire ces secteurs défectueux et s'il n'y en
a pas d'autres qui n'avaient pas encore été identifiés, il n'y aura pas
d'erreur.
Pour information, ce portable est essentiellement utilisé comme un poste
fixe, sous-tension et allumé en permanence. J'ai donc profité de cet
incident pour l'éteindre et en démonter le disque qui était _brulant_.
Mon disque est-il en train de mourir de sa belle mort ?
Pas forcément. L'apparition de secteurs défectueux peut être due à un
événement ponctuel comme une surchauffe. Il arrive aussi que des
secteurs redevenus lisibles soient encore comptés par SMART. J'ai un
disque dont SMART rapporte un secteur illisible mais badblocks ne trouve
aucune erreur.
La commande badblocks en lecture seule peut être utilisée pour
identifier tous les secteurs illisibles sur tout le disque ou une
partition ou volume logique.
Ecrire dans ces secteurs à bas niveau avec hdparm (dangereux !) peut
forcer leur réallocation avec des secteurs de réserve, mais ça ne marche
pas toujours.
e2fsck a l'option -c pour faire appel implicitement à badblocks afin de
détecter et marquer les blocs défectueux, mais je ne connais pas assez
reiserfs pour savoir s'il y a une option équivalente.
[21041.025709] REISERFS error (device dm-6): vs-13070 reiserfs_read_locked_inode: i/o failure occurred trying to find stat data of [943514 1199089 0x0 SD] [21041.025713] REISERFS (device dm-6): Remounting filesystem read-only Le tout répété un certain nombre de fois par nécessairement consécutives et espacées dans le temps.
Cette erreur concerne le système de fichiers. Avant cela il doit aussi y avoir des erreurs de lecture/écriture du disque lui-même ?
Je lance donc un smartctl -a qui donne le résultat disponible ici: https://framabin.org/?860344bac4ead01c#YTeUv1RuxtztXl64GP5yKyoL+rYKhlDUf3l0oN43ATg (...) Du coup, il me semble qu'il y a quelque chose qui cloche mais quoi exactement ? Est-ce grave docteur ? et ce genre de choses...
Ça : 197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 4 4 secteurs auxquels le système hôte a essayé d'accéder n'ont pas pu être lus. Le premier est à l'adresse LBA 1472169448. Comme ce disque a des secteurs physiques de 4096 octets regroupant les données de 8 secteurs logiques consécutifs de 512 octets, c'est à chaque fois au moins un groupe de 8 secteurs logiques qui est affecté. Tant qu'on ne cherche pas à lire ces secteurs défectueux et s'il n'y en a pas d'autres qui n'avaient pas encore été identifiés, il n'y aura pas d'erreur.
Pour information, ce portable est essentiellement utilisé comme un poste fixe, sous-tension et allumé en permanence. J'ai donc profité de cet incident pour l'éteindre et en démonter le disque qui était _brulant_.
194 Temperature_Celsius 0x0002 055 037 000 Old_age Always - 45 (Min/Max 18/63) Température maxi 63 °C, c'est un peu trop. La température actuelle de 45 °C est correcte.
Parmi ces informations smartctl où se situe le nombre de secteurs défectueux réalloués ?
Mon disque est-il en train de mourir de sa belle mort ?
Pas forcément. L'apparition de secteurs défectueux peut être due à un événement ponctuel comme une surchauffe. Il arrive aussi que des secteurs redevenus lisibles soient encore comptés par SMART. J'ai un disque dont SMART rapporte un secteur illisible mais badblocks ne trouve aucune erreur. La commande badblocks en lecture seule peut être utilisée pour identifier tous les secteurs illisibles sur tout le disque ou une partition ou volume logique. Ecrire dans ces secteurs à bas niveau avec hdparm (dangereux !) peut forcer leur réallocation avec des secteurs de réserve, mais ça ne marche pas toujours. e2fsck a l'option -c pour faire appel implicitement à badblocks afin de détecter et marquer les blocs défectueux, mais je ne connais pas assez reiserfs pour savoir s'il y a une option équivalente.
Pascal Hambourg
Le 28/09/2017 à 11:33, Nicolas George a écrit :
Un secteur ne peut être réalloué que lors d'une écriture. Lors d'une lecture, il n'est pas possible de faire quoi que ce soit.
Sauf si par miracle une tentative de lecture finit par réussir. Le contrôleur intégré peut alors en profiter pour réallouer le secteur.
Le 28/09/2017 à 11:33, Nicolas George a écrit :
Un secteur ne peut être réalloué que lors d'une écriture. Lors d'une
lecture, il n'est pas possible de faire quoi que ce soit.
Sauf si par miracle une tentative de lecture finit par réussir. Le
contrôleur intégré peut alors en profiter pour réallouer le secteur.
Un secteur ne peut être réalloué que lors d'une écriture. Lors d'une lecture, il n'est pas possible de faire quoi que ce soit.
Sauf si par miracle une tentative de lecture finit par réussir. Le contrôleur intégré peut alors en profiter pour réallouer le secteur.
Doug713705
Le 28-09-2017, Pascal Hambourg nous expliquait dans fr.comp.stockage (<oqigmv$2gh5$) :
Le 28/09/2017 à 11:33, Nicolas George a écrit :
Un secteur ne peut être réalloué que lors d'une écriture. Lors d'une lecture, il n'est pas possible de faire quoi que ce soit.
Sauf si par miracle une tentative de lecture finit par réussir. Le contrôleur intégré peut alors en profiter pour réallouer le secteur.
Je n'ai pas attendu que le miracle ait lieu (ou pas). J'ai changé le disque sans plus attendre car il était devenu impossible d'écrire dans le LVM qui me sert de /home. La restauration des données sur le nouveau disque est encore en cours et ne s'est pas faite sans certains bruits plus qu'inquiétants. -- Orgie de silence et de propreté ou celui qui aurait encore Quelque chose à dire préfère se taire plutôt que d'avoir À utiliser leurs formulaires d'autorisation de délirer... -- H.F. Thiéfaine, Autorisation de délirer
Le 28-09-2017, Pascal Hambourg nous expliquait dans
fr.comp.stockage
(<oqigmv$2gh5$2@saria.nerim.net>) :
Le 28/09/2017 à 11:33, Nicolas George a écrit :
Un secteur ne peut être réalloué que lors d'une écriture. Lors d'une
lecture, il n'est pas possible de faire quoi que ce soit.
Sauf si par miracle une tentative de lecture finit par réussir. Le
contrôleur intégré peut alors en profiter pour réallouer le secteur.
Je n'ai pas attendu que le miracle ait lieu (ou pas).
J'ai changé le disque sans plus attendre car il était devenu impossible
d'écrire dans le LVM qui me sert de /home.
La restauration des données sur le nouveau disque est encore en cours et
ne s'est pas faite sans certains bruits plus qu'inquiétants.
--
Orgie de silence et de propreté ou celui qui aurait encore
Quelque chose à dire préfère se taire plutôt que d'avoir
À utiliser leurs formulaires d'autorisation de délirer...
-- H.F. Thiéfaine, Autorisation de délirer
Le 28-09-2017, Pascal Hambourg nous expliquait dans fr.comp.stockage (<oqigmv$2gh5$) :
Le 28/09/2017 à 11:33, Nicolas George a écrit :
Un secteur ne peut être réalloué que lors d'une écriture. Lors d'une lecture, il n'est pas possible de faire quoi que ce soit.
Sauf si par miracle une tentative de lecture finit par réussir. Le contrôleur intégré peut alors en profiter pour réallouer le secteur.
Je n'ai pas attendu que le miracle ait lieu (ou pas). J'ai changé le disque sans plus attendre car il était devenu impossible d'écrire dans le LVM qui me sert de /home. La restauration des données sur le nouveau disque est encore en cours et ne s'est pas faite sans certains bruits plus qu'inquiétants. -- Orgie de silence et de propreté ou celui qui aurait encore Quelque chose à dire préfère se taire plutôt que d'avoir À utiliser leurs formulaires d'autorisation de délirer... -- H.F. Thiéfaine, Autorisation de délirer