OVH Cloud OVH Cloud

Bad block too

57 réponses
Avatar
Jo Engo
Bonjour,

j'ai une machine dont le disque déconne (je touche du bois ça fait un
petit moment qu'il n'a pas merdé : linux le remonte en RO suite à erreur)

Voici la sortie de sudo smartctl /dev/sda -d ata -a>log.smart
(scp ~/log.smart .)

https://pastebin.com/U2ExrRcN

Si quelqu'un peut me dire ce qu'il en est (et ce que je peux faire) ça
serait sympa. Changer de disque n'est pas une option, si c'est la seule
solution, j'attends qu'il meure pour de bon et je recycle la machine

--
Le plus grand amour est l'amour d'une mère, vient ensuite l'amour d'un
chien, puis l'amour d'un amant.
-+- Proverbe polonais -+-

10 réponses

1 2 3 4 5
Avatar
Jo Engo
Le Sun, 14 Jul 2019 10:26:30 +0200, Sergio a écrit :
Erreurs lecture/écriture sur le disque -> disque prêt à mourir ->

Ou pas :
~$ mount|grep sda; uptime
/dev/sda1 on / type ext4 (rw,relatime,errors=remount-ro,data=ordered)
10:57:48 up 8 days, 18:17, 2 users, load average: 0,55, 0,50, 0,62
Quant à sauvegarder ou changer de disque c'est niet et niet
1. Je n'ai rien à sauvegarder de cette machine
2. Cette machine est pourrite, hors de question que je la répare -> Elle
partira au recyclage
--
Si seulement je connaissais plus de mathématiques !
-+- Erwin Schrödinger, Lettre à Willy Wien du 27.12.1925 -+-
Avatar
Jo Engo
Le Sun, 14 Jul 2019 10:51:01 +0200, pehache a écrit :
La distinction erreur d'écriture/de lecture n'a pas de pertinence : une
erreur se révèle forcément au moment d'une lecture, sans qu'on puisse
déterminer avec certitude à quoi elle est due.

Jai plus qu'à attendre que l'erreur se produise mais elle veut pas, elle
fait sa timide maintenant que je la regarde. Un dmesg devrait indiquer
quelle est l'erreur. Je croyais connement que dmesg allait chercher ses
infos sur le disque (disque ro ⇒ info pas écrite)
--
Une géométrie ne peut pas être plus vraie qu'une autre ; elle peut
seulement être plus commode.
-+- Henri Poincaré -+-
Avatar
Jo Engo
Le Sun, 14 Jul 2019 10:26:30 +0200, Sergio a écrit :
->

Au fait, en passant ça te ferait un deuxième TDC de répondre à la
question qui est posée ou de t'abstenir au lieu d'étaler tes états d'âme ?
--
ARNAQUE
M : Cronch ! Miom ! Oui... Slurp ! C'est de la merde... PTOU ! BERCK ! De
la merde en boîte !
Avatar
JKB
Le 13 Jul 2019 13:40:43 GMT,
Jo Engo écrivait :
Le Sat, 13 Jul 2019 13:23:57 +0000, JKB a écrit :
Bonjour,

bonjour,
Quel noyau Linux pour commencer ?

4.15.0-54-generic

Oublie donc, c'était avec la série 4.19.
Il y a un noyau récent qui n'aime pas
les disques Toshiba, les erreurs que j'obtenais étaient un peu
différentes des tiennes :
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- --
--
-- -- -- -- -- ---------------- --------------------
60 08 e0 d0 69 70 40 00 00:01:45.931 READ FPDMA QUEUED 60 08 d8
e0 69 70 40 00 00:01:45.931 READ FPDMA QUEUED 60 08 d0 20 6a 70
40 00
00:01:45.931 READ FPDMA QUEUED 60 08 c8 d0 6a 70 40 00
00:01:45.931 READ FPDMA QUEUED 60 08 c0 08 6b 70 40 00 00:01:45.931
READ FPDMA QUEUED
Le seul truc qui m'inquiéterait dans tes logs, c'est :
Reallocated_Sector_Ct à 155.

Ça veut dire 155 secteurs réalloué ???

Voui.
Tu peux toujours demander à smartctl d'effectuer un test complet
du disque

Je suis con : j'ai tatonné pour faire «smartctl /dev/sda -d ata -a>» -a
ce n'est pas «test complet» ?

Non, un test, c'est un test par le disque. man smartctl -t
Au fait :
$ mount|grep sda; uptime # pour voir
/dev/sda1 on / type ext4 (rw,relatime,errors=remount-ro,data=ordered)
15:27:22 up 7 days, 22:47, 2 users, load average: 0,81, 1,01, 0,97
c'est mon record. Au début de la crise il tenait 12h puis les erreurs se
sont éloignées dans le temps petit à petit, mais là c'est un grand bond
en avant : la dernière fois c'était ±3j. Serait-ce la fin (de la fièvre) ?

Mouais...
ou utiliser badblocks en mode non destructif pour voir où

se
trouvent les secteurs défecteux et demander gentiment au système

de
fichier de ne pas les utiliser. Ça peut marcher (mais ce n'est pas
obligatoire).


JKB
--
Si votre demande me parvient sur carte perforée, je titiouaillerai très
volontiers une réponse...
=> http://grincheux.de-charybde-en-scylla.fr
=> http://loubardes.de-charybde-en-scylla.fr
Avatar
JKB
Le 13 Jul 2019 18:40:09 GMT,
Jo Engo écrivait :
Le Sat, 13 Jul 2019 15:44:46 +0200, pehache a écrit :
Même question : quel est le message au juste ?

Je n'en sais rien, ça ne se passe pas devant mes yeux et vu que / est en
read only, je ne peux même pas espérer lire dmesg

dmesg est un tampon en mémoire normalement.
JKB
--
Si votre demande me parvient sur carte perforée, je titiouaillerai très
volontiers une réponse...
=> http://grincheux.de-charybde-en-scylla.fr
=> http://loubardes.de-charybde-en-scylla.fr
Avatar
Pascal Hambourg
Le 14/07/2019 à 10:26, Sergio a écrit :
Le 14/07/2019 à 10:13, Jo Engo a écrit :
Le Sun, 14 Jul 2019 09:18:35 +0200, Pascal Hambourg a écrit :
Les messages du noyau et les messages de la console, ce n'est pas la
même chose.

Les uns incluent les autres non ? Ce qui m'intéresse c'est les messages
du noyau, qui font partie des messages de la console, non ?


Peut-être. Je ne sais pas exactement quels messages sont dans
/dev/console. dmesg affiche le tampon des messages du noyau.
Erreurs lecture/écriture sur le disque -> disque prêt à mourir

Pas forcément. Un disque peut vivre encore très longtemps avec des
secteurs défectueux.
Avatar
Jo Engo
Le Sun, 14 Jul 2019 14:00:56 +0200, Pascal Hambourg a écrit :
Pas forcément. Un disque peut vivre encore très longtemps avec des
secteurs défectueux.

Les erreurs peuvent aussi être dues à autre chose que le disque : linux,
le contrôleur
--
Souviens-toi, homme, que tu es poussière et que tu retourneras
poussière.
-+- Livre de la Genèse 3,19 -+-
Avatar
Jo Engo
Le Sun, 14 Jul 2019 09:45:50 +0000, JKB a écrit :
Non, un test, c'est un test par le disque. man smartctl -t

Je suppose qu'il ne faut pas que je sois booté dessus, si ?
--
Les paradoxes posent un problème sérieux, non pas pour les
mathématiques, mais pour la logique et pour l'épistémologie.
-+- Kurt Gödel -+-
Avatar
Nicolas George
Jo Engo , dans le message
<pan$a7393$39b4c8d5$a0b0fdfc$, a écrit :
Les erreurs peuvent aussi être dues à autre chose que le disque : linux,
le contrôleur

C'est techniquement possible. Mais si ça tombe toujours sur les mêmes
quelques secteurs, c'est vraiment très peu crédible.
Avatar
Jo Engo
Le Sun, 14 Jul 2019 09:45:50 +0000, JKB a écrit :
Je suis con : j'ai tatonné pour faire «smartctl /dev/sda -d ata -a>» -a
ce n'est pas «test complet» ?

Non, un test, c'est un test par le disque. man smartctl -t

-t TEST
../..
long - [ATA] runs SMART Extended Self Test (tens of
minutes). This is a longer and more thorough version of the Short Self
Test described above. Note
that this command can be given during normal system
operation (unless run in captive mode - see the ´-C´ option below).
Bon j'ai fait ça :
~$ sudo smartctl /dev/sda -d ata -t long
Il y avait mieux à faire ? C'est pour ce soir…
smartctl 6.6 2016-05-31 r4324 [i686-linux-4.15.0-54-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke,
www.smartmontools.org
=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION == Sending command: "Execute SMART Extended self-test routine immediately in
off-line mode".
Drive command "Execute SMART Extended self-test routine immediately in
off-line mode" successful.
Testing has begun.
Please wait 99 minutes for test to complete.
Test will complete after Sun Jul 14 16:50:36 2019
Use smartctl -X to abort test.
Et que devrais-je faire à 16:50:36 ?
--
J'ai emprunté ma chaumière
Aux puces et aux moustiques
Et j'ai dormi
-+- Issa -+-
1 2 3 4 5