Plantage avec de nombreux IO error sur un SSD

Le
C. Mourad Jaber
Bonjour,

J'ai eu plusieurs plantages "violents" avec mon laptop A priori c'est lié à la sortie
de veille.

Au bout d'un certain nombre de cycles de sortie de veille, le laptop se met à chauffer et
la console est inondée de read error, de ext4 failure et autre insulte du file system

Tous les processes se figent en l'attente du disque et je suis obliger d'éteindre
l'ordinateur

Après redémarrage tout va bien

N'ayant qu'une connaissance limité des SSD, je me pose plusieurs questions :

- soit le matériel est en fin de vie (3 ans en usage quotidien avec un /tmp en tmpfs et
principalement de la navigation web et mail),

- soit le dernier noyau de la serie 4.9 introduit une régression concernant les
filesystems en sortie de veille

Est-ce quelqu'un à rencontré ce problème ?

Comment auditer un SSD pour connaitre son état d'usure ? sachant que hdparm et smart-tool
ne remontent rien de spécialement alarmant

++

Mourad
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
BERTRAND Joël
Le #26426915
C. Mourad Jaber a écrit :
Bonjour,

Bonsoir,
J'ai eu plusieurs plantages "violents" avec mon laptop... A priori c'est
lié à la sortie de veille.
Au bout d'un certain nombre de cycles de sortie de veille, le laptop se
met à chauffer et la console est inondée de read error, de ext4 failure
et autre insulte du file system...
Tous les processes se figent en l'attente du disque et je suis obliger
d'éteindre l'ordinateur...
Après redémarrage tout va bien...
N'ayant qu'une connaissance limité des SSD, je me pose plusieurs
questions :
- soit le matériel est en fin de vie (3 ans en usage quotidien avec un
/tmp en tmpfs et principalement de la navigation web et mail),
- soit le dernier noyau de la serie 4.9 introduit une régression
concernant les filesystems en sortie de veille...

Je n'ai rien observé de tel.
Est-ce quelqu'un à rencontré ce problème ?
Comment auditer un SSD pour connaitre son état d'usure ? sachant que
hdparm et smart-tool ne remontent rien de spécialement alarmant...

Il y a deux phénomènes. Les SSD (sont des merdes, zut, ça m'a échappé
;-) ) sont soumis au vieillissement des cellules, à leur firmware et aux
problèmes de température. Au-delà de 55°C, on commence à voir des
erreurs de lecture qui disparaissent à froid (il y a des codes
correcteur d'erreur assez puissant à l'intérieur en règle générale).
Si la machine commence à chauffer, pas étonnant. Pour information, la
durée de vie d'un SSD tout venant (c'est-à-dire MLC, les TLC sont encore
plus merdique, mais plus rapides et moins chers) à 60°C est de quelques
mois. J'en ai plusieurs milliers dans la nature et je commence à pouvoir
faire des statistiques intéressantes. Les SLC tiennent beaucoup plus
longtemps mais sont plus lents.
De toute façon, au bout de trois ans, ça m'étonnerait que ce soit une
usure des cellules. Tout au plus un problème de firmware ou de
température. Le symptôme est alors un fs qui se met à la suite d'une
erreur en lecture seule et la console qui balance des tas d'I/O error.
Certains firmwares déconnectent carrément le lecteur lorsqu'il détecte
un problème (cas des Vertex d'OCZ). C'est assez désagréablecar là, le fs
est complètement en morceau. Je ne sais pas pourquoi, mais je parie sur
un firmware qui déconnecte le disque...
Cordialement,
JKB
PS: pour info, dans les applications critiques et embarquées, on voit de
plus en plus de demandes sur des vrais disques durs en raid1 qui
préviennent avant de tomber en panne. Chez Toshiba (Fujitsu réétiqueté)
se trouve un disque capable de fonctionner à 95°C et de supporter je ne
sais plus combien de g en fonctionnement. 300 € le disque, 320 Go, et on
n'a plus de problème ;-)
Publicité
Poster une réponse
Anonyme