OVH Cloud OVH Cloud

lenteur disque (Í  confirmer)

14 réponses
Avatar
Christophe PEREZ
Bonjour,

J'ai un (vieux) PC sous Gentoo que je trouve subitement (vraiment du
jour au lendemain) très très lent.
Pour vous donner une idée de cette lenteur, habituellement, son backup
complet de 6Go par bacula se fait en 10mn environ. LÍ , il en est Í 
220Mo en 50mn.
J'ai d'abord pensé que ça pouvait être un pb réseau (il est en filaire)
mais les tests que j'ai pu faire (simple wget gros fichier) n'ont rien
rélévé d'anormal.
Ce n'est pas de la charge proc (un Quad core), un top ne donne rien du
tout.
Il ne s'est rien passé au niveau logiciel Í  ce moment entre temps, pas
la moindre mise Í  jour.

J'en déduis que ça pourrait être un problème de lenteur disque.
Ce PC contient le premier SSD que j'ai eu, et je n'ai aucune expérience
de SSD défaillant.
Le résultat d'un hdparm -tT /dev/sdb me laisse sceptique par rapport Í 
mes autres PC avec SSD :
/dev/sdb:
Timing cached reads: 2694 MB in 2.00 seconds = 1347.05 MB/sec
Timing buffered disk reads: 390 MB in 3.00 seconds = 129.87 MB/sec

Un smartctl -l ne m'indique rien de particulier Í  mes yeux.
Voici le smartctl -a
=== START OF INFORMATION SECTION ===
Model Family: SandForce Driven SSDs
Device Model: KINGSTON SV300S37A120G
Serial Number: 50026B776B030418
LU WWN Device Id: 5 0026b7 76b030418
Firmware Version: 60AABBF0
User Capacity: 120 034 123 776 bytes [120 GB]
Sector Size: 512 bytes logical/physical
Rotation Rate: Solid State Device
TRIM Command: Available
Device is: In smartctl database [for details use: -P show]
ATA Version is: ATA8-ACS, ACS-2 T13/2015-D revision 3
SATA Version is: SATA 3.0, 6.0 Gb/s (current: 1.5 Gb/s)
Local Time is: Sun Dec 5 18:56:31 2021 AST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x03) Offline data collection activity
is in progress.
Auto Offline Data Collection:
Disabled. Self-test execution status: ( 243) Self-test routine in
progress... 30% of test remaining.
Total time to complete Offline
data collection: ( 612) seconds.
Offline data collection
capabilities: (0x7d) SMART execute Offline immediate.
No Auto Offline data collection
support. Abort Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging
supported. Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 48) minutes.
Conveyance self-test routine
recommended polling time: ( 2) minutes.
SCT capabilities: (0x0025) SCT Status supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE
UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x0032 095
095 050 Old_age Always - 0/4950862 5
Retired_Block_Count 0x0033 100 100 003 Pre-fail Always
- 0 9 Power_On_Hours_and_Msec 0x0032 093 093 000
Old_age Always - 6874h+49m+23.340s 12 Power_Cycle_Count
0x0032 098 098 000 Old_age Always - 2349 171
Program_Fail_Count 0x000a 100 100 000 Old_age Always
- 0 172 Erase_Fail_Count 0x0032 100 100 000
Old_age Always - 0 174 Unexpect_Power_Loss_Ct 0x0030
000 000 000 Old_age Offline - 187 177
Wear_Range_Delta 0x0000 000 000 000 Old_age Offline
- 3 181 Program_Fail_Count 0x000a 100 100 000
Old_age Always - 0 182 Erase_Fail_Count 0x0032
100 100 000 Old_age Always - 0 187
Reported_Uncorrect 0x0012 100 100 000 Old_age Always
- 0 189 Airflow_Temperature_Cel 0x0000 045 058 000
Old_age Offline - 45 (Min/Max 20/58) 194
Temperature_Celsius 0x0022 045 058 000 Old_age Always
- 45 (Min/Max 20/58) 195 ECC_Uncorr_Error_Count 0x001c 120
120 000 Old_age Offline - 0/4950862 196
Reallocated_Event_Count 0x0033 100 100 003 Pre-fail Always
- 0 201 Unc_Soft_Read_Err_Rate 0x001c 120 120 000
Old_age Offline - 0/4950862 204 Soft_ECC_Correct_Rate
0x001c 120 120 000 Old_age Offline - 0/4950862
230 Life_Curve_Status 0x0013 100 100 000 Pre-fail
Always - 100 231 SSD_Life_Left 0x0000 098 098
011 Old_age Offline - 4294967297 233
SandForce_Internal 0x0032 000 000 000 Old_age Always
- 9808 234 SandForce_Internal 0x0032 000 000 000
Old_age Always - 14818 241 Lifetime_Writes_GiB 0x0032
000 000 000 Old_age Always - 14818 242
Lifetime_Reads_GiB 0x0032 000 000 000 Old_age Always
- 24259 244 Unknown_Attribute 0x0000 098 098 010
Old_age Offline - 6881342

SMART Error Log not supported

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining
LifeTime(hours) LBA_of_first_error # 1 Short offline Completed
without error 00% 2908 - # 2 Short offline
Completed without error 00% 2903 - # 3 Short
offline Completed without error 00% 2887 - # 4
Short offline Completed without error 00% 2876
- # 5 Short offline Completed without error 00% 2870
- # 6 Short offline Completed without error 00%
2861 - # 7 Short offline Completed without error
00% 2851 - # 8 Short offline Completed without
error 00% 2843 - # 9 Short offline Completed
without error 00% 2836 - #10 Short offline
Completed without error 00% 2824 - #11 Short
offline Completed without error 00% 2818 - #12
Short offline Completed without error 00% 2807
- #13 Short offline Completed without error 00% 2797
- #14 Short offline Completed without error 00%
2788 - #15 Short offline Completed without error
00% 2777 - #16 Short offline Completed without
error 00% 2774 - #17 Short offline Completed
without error 00% 2772 - #18 Short offline
Completed without error 00% 2770 - #19 Short
offline Completed without error 00% 2768 - #20
Short offline Interrupted (host reset) 40% 2767
- #21 Short offline Completed without error 00% 2765
-

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute
delay.

Est-ce un disque qui l͢che ?
Je ne vois rien qui le dise, mais je ne vois que ça qui puisse être en
cause.

Merci d'avance.

4 réponses

1 2
Avatar
Marc SCHAEFER
Christophe PEREZ wrote:
Normalement, un simple déchargement/rechargement du module aurait du
suffire pour prendre en charge une option modifiée, non ?

Oui, déconfigurer le réseau, décharger le module, insérer.
verdict, mais actuellement, ça fonctionne après avoir changé de port
sur le switch.

Intéressant!
On en découvre tous les jours.

Exact :)
Avatar
Pascal Hambourg
Le 07/12/2021 Í  15:28, Marc SCHAEFER a écrit :
C'est une piste faible, mais pourquoi pas essayer ce work-around:
cat >> /etc/modprobe.d/forcedeth.conf <<EOF
options forcedeth msix=0
EOF
update-initramfs -u -k all
Puis redémarrer complètement.
Alternative: au démarrage de grub, éditer la ligne de commande (e),
ajouter forcedeth.msix=0, faire CTRL-X pour démarrer.

On peut aussi ne pas redémarrer mais simplement arrêter l'interface
réseau, décharger le module forcedeth [1], le recharger avec le
paramètre et redémarrer et reconfigurer l'interface.
[1] Malheureusement il ne supporte pas la modification des paramètres Í 
chaud via /sys/module/<name>/parameters/.
Avatar
Stéphane CARPENTIER
Le 07-12-2021, Christophe PEREZ a écrit :
la piste du réseau trop tÍ´t. J'avais fait un test sur téléchargement de
fichier de mon serveur http, mais sans doute fichier trop petit (18Mo),
je n'avais pas plus gros sous la main Í  ce moment.

dd if=/dev/random of=mongrosfichier bs24 count00000
Si c'est pas assez gros, tu peux augmenter le nombre de zéros après le
count.
--
Si vous avez du temps Í  perdre :
https://scarpet42.gitlab.io
Avatar
Christophe PEREZ
Le 10 Dec 2021 21:55:19 GMT,
Stéphane CARPENTIER a écrit :
Le 07-12-2021, Christophe PEREZ a écrit :
la piste du réseau trop tÍ´t. J'avais fait un test sur
téléchargement de fichier de mon serveur http, mais sans doute
fichier trop petit (18Mo), je n'avais pas plus gros sous la main Í 
ce moment.

dd if=/dev/random of=mongrosfichier bs24 count00000
Si c'est pas assez gros, tu peux augmenter le nombre de zéros après le
count.

Je n'ai pas dit que je n'avais pas, ou n'étais pas en mesure d'avoir un
fichier plus gros, mais que je n'avais pas plus gros sous la main Í  cet
instant lÍ  sur mon serveur http.
J'ai pensé que la taille était suffisante pour révéler le
défaut, donc, je n'avais aucune raison de chercher plus gros.
1 2