Gel du PC

Le
Doug713705
Bonjour/soir à toutes/tous,

Depuis quelques temps il arrive que mon PC se fige et bien que certaines
actions (saisie au clavier/mouvement souris) soient (souvent mais pas
systématiquement) encore possibles il est impossible de se sortir de cette
situation autrement que par un "hard reset".

Dans cette situation si je tente un dmesg, j'ai un beau "Erreur d'entrée/
sortie" qui s'affiche et c'est a peu près le seul message qui s'afiche
quelle que soit la commande que je tape.

Cette situation est survenue ce soir et après avoir rebooté, voici ce que
je trouve de suspect dans syslog :

kernel: ata1.00: irq_stat 0x08000000, interface fatal error
kernel: ata1: SError: { UnrecovData HostInt 10B8B BadCRC }
kernel: ata1.00: cmd c8/00:20:70:93:fa/00:00:00:00:00/e6 tag 0 dma 16384 in
kernel: res 50/00:00:77:a3:fa/00:00:06:00:00/e6 Emask 0x50 (ATA bus error)
kernel: ata1.00: status: { DRDY }
kernel: ata1.00: exception Emask 0x10 SAct 0x0 SErr 0x280100 action 0x6
frozen

J'ai du mal à croire (on ne croit jamais à ces choses là jusqu'à ce que ça
nous arrive) à la mort imminente de l'un de mes disques durs et c'est
pourquoi je soumet ce problème à votre sagacité.

Infos complémentaires :
Linux 2.6.27.6 (compilation maison) / Slamd64
Intel CoreDuo X6800 / ASUS P5Q (AHCI activé)
HDD : 2 * Western Digital SATA 250Go (Ni RAID , ni LVM)

--
@+
Doug - Linux user #307925 - Slamd64 roulaize ;-)
[ Plus ou moins avec une chance de peut-être ]
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses Page 1 / 2
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Fabien LE LEZ
Le #19017871
On Mon, 30 Mar 2009 23:50:55 +0200 (CEST), Doug713705

J'ai du mal à croire (on ne croit jamais à ces choses là jusqu'à ce que ça
nous arrive) à la mort imminente de l'un de mes disques durs



C'est pourtant fréquent.

Le mieux est de le tester avec un utilitaire fourni par le
constructeur. Cf le site web du constructeur en question.

Accessoirement, assure-toi que les câbles sont bien branchés et en bon
état. Et teste ta RAM (avec memtest86+) si tu ne l'as pas déjà fait :
les barrettes défectueuses, ou incompatibles avec la carte mère, c'est
malheureusement très fréquent.
Rasmus
Le #19018221
Doug713705 a écrit :
Bonjour/soir à toutes/tous,

Depuis quelques temps il arrive que mon PC se fige et bien que certaines
actions (saisie au clavier/mouvement souris) soient (souvent mais pas
systématiquement) encore possibles il est impossible de se sortir de cette
situation autrement que par un "hard reset".

Dans cette situation si je tente un dmesg, j'ai un beau "Erreur d'entrée/
sortie" qui s'affiche et c'est a peu près le seul message qui s'afiche
quelle que soit la commande que je tape.

Cette situation est survenue ce soir et après avoir rebooté, voici ce que
je trouve de suspect dans syslog :

kernel: ata1.00: irq_stat 0x08000000, interface fatal error
kernel: ata1: SError: { UnrecovData HostInt 10B8B BadCRC }
kernel: ata1.00: cmd c8/00:20:70:93:fa/00:00:00:00:00/e6 tag 0 dma 16384 in
kernel: res 50/00:00:77:a3:fa/00:00:06:00:00/e6 Emask 0x50 (ATA bus error)
kernel: ata1.00: status: { DRDY }
kernel: ata1.00: exception Emask 0x10 SAct 0x0 SErr 0x280100 action 0x6
frozen

J'ai du mal à croire (on ne croit jamais à ces choses là jusqu'à ce que ça
nous arrive) à la mort imminente de l'un de mes disques durs et c'est
pourquoi je soumet ce problème à votre sagacité.

Infos complémentaires :
Linux 2.6.27.6 (compilation maison) / Slamd64
Intel CoreDuo X6800 / ASUS P5Q (AHCI activé)
HDD : 2 * Western Digital SATA 250Go (Ni RAID , ni LVM)



Essaie un truc tout bête: laisse à demeure un CD dans le lecteur (c'est
la seule solution que j'ai pu glaner sur le net pour résoudre le freeze
de mon portable récurent depuis 2 ou 3 ans - en fait a partir d'une
certaine version de Kernel)

Ras'
YBM
Le #19018661
Doug713705 a écrit :
... voici ce que
je trouve de suspect dans syslog :

kernel: ata1.00: irq_stat 0x08000000, interface fatal error
kernel: ata1: SError: { UnrecovData HostInt 10B8B BadCRC }
kernel: ata1.00: cmd c8/00:20:70:93:fa/00:00:00:00:00/e6 tag 0 dma 16384 in
kernel: res 50/00:00:77:a3:fa/00:00:06:00:00/e6 Emask 0x50 (ATA bus error)
kernel: ata1.00: status: { DRDY }
kernel: ata1.00: exception Emask 0x10 SAct 0x0 SErr 0x280100 action 0x6
frozen



Qu'est-ce que montre la comande suivante (à faire en root) ?

smartctl -a /dev/sda
Yannick Palanque
Le #19018731
Doug713705 écrivit :
Bonjour/soir à toutes/tous,

Depuis quelques temps il arrive que mon PC se fige et bien que
certaines actions (saisie au clavier/mouvement souris) soient (souvent
mais pas systématiquement) encore possibles il est impossible de se
sortir de cette situation autrement que par un "hard reset".

Dans cette situation si je tente un dmesg, j'ai un beau "Erreur
d'entrée/ sortie" qui s'affiche et c'est a peu près le seul message
qui s'afiche quelle que soit la commande que je tape.

Cette situation est survenue ce soir et après avoir rebooté, voici ce
que je trouve de suspect dans syslog :

kernel: ata1.00: irq_stat 0x08000000, interface fatal error
kernel: ata1: SError: { UnrecovData HostInt 10B8B BadCRC }
kernel: ata1.00: cmd c8/00:20:70:93:fa/00:00:00:00:00/e6 tag 0 dma
16384 in kernel: res 50/00:00:77:a3:fa/00:00:06:00:00/e6 Emask 0x50
(ATA bus error) kernel: ata1.00: status: { DRDY }
kernel: ata1.00: exception Emask 0x10 SAct 0x0 SErr 0x280100 action
0x6 frozen

J'ai du mal à croire (on ne croit jamais à ces choses là jusqu'à ce
que ça nous arrive) à la mort imminente de l'un de mes disques durs



C'est pourtant ce qui semble se passer. Fais vite de dernières
sauvegardes.

--
« Quand je serai grand, je ferai des bug reports sur la LKML »
-- Octane in fcolm
Claude PARMENTIER
Le #19025741
On Mon, 30 Mar 2009 23:50:55 +0200 (CEST), Doug713705

Bonjour/soir à toutes/tous,

Depuis quelques temps il arrive que mon PC se fige et bien que certaines
actions (saisie au clavier/mouvement souris) soient (souvent mais pas
systématiquement) encore possibles il est impossible de se sortir de cette
situation autrement que par un "hard reset".

Dans cette situation si je tente un dmesg, j'ai un beau "Erreur d'entrée/
sortie" qui s'affiche et c'est a peu près le seul message qui s'afiche
quelle que soit la commande que je tape.

Cette situation est survenue ce soir et après avoir rebooté, voici ce que
je trouve de suspect dans syslog :

kernel: ata1.00: irq_stat 0x08000000, interface fatal error
kernel: ata1: SError: { UnrecovData HostInt 10B8B BadCRC }
kernel: ata1.00: cmd c8/00:20:70:93:fa/00:00:00:00:00/e6 tag 0 dma 16384 in
kernel: res 50/00:00:77:a3:fa/00:00:06:00:00/e6 Emask 0x50 (ATA bus error)
kernel: ata1.00: status: { DRDY }
kernel: ata1.00: exception Emask 0x10 SAct 0x0 SErr 0x280100 action 0x6
frozen

J'ai du mal à croire (on ne croit jamais à ces choses là jusqu'à ce que ça
nous arrive) à la mort imminente de l'un de mes disques durs et c'est
pourquoi je soumet ce problème à votre sagacité.

Infos complémentaires :
Linux 2.6.27.6 (compilation maison) / Slamd64
Intel CoreDuo X6800 / ASUS P5Q (AHCI activé)
HDD : 2 * Western Digital SATA 250Go (Ni RAID , ni LVM)




Est ce que le smart du bios est bien activé et est ce qu'il y a un
message du S.M.A.R.T au demmarrage de la machine (avant le boot) ?
Doug713705
Le #19023291
Le Tue, 31 Mar 2009 07:33:37 +0200, Rasmus a écrit dans
news:49d1ab31$0$23991$ des mots en forme de phrase
pour nous dire :

Essaie un truc tout bête: laisse à demeure un CD dans le lecteur (c'est
la seule solution que j'ai pu glaner sur le net pour résoudre le freeze
de mon portable récurent depuis 2 ou 3 ans - en fait a partir d'une
certaine version de Kernel)



Pas de lecteur CD/DVD sur cette machine.
Pour ma part, j'ai lu que le problème pourrait venir de la libsata. Mais
rien de réellement pertinent et surtout aucune solution.
:-(

--
@+
Doug - Linux user #307925 - Slamd64 roulaize ;-)
[ Plus ou moins avec une chance de peut-être ]
Doug713705
Le #19023271
Le Tue, 31 Mar 2009 08:57:02 +0200, YBM a écrit dans
news:49d1bebe$0$27575$ des mots en forme de phrase
pour nous dire :


Qu'est-ce que montre la comande suivante (à faire en root) ?

smartctl -a /dev/sda




A part un message d'échec sur la température, rien ne me semble suspect
(mais je n'ai pas trop les compétences pour en juger)



# smartctl -a /dev/sda
smartctl version 5.38 [x86_64-slamd64-linux-gnu] Copyright (C) 2002-8 Bruce
Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION == Model Family: Western Digital Caviar Second Generation Serial ATA family
Device Model: WDC WD2500KS-00MJB0
Serial Number: WD-WCANK4013179
Firmware Version: 02.01C03
User Capacity: 250 059 350 016 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 7
ATA Standard is: Exact ATA specification draft version not indicated
Local Time is: Tue Mar 31 19:39:57 2009 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION == SMART overall-health self-assessment test result: PASSED
See vendor-specific Attribute list for marginal Attributes.

General SMART Values:
Offline data collection status: (0x84) Offline data collection activity
was suspended by an interrupting
command from host.
Auto Offline Data Collection:
Enabled.
Self-test execution status: ( 0) The previous self-test routine
completed
without error or no self-test has
ever
been run.
Total time to complete Offline
data collection: (7680) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off
support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 90) minutes.
Conveyance self-test routine
recommended polling time: ( 6) minutes.
SCT capabilities: (0x103f) SCT Status supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED
WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 200 200 051 Pre-fail
Always - 0
3 Spin_Up_Time 0x0003 243 186 021 Pre-fail
Always - 2850
4 Start_Stop_Count 0x0032 100 100 000 Old_age
Always - 972
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail
Always - 0
7 Seek_Error_Rate 0x000f 200 200 051 Pre-fail
Always - 0
9 Power_On_Hours 0x0032 087 087 000 Old_age
Always - 9594
10 Spin_Retry_Count 0x0013 100 100 051 Pre-fail
Always - 0
11 Calibration_Retry_Count 0x0012 100 100 051 Old_age
Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age
Always - 962
190 Airflow_Temperature_Cel 0x0022 044 012 045 Old_age Always
FAILING_NOW 56
194 Temperature_Celsius 0x0022 094 062 000 Old_age
Always - 56
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age
Always - 0
197 Current_Pending_Sector 0x0012 200 200 000 Old_age
Always - 0
198 Offline_Uncorrectable 0x0010 200 200 000 Old_age
Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age
Always - 393
200 Multi_Zone_Error_Rate 0x0009 200 200 051 Pre-fail
Offline - 0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.


--
@+
Doug - Linux user #307925 - Slamd64 roulaize ;-)
[ Plus ou moins avec une chance de peut-être ]
Doug713705
Le #19023261
Le Tue, 31 Mar 2009 09:12:42 +0200, Yannick Palanque a écrit dans
news: des mots en forme de
phrase pour nous dire :

C'est pourtant ce qui semble se passer. Fais vite de dernières
sauvegardes.




Ce qui me perturbe c'est que le problème ne semble survenir que sous Linux
alors que le disque qui semble être incriminé héberge une partition système
Windows.


--
@+
Doug - Linux user #307925 - Slamd64 roulaize ;-)
[ Plus ou moins avec une chance de peut-être ]
Doug713705
Le #19023401
Le Tue, 31 Mar 2009 11:56:55 +0200, Claude PARMENTIER a écrit dans
news: des mots en forme de
phrase pour nous dire :

Est ce que le smart du bios est bien activé



Oui

et est ce qu'il y a un message du S.M.A.R.T au demmarrage
de la machine (avant le boot) ?



Je n'ai rien remarqué de particulier mais la machine ne reboot pas souvent.

Rien de particulier dans dmesg.
De ce que je comprends des différents logs, c'est comme si le lien SATA se
coupait puis reprenait.
Par exemple, les dernières lignes de dmesg sont les suivantes :

ata1.00: exception Emask 0x10 SAct 0x0 SErr 0x280100 action 0x6 frozen
ata1.00: irq_stat 0x08000000, interface fatal error
ata1: SError: { UnrecovData 10B8B BadCRC }
ata1.00: cmd c8/00:08:d8:a3:09/00:00:00:00:00/e6 tag 0 dma 4096 in
res 50/00:00:77:a4:75/00:00:08:00:00/e8 Emask 0x10 (ATA bus error)
ata1.00: status: { DRDY }
ata1: hard resetting link
ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
ata1.00: configured for UDMA/133
ata1: EH complete

syslog me raconte la même chose hormis la partie hard-reset.
C'est arrivé à 4H40 ce matin alors que personne n'utilisait la machine (un
utilisateur loggué avec session X ouverte mais aucune activité réèlle).

J'ai l'impression qu'il y a une perte du "lien SATA" et que la plupart du
temps le noyau rattrape le coup mais par moment il n'y arrive pas et là
c'est le drame !

--
@+
Doug - Linux user #307925 - Slamd64 roulaize ;-)
[ Plus ou moins avec une chance de peut-être ]
Fabien LE LEZ
Le #19023551
On Tue, 31 Mar 2009 19:44:55 +0200 (CEST), Doug713705

Ce qui me perturbe c'est que le problème ne semble survenir que sous Linux
alors que le disque qui semble être incriminé héberge une partition système
Windows.



Ça peut très bien venir d'un endroit précis du disque.

J'ai eu ce souci il y a quelques mois avec un SATA Samsung : chaque
tentative d'accès à un endroit précis du disque (plusieurs Go quand
même) bloquait la machine pendant plusieurs secondes (et, sous
Windows, finissait par bloquer tout le système), alors qu'un accès à
un autre endroit fonctionnait parfaitement.

Donc, oui, sauvegarde, puis (par exemple) badblocks pour repérer
l'endroit du disque qui foire, et enfin, SAV.
Publicité
Poster une réponse
Anonyme