Pb sur FreeBSD/alpha

Stephane Dupille

01/12/2005 à 13:10

Stephane Dupille wrote:
Le truc, c'est que je n'arrive pas bien à comprendre ce qu'il s'est
passé. Il y aurait un disque qui montre des signes de faiblesse ?
Oui, "(#da/5) I/O read failure" et manque de pot, le secteur défectueux

se trouvait dans le swap

Argh !

Comme c'est du disque Scuzzy, tu peux tenter un formatage bas niveau
avec les outils (MS/DOS ...) du constructeur, ça te marquera les bad
blocks. Ca ne peu rien contre un atterrissage de têtes, bien entendu.

Hum. C'est une alpha, alors le disque MS-DOS fournit par le
constructeur, ben... on oublie.

--
J'ai essayé de creer un news un alt.west.virginia ou sur d'autres
alt.west.wirginia.xxx mais quand je vais sur ces forums rien n'apparait?
l'emetteur d'un new recoit il un avertissement si celui ci est censuré?
-+- LM in: <http://www.le-gnu.net> - Bien sansurer ses news sur C-I -+-

Stephane Dupille

01/12/2005 à 14:29

Stephane Dupille wrote:

Le truc, c'est que je n'arrive pas bien à comprendre ce qu'il s'est
passé. Il y aurait un disque qui montre des signes de faiblesse ?

Oui, "(#da/5) I/O read failure" et manque de pot, le secteur défectueux
se trouvait dans le swap

Comme c'est du disque Scuzzy, tu peux tenter un formatage bas niveau
avec les outils (MS/DOS ...) du constructeur, ça te marquera les bad
blocks. Ca ne peu rien contre un atterrissage de têtes, bien entendu.

J'ai installé les outils S.M.A.R.T. pour investiguer un peu ce qu'il
se passe, voici le résultat :

smartctl version 5.33 [alpha-portbld-freebsd4.10] Copyright (C) 2002-4 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

Device: COMPAQ BB00923468 Version: 3B07
Serial number: 3BN0SHF100007113K0VA
Device type: disk
Local Time is: Thu Dec 1 14:23:57 2005 CET
Device supports SMART and is Enabled
Temperature Warning Enabled
Request Sense failed, [Operation not permitted]
Vendor (Seagate) cache information
Blocks sent to initiator = 3008427752
Blocks received from initiator = 222846771
Blocks read from cache and sent to initiator = 49408695
Number of read and write commands whose size <= segment size = 32111463
Number of read and write commands whose size > segment size = 0
Vendor (Seagate/Hitachi) factory information
number of hours powered up = 6866.12
number of minutes until next internal SMART test = 16

Error counter log:
Errors Corrected by Total Correction Gigabytes Total
EEC rereads/ errors algorithm processed uncorrected
fast | delayed rewrites corrected invocations [10^9 bytes] errors
read: 26706 0 0 26706 26706 2441.184 0
write: 0 0 0 0 0 148.746 0

Non-medium error count: 0

Error Events logging not supported

SMART Self-test log
Num Test Status segment LifeTime LBA_first_err [SK ASC ASQ]
Description number (hours)
# 1 Background short Completed - 4 - [- - -]

Long (extended) Self Test duration: 594 seconds [9.9 minutes]

Désolé pour les longueurs de ligne. Ca ne me semble pas préoccupant pour le moment.

Je vais lancer smartd et monitorer ce qu'il se passe.

--
Désolé, je suis vraiement trop con (mais je l'admet), j'y comprends rien
à ces "kill file", pour moi c'est juste une sorte de censure/mépris public.
-+- GA in <http://www.le-gnu.net> - N'avouez jamais. -+-

Stephane Dupille <sdupille@NOSPAM.fr.eu.org> wrote:

Le truc, c'est que je n'arrive pas bien à comprendre ce qu'il s'est
passé. Il y aurait un disque qui montre des signes de faiblesse ?

Oui, "(#da/5) I/O read failure" et manque de pot, le secteur défectueux
se trouvait dans le swap

Comme c'est du disque Scuzzy, tu peux tenter un formatage bas niveau
avec les outils (MS/DOS ...) du constructeur, ça te marquera les bad
blocks. Ca ne peu rien contre un atterrissage de têtes, bien entendu.

J'ai installé les outils S.M.A.R.T. pour investiguer un peu ce qu'il
se passe, voici le résultat :

smartctl version 5.33 [alpha-portbld-freebsd4.10] Copyright (C) 2002-4 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

Device: COMPAQ BB00923468 Version: 3B07
Serial number: 3BN0SHF100007113K0VA
Device type: disk
Local Time is: Thu Dec 1 14:23:57 2005 CET
Device supports SMART and is Enabled
Temperature Warning Enabled
Request Sense failed, [Operation not permitted]
Vendor (Seagate) cache information
Blocks sent to initiator = 3008427752
Blocks received from initiator = 222846771
Blocks read from cache and sent to initiator = 49408695
Number of read and write commands whose size <= segment size = 32111463
Number of read and write commands whose size > segment size = 0
Vendor (Seagate/Hitachi) factory information
number of hours powered up = 6866.12
number of minutes until next internal SMART test = 16

Error counter log:
Errors Corrected by Total Correction Gigabytes Total
EEC rereads/ errors algorithm processed uncorrected
fast | delayed rewrites corrected invocations [10^9 bytes] errors
read: 26706 0 0 26706 26706 2441.184 0
write: 0 0 0 0 0 148.746 0

Non-medium error count: 0

Error Events logging not supported

SMART Self-test log
Num Test Status segment LifeTime LBA_first_err [SK ASC ASQ]
Description number (hours)
# 1 Background short Completed - 4 - [- - -]

Long (extended) Self Test duration: 594 seconds [9.9 minutes]

Désolé pour les longueurs de ligne. Ca ne me semble pas préoccupant pour le moment.

Je vais lancer smartd et monitorer ce qu'il se passe.

--
Désolé, je suis vraiement trop con (mais je l'admet), j'y comprends rien
à ces "kill file", pour moi c'est juste une sorte de censure/mépris public.
-+- GA in <http://www.le-gnu.net> - N'avouez jamais. -+-

Vous avez filtré cet utilisateur ! Consultez son message

Stephane Dupille wrote:

Le truc, c'est que je n'arrive pas bien à comprendre ce qu'il s'est
passé. Il y aurait un disque qui montre des signes de faiblesse ?

Oui, "(#da/5) I/O read failure" et manque de pot, le secteur défectueux
se trouvait dans le swap

Comme c'est du disque Scuzzy, tu peux tenter un formatage bas niveau
avec les outils (MS/DOS ...) du constructeur, ça te marquera les bad
blocks. Ca ne peu rien contre un atterrissage de têtes, bien entendu.

J'ai installé les outils S.M.A.R.T. pour investiguer un peu ce qu'il
se passe, voici le résultat :

smartctl version 5.33 [alpha-portbld-freebsd4.10] Copyright (C) 2002-4 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

Device: COMPAQ BB00923468 Version: 3B07
Serial number: 3BN0SHF100007113K0VA
Device type: disk
Local Time is: Thu Dec 1 14:23:57 2005 CET
Device supports SMART and is Enabled
Temperature Warning Enabled
Request Sense failed, [Operation not permitted]
Vendor (Seagate) cache information
Blocks sent to initiator = 3008427752
Blocks received from initiator = 222846771
Blocks read from cache and sent to initiator = 49408695
Number of read and write commands whose size <= segment size = 32111463
Number of read and write commands whose size > segment size = 0
Vendor (Seagate/Hitachi) factory information
number of hours powered up = 6866.12
number of minutes until next internal SMART test = 16

Error counter log:
Errors Corrected by Total Correction Gigabytes Total
EEC rereads/ errors algorithm processed uncorrected
fast | delayed rewrites corrected invocations [10^9 bytes] errors
read: 26706 0 0 26706 26706 2441.184 0
write: 0 0 0 0 0 148.746 0

Non-medium error count: 0

Error Events logging not supported

SMART Self-test log
Num Test Status segment LifeTime LBA_first_err [SK ASC ASQ]
Description number (hours)
# 1 Background short Completed - 4 - [- - -]

Long (extended) Self Test duration: 594 seconds [9.9 minutes]

Désolé pour les longueurs de ligne. Ca ne me semble pas préoccupant pour le moment.

Je vais lancer smartd et monitorer ce qu'il se passe.

--
Désolé, je suis vraiement trop con (mais je l'admet), j'y comprends rien
à ces "kill file", pour moi c'est juste une sorte de censure/mépris public.
-+- GA in <http://www.le-gnu.net> - N'avouez jamais. -+-

Manuel Bouyer

01/12/2005 à 16:50

Xavier wrote:

Stephane Dupille wrote:

Le truc, c'est que je n'arrive pas bien à comprendre ce qu'il s'est
passé. Il y aurait un disque qui montre des signes de faiblesse ?

Oui, "(#da/5) I/O read failure" et manque de pot, le secteur défectueux
se trouvait dans le swap

Comme c'est du disque Scuzzy, tu peux tenter un formatage bas niveau
avec les outils (MS/DOS ...) du constructeur, ça te marquera les bad
blocks. Ca ne peu rien contre un atterrissage de têtes, bien entendu.

Je trouve tres etrange qu'il n'ai pas mis de message d'erreur plus explicite.
Comme c'est du scuzzy le disque a du reporter un ASC/ASQ que le kernel aurait
du afficher, eventuellement avec le message d'erreur associe (mais ca
fait longtemps que je n'ai pas regarde freebsd de pres, peut-etre que
maintenant le kernel garde ces infos pour lui, mais ca m'etonnerais quand
meme).
A cause du bus reset, je pencherais plutot pour un probleme de driver de
la carte SCSI, ou un probleme sur le bus (connecteur oxyde, cable trop
long, etc ...)

--
Manuel Bouyer
NetBSD: 26 ans d'experience feront toujours la difference
--

Stephane Dupille

01/12/2005 à 17:06

Je trouve tres etrange qu'il n'ai pas mis de message d'erreur plus explicite.
Comme c'est du scuzzy le disque a du reporter un ASC/ASQ que le kernel aurait
du afficher, eventuellement avec le message d'erreur associe (mais ca
fait longtemps que je n'ai pas regarde freebsd de pres, peut-etre que
maintenant le kernel garde ces infos pour lui, mais ca m'etonnerais quand
meme).

Je ne suis pas familier avec SMART, mais le disque n'aurait pas
mémorisé l'erreur, si erreur il y a eu ?

A cause du bus reset, je pencherais plutot pour un probleme de driver de
la carte SCSI, ou un probleme sur le bus (connecteur oxyde, cable trop
long, etc ...)

Il s'agit d'un pb totalement isolé que ne s'est pas répété jusqu'à
maintenant. S'il y avait un pb de bus, je pense AMHA qu'il se serait
répété (même s'il est encore un peu tôt pour dire que cela ne s'est
pas reproduit, mais la machine a fonctionné plus de 8 heures
maintenant avec sa charge habituelle).

--
Mettons la pantoufle dans la FAQ avant l'UDP.
-+- GS in <http://www.le-gnu.net> : LA FAQ c'est le pied -+-

Manuel Bouyer

01/12/2005 à 22:19

Stephane Dupille wrote:

Je trouve tres etrange qu'il n'ai pas mis de message d'erreur plus explicite.
Comme c'est du scuzzy le disque a du reporter un ASC/ASQ que le kernel aurait
du afficher, eventuellement avec le message d'erreur associe (mais ca
fait longtemps que je n'ai pas regarde freebsd de pres, peut-etre que
maintenant le kernel garde ces infos pour lui, mais ca m'etonnerais quand
meme).

Je ne suis pas familier avec SMART, mais le disque n'aurait pas
mémorisé l'erreur, si erreur il y a eu ?

Si c'est une erreur du disque, il aurait du la compter je pense (mais
je ne suis pas tres familier avec smart non plus).

A cause du bus reset, je pencherais plutot pour un probleme de driver de
la carte SCSI, ou un probleme sur le bus (connecteur oxyde, cable trop
long, etc ...)

Il s'agit d'un pb totalement isolé que ne s'est pas répété jusqu'à
maintenant. S'il y avait un pb de bus, je pense AMHA qu'il se serait
répété (même s'il est encore un peu tôt pour dire que cela ne s'est
pas reproduit, mais la machine a fonctionné plus de 8 heures
maintenant avec sa charge habituelle).

Ca peut etre un parasite du a une source externe. Y'a pas un
gros moteur electrique a cote ? :)
Plus serieusement, j'ai vu ce type de problemes sur des bus SCSI, et
c'etait aleatoire. Ca faisait plusieurs erreurs en rafale, avec des
fois plusieurs semaines de fonctonnement sans problemes entre les
erreurs.

--
Manuel Bouyer
NetBSD: 26 ans d'experience feront toujours la difference
--

Stephane Dupille

02/12/2005 à 11:42

Si c'est une erreur du disque, il aurait du la compter je pense (mais
je ne suis pas tres familier avec smart non plus).

Je pense aussi. Mais smartd est capricieux chez moi : des fois il
détecte les disques, des fois non. Je ne vais pas faire confiance à
cet outil très longtemps je sens...

Ca peut etre un parasite du a une source externe. Y'a pas un
gros moteur electrique a cote ? :)

Non, rien de tout ça. C'est une machine qui est sous mon bureau,
chez moi, alors que je ne l'utilise exclusivement qu'à distance depuis
le boulot : elle n'a pas d'écran ni clavier ni rien. Au pire, y'a une
borne wifi qui est à 1m d'elle.

Plus serieusement, j'ai vu ce type de problemes sur des bus SCSI, et
c'etait aleatoire. Ca faisait plusieurs erreurs en rafale, avec des
fois plusieurs semaines de fonctonnement sans problemes entre les
erreurs.

C'est curieux. On vé dejà atttendre que ça se reproduise, si jamais
ça se reproduit. Et puis on verra bien.

Mais il est vrai qu'un démontage pour dépoussiérage ne serait pas
forcément une mauvaise chose.

Merci pour les avis !

--
Elle est bien, ta réponse, Benoît, mais il y a trop de smiley. Est-ce
que cela ne risque pas de diminuer le sérieux de ton propos ?
-+- DM in : GNU <http://neuneu.ctw.cc> - Restons sérieux quoi ! -+-

Pb sur FreeBSD/alpha

6 réponses

Veuillez sélectionner un problème