OVH Cloud OVH Cloud

[freebsd] probleme de disque, quarantaine ?

6 réponses
Avatar
patpro
Bonjour,

j'ai sur une de mes vieilles machines des problemes de disques durs. Le
disque dur principal (/, /usr, /var, swap) fonctionne a merveille, mais
les deux disques supplémentaires et non indispensables me font des
misères.
Ce sont des disques ATA100 branchés sur une carte PCI ATA66 avec des
nappes ATA33 (ok, je cherche les ennuis).
Comme ils ne me servent qu'occasionnellement pour des backups, et que de
temps en temps (env. 1 fois tous les 2 mois) la machine crash par leur
faute, necessitant un fsck manuel en single user, je voudrai savoir si
il existe un moyen pour que la machine ne tombe pas complétement quand
elle rencontre un de ces problèmes.

Est il possible via un élément de config (sysctl, fstab, options de
kernel...) de faire en sorte de tout problème sur ces disques déclenche
leur mise en quarantaine, et non plus le crash du système complet ?

Une autre option acceptable serait un reboot automatique sans remonter
les deux disques fautifs.

des idées ?

patpro

--
je cherche un poste d'admin UNIX/Mac
http://patpro.net/cv.php

6 réponses

Avatar
Marwan FeanoR/var Burelle
On Mon, 29 Dec 2003 16:03:05 +0100
patpro wrote:

Est il possible via un élément de config (sysctl, fstab, options de
kernel...) de faire en sorte de tout problème sur ces disques déclenche
leur mise en quarantaine, et non plus le crash du système complet ?



Et si tu ne les monter que quand tu en as besoin (option noauto dans le
fstab, pour pas qu'ils soient monter au boot) ?

Ou bien, même non montés, ils te causent des ennuis ?

Une autre option acceptable serait un reboot automatique sans remonter
les deux disques fautifs.


C'est bien ça, noauto dans le fstab et tu les montes au besoin ...

--
Marwan Burelle,
http://www.lri.fr/~burelle
( | )
http://www.cduce.org

Avatar
patpro
In article ,
Marwan "FeanoR/var" Burelle wrote:

Ou bien, même non montés, ils te causent des ennuis ?


je ne pense pas que non-montés ils posent probleme, tous mes crash ont
eu lieu très exactement à l'heure de lancement du daily, donc c'est
clairement en relation avec un probleme de lecture ou d'écriture.
De plus, les messages d'erreur à l'ecrans sont clairs : il se prend les
pieds dans le kernel au moment d'interagir avec les 2 disques en
question.


Une autre option acceptable serait un reboot automatique sans remonter
les deux disques fautifs.


C'est bien ça, noauto dans le fstab et tu les montes au besoin ...


oki, mais tant que la machine crash comme une bouse elle ne reboote pas
toute seule, et c'est bien la mon problème. Donc le noauto ne résout
qu'une moitié de la question :)

Idealement quand meme, il serait souhaitable qu'un OS solide comme
FreeBSD, et utilisé en environnement serveur ne soit pas à la mercie
d'un problème comme ça. Je trouve ça un peu dingue.

J'ai vu le cas de figure récémment sur un XServe (MacOS X Server), la
machine a perdu un disque quelques minutes apres un reboot, mais rien
n'a bloqué/cassé/planté... Il a été possible d'intervenir sur la machine
via SSH, tout le reste fonctionnant correctement.

Dans mon cas, quand ça plante c'est tellement violent que je n'ai rien
dans les logs et que la machine ne répond meme plus quand on y a acces
physiquement : reboot hard, et fsck obligatoire.

patpro

--
je cherche un poste d'admin UNIX/Mac
http://patpro.net/cv.php


Avatar
Marwan FeanoR/var Burelle
On Mon, 29 Dec 2003 16:47:14 +0100
patpro wrote:

Dans mon cas, quand ça plante c'est tellement violent que je n'ai rien
dans les logs et que la machine ne répond meme plus quand on y a acces
physiquement : reboot hard, et fsck obligatoire.


Ca sera pas un probleme d'alimentation trop faible ton truc ? le fait que
ca coincide avec l'usage des disques tout ça ...

Sinon, ca serait quand même bien de savoir ce qui pose réélement problème
dans tes disques ... (voir ce qui se passe avec 1 seul par exemple ... )

--
Marwan Burelle,
http://www.lri.fr/~burelle
( | )
http://www.cduce.org

Avatar
patpro
In article ,
Marwan "FeanoR/var" Burelle wrote:

Dans mon cas, quand ça plante c'est tellement violent que je n'ai rien
dans les logs et que la machine ne répond meme plus quand on y a acces
physiquement : reboot hard, et fsck obligatoire.


Ca sera pas un probleme d'alimentation trop faible ton truc ? le fait que
ca coincide avec l'usage des disques tout ça ...


hmmm
j'avoue que je n'y ai meme pas pensé, mais j'ai changé l'alim il y'a peu
de temps pour une 300 W, et vu la puissance délirante de la machine
(celeron 300 ou 333) je doute que ce soit ça.

Sinon, ca serait quand même bien de savoir ce qui pose réélement problème
dans tes disques ... (voir ce qui se passe avec 1 seul par exemple ... )


yep, ça je peux tester. De toute maniere il faudra a terme que j'achete
une carte PCI ATA100 ou 133, avec les napes qui vont bien pour voir si
ça ne résoud pas une partie du probleme. Pour l'instant mon budget est
largement bridé par mon futur G5 bi-pro 8)

patpro

--
je cherche un poste d'admin UNIX/Mac
http://patpro.net/cv.php


Avatar
Marwan FeanoR/var Burelle
On Mon, 29 Dec 2003 17:04:34 +0100
patpro wrote:

hmmm
j'avoue que je n'y ai meme pas pensé, mais j'ai changé l'alim il y'a
peu de temps pour une 300 W, et vu la puissance délirante de la machine
(celeron 300 ou 333) je doute que ce soit ça.


Tu sais, en matière de taille d'alim ... j'ai vu un pIII 400 avoir des
problèmes sur une 300W, ce qui compte, c'est aussi ce que tu as avec
(combien de disque et autre périph alliementées par l'alim, quelles cartes
... )

yep, ça je peux tester. De toute maniere il faudra a terme que j'achete
une carte PCI ATA100 ou 133, avec les napes qui vont bien pour voir si
ça ne résoud pas une partie du probleme. Pour l'instant mon budget est
largement bridé par mon futur G5 bi-pro 8)


Héhé ;)

--
Marwan Burelle,
http://www.lri.fr/~burelle
( | )
http://www.cduce.org

Avatar
patpro
In article ,
Marwan "FeanoR/var" Burelle wrote:

On Mon, 29 Dec 2003 17:04:34 +0100
patpro wrote:

hmmm
j'avoue que je n'y ai meme pas pensé, mais j'ai changé l'alim il y'a
peu de temps pour une 300 W, et vu la puissance délirante de la machine
(celeron 300 ou 333) je doute que ce soit ça.


Tu sais, en matière de taille d'alim ... j'ai vu un pIII 400 avoir des
problèmes sur une 300W, ce qui compte, c'est aussi ce que tu as avec
(combien de disque et autre périph alliementées par l'alim, quelles cartes
... )


je pense que si c'etait l'alim les plantages seraient plus systématiques
(ie. à tous les daily).
En terme de charge sur cette 300W j'ai donc un vieux celeron 300 ou 333,
2 cartes réseau, une (tres) vieille carte video (en mode screensaver
"green" qui plus est), 3 disques durs, et un lecteur CD qui ne sert
qu'aux install (donc jamais)

Et puis, l'alim précédente etait a 250W et ça plantait pas plus...

patpro

--
je cherche un poste d'admin UNIX/Mac
http://patpro.net/cv.php