OVH Cloud OVH Cloud

enquète sur des plantages

5 réponses
Avatar
cedric
Bonjour.

J'ai un PC qui tourne sous freeBSD 5.2.1-RELEASE.
Depuis quelques temps le systeme plante de facon étrange, et je suspecte
un problème matériel. J'ai d'ailleur vu passer une fois dans la console
un message d'erreur disque (il s'agit d'un disque SATA, à mes risques et
périls je sait, mais j'usque là ca marchait bien).

Bref, ceci m'amène à me (et vous) poser deux questions :

- je ne voit aucune trace de message d'erreur dans aucun des fichiers de
log dans /var/log , ou sont donc écrit les message d'erreurs kernel du
genre d'un problème hardware d'écriture disque ??

- sur linux, syslog écrit toutes les 20 minutes un "--" dans un fichier
de log ainsi que la date pour pouvoir savoir à peut à quelle heure une
machine est tombé en rideau. Rien de tel sur freeBSD ? Je suppose qu'il
y a un truc équivalent voir meilleurs... mais ou ?

Merci.

5 réponses

Avatar
Nicolas Le Scouarnec
Depuis quelques temps le systeme plante de facon étrange, et je suspecte
un problème matériel. J'ai d'ailleur vu passer une fois dans la console
un message d'erreur disque (il s'agit d'un disque SATA, à mes risques et
périls je sait, mais j'usque là ca marchait bien).


Est-ce que tu as changé quelque chose ? Mise a jour ? Nouvelles
fonctionnalité du noyau ? Il y a quelques trucs qui font facilement planter
un FreeBSD: faire le con avec nullfs/unionfs ou eteindre un
périphérique USB Mass Storage alors qu'il est monté (en MSDOS), c'est
assez desagréable... (Est-ce utile de faire un Bug Report d'ailleurs
?). Des mauvaises langues t'affirmeront que jouer avec les modules
son, c'est aussi une source de plantage.

Donc si tu utilises nullfs et a plus forte raison unionfs, desactive
les, et remplace les par du NFS (si tu peux).

- je ne voit aucune trace de message d'erreur dans aucun des fichiers de
log dans /var/log , ou sont donc écrit les message d'erreurs kernel du
genre d'un problème hardware d'écriture disque ??


dmesg ? Si le systeme plante, ca n'est écrit nulle part, pour ne pas
prendre le risque d'écraser des fichiers importants a cause d'un bug,
tu peux néanmoins activer le debuggage et récuperer tes infos dans le
swap (c'est expliqué dans man crash ).

- sur linux, syslog écrit toutes les 20 minutes un "--" dans un fichier
de log ainsi que la date pour pouvoir savoir à peut à quelle heure une
machine est tombé en rideau. Rien de tel sur freeBSD ? Je suppose qu'il
y a un truc équivalent voir meilleurs... mais ou ?


La commande last peut te renseigner, la commande uptime aussi, et
eventuellement tu peux utiliser crond pour écrire -- toutes les 20
minutes, comme sous Linux.

--
Nicolas Le Scouarnec

Avatar
Patrick Viet
d'expérience, plantage bizarre = RAM
tente de la changer avant de faire autre chose

Patrick
Avatar
cedric
Patrick Viet wrote:
d'expérience, plantage bizarre = RAM
tente de la changer avant de faire autre chose


Oui c'est ce que je vais faire aujourd'hui même.

Avatar
cedric
Nicolas Le Scouarnec wrote:

Depuis quelques temps le systeme plante de facon étrange, et je suspecte
un problème matériel. J'ai d'ailleur vu passer une fois dans la console
un message d'erreur disque (il s'agit d'un disque SATA, à mes risques et
périls je sait, mais j'usque là ca marchait bien).



Est-ce que tu as changé quelque chose ? Mise a jour ? Nouvelles
fonctionnalité du noyau ?


J'ai mis à jour les programmes installés via les ports, mais pas le
kernel. De toutes facon, il n'y a presque rien d'installé sur cette machine.

A ce sujet et entres parenthèses, il y a une question que je me pose :
j'avais installé une version 5.2.1-RELEASE, et c'est toujours ce que me
répond uname. Apparement, ce numéro de version ne correspond qu'au
kernel, et pas aux ports ? En d'autre terme, il n'existe pas de RELEASE
des ports, c'est bien cela ? Je pensais que lorsqu'on installait une
"RELEASE" plutot qu'une "CURRENT", ca figeait les ports (oui, comme une
distribution debian par exemple -> un numero de release fige non
seulement le kernel mais aussi les programmes, aux security-fix près).
Bref, j'ai été très étonné lorsqu'un make install inocent m'a demandé de
mettre à jour mes ports installés...

Il y a quelques trucs qui font facilement planter
un FreeBSD: faire le con avec nullfs/unionfs ou eteindre un
périphérique USB Mass Storage alors qu'il est monté (en MSDOS), c'est
assez desagréable... (Est-ce utile de faire un Bug Report d'ailleurs
?). Des mauvaises langues t'affirmeront que jouer avec les modules
son, c'est aussi une source de plantage.


Merci, mais je n'utilise pas ces choses là.

dmesg ? Si le systeme plante, ca n'est écrit nulle part, pour ne pas
prendre le risque d'écraser des fichiers importants a cause d'un bug,
tu peux néanmoins activer le debuggage et récuperer tes infos dans le
swap (c'est expliqué dans man crash ).


Je vais voir.
Pour l'instant la machine n'a pas replanté. Elle attend en général que
je soit parti ;)

La commande last peut te renseigner, la commande uptime aussi, et
eventuellement tu peux utiliser crond pour écrire -- toutes les 20
minutes, comme sous Linux.


Je ne connaissais pas last. Merci.


Avatar
Sebastien Arana

Bonjour.

J'ai un PC qui tourne sous freeBSD 5.2.1-RELEASE.
Depuis quelques temps le systeme plante de facon étrange, et je suspecte
un problème matériel. J'ai d'ailleur vu passer une fois dans la console
un message d'erreur disque (il s'agit d'un disque SATA, à mes risques et
périls je sait, mais j'usque là ca marchait bien).

Bref, ceci m'amène à me (et vous) poser deux questions :

- je ne voit aucune trace de message d'erreur dans aucun des fichiers de
log dans /var/log , ou sont donc écrit les message d'erreurs kernel du
genre d'un problème hardware d'écriture disque ??

- sur linux, syslog écrit toutes les 20 minutes un "--" dans un fichier
de log ainsi que la date pour pouvoir savoir à peut à quelle heure une
machine est tombé en rideau. Rien de tel sur freeBSD ? Je suppose qu'il
y a un truc équivalent voir meilleurs... mais ou ?

Merci.


Sata tout court ou sata raid ?
moi je tourne en sata raid et mes erreurs disques apparaissent dans
/var/log/kernel

sinon verifie bien que tes logs sont bien enregistrés et paramétrés sous
freebsd (si le fichier de log n'existe pas, il ne sera pas créé).

pour connaitre à peu près tout ce que log syslogd (le daemon de log),
vérifie le fichier /etc/syslog.conf. moi voici le contenu de mon fichier :

*.=<notice,*.>debug,!-sshd /var/log/messages
auth,authpriv.>debug,!-sshd /var/log/auth.log
cron.info /var/log/cron.log
mail.info /var/log/mail.log
kern.>debug /var/log/kernel
security.>debug /var/log/security
console.* /var/log/console.log

!ipmon
*.>debug /var/log/ipf.log

!sshd
*.>debug /var/log/sshd.log

tu peux rajouter l'ecoute de programme supplémentaire par un ! devant le
nom (comme !ipmon ou !sshd). voilou :)

sinon hésite pas à lancer un check de ton file systeme (fsck). si un
jour tu trouves que t'as pas assez d'info de debug (ça peut arriver dans
ton cas), alors hésite pas à rajouter la ligne suivante dans sysctl.conf :

*.debug /var/log/debug.log


j'espere que ça t'aura aidé. regarde aussi par un atacontrol, les modes
d'utilisations des disques dur, exemple :

atacontrol list - donne la liste des canaux + disques
atacontrol mode <chan> - donne info d'un channel sur le proto utilisé

généralement la dernière commande devrait te retourner un UDMA133. ex :
# atacontrol mode 3
Master = UDMA133
Slave = BIOSPIO

sur le slave j'ai aucun disque donc c'est pas grave mais mon SATA est
bien déclaré en UDMA6 133.

@+