OVH Cloud OVH Cloud

Barrette HS ... système HS ?

5 réponses
Avatar
Samuel
Bonjour,

J'ai installé un système linux Sarge 3.1 sur un vieux serveur.
Suite à un plantage anormal d'une compile de noyau et un ou deux
problèmes j'ai passé un coup de memtest86 toute une nuit et il m'a sorti
à peu près 400 erreurs (une barrette de 512).
J'ai changé les timings bios, testé les autres slots de RAM mais même
résultat : quelques erreurs. J'ai donc changé la barrette et là memtest
a l'air de tenir sans erreur.

Par contre je me pose la question de la fiabilité de mon système
installé avec un RAM un peu H.S.

Par exemple, quand je redémarre mailscanner, dans syslog, je vois que
exim "s'est terminé avec un erreur anormale".
De plus quand j'édite crontab j'ai aussi un message dans syslog me
disant : cron bad minute.

Bref pensez-vous que je doive réinstaller mon système ?

Merci.
Samuel.

5 réponses

Avatar
Adrien Caillot
On 2005-11-26, Samuel wrote:
Bonjour,



Bonjour,

J'ai installé un système linux Sarge 3.1 sur un vieux serveur.
Suite à un plantage anormal d'une compile de noyau et un ou deux
problèmes j'ai passé un coup de memtest86 toute une nuit et il m'a sorti
à peu près 400 erreurs (une barrette de 512).
J'ai changé les timings bios, testé les autres slots de RAM mais même
résultat : quelques erreurs. J'ai donc changé la barrette et là memtest
a l'air de tenir sans erreur.

Par contre je me pose la question de la fiabilité de mon système
installé avec un RAM un peu H.S.



Je me suis déjà posé la même question, mais je pense qu'il n'y a pas de
réponse universelle.

Par exemple, quand je redémarre mailscanner, dans syslog, je vois que
exim "s'est terminé avec un erreur anormale".
De plus quand j'édite crontab j'ai aussi un message dans syslog me
disant : cron bad minute.

Bref pensez-vous que je doive réinstaller mon système ?



A ta place, je désinstallerais (apt-get remove --purge pour enlever
aussi les fichiers des config) et réinstallerais les paquets qui
fonctionnent incorrectement. Ensuite, si tout a l'air de bien aller,
c'est bon. Sinon, tout réinstaller serait peut-être plus prudent.

Merci.


De rien.

Samuel.


--
Adrien

Avatar
Samuel
Bonjour,

On 2005-11-26, Samuel wrote:
J'ai installé un système linux Sarge 3.1 sur un vieux serveur.
Suite à un plantage anormal d'une compile de noyau et un ou deux
problèmes j'ai passé un coup de memtest86 toute une nuit et il m'a sorti
à peu près 400 erreurs (une barrette de 512).
J'ai changé les timings bios, testé les autres slots de RAM mais même
résultat : quelques erreurs. J'ai donc changé la barrette et là memtest
a l'air de tenir sans erreur.
Par contre je me pose la question de la fiabilité de mon système
installé avec un RAM un peu H.S.


Je me suis déjà posé la même question, mais je pense qu'il n'y a pas de
réponse universelle.

Par exemple, quand je redémarre mailscanner, dans syslog, je vois que
exim "s'est terminé avec un erreur anormale".
De plus quand j'édite crontab j'ai aussi un message dans syslog me
disant : cron bad minute.
Bref pensez-vous que je doive réinstaller mon système ?


A ta place, je désinstallerais (apt-get remove --purge pour enlever
aussi les fichiers des config) et réinstallerais les paquets qui
fonctionnent incorrectement. Ensuite, si tout a l'air de bien aller,
c'est bon. Sinon, tout réinstaller serait peut-être plus prudent.


J'ai choisi de tout réinstaller avec la nouvelle Ram (testée toute une
nuit avec memtest et elle est ok ).
J'ai encore quelques probs mais plus liés à la config de linux, je pense.

Pour rester dans le sujet, quand on veut tester le fonctionnement
matériel d'une machine, quels tests faut-il faire ?

- Memtest pour la mémoire (ça teste aussi la carte mère non ?)
- hdparm pour la rapidite du disk
- smartmontools pour l'état du disk dur

Peut-être aussi des tests de stress cpu ?
Des avis ?

Merci.
Samuel.


Avatar
Pascal
Salut,


Pour rester dans le sujet, quand on veut tester le fonctionnement
matériel d'une machine, quels tests faut-il faire ?

- Memtest pour la mémoire (ça teste aussi la carte mère non ?)


Ça teste les maillons du chemin de communication entre le processeur et
la mémoire : mémoire, bus mémoire, contrôleur mémoire du chipset de la
carte mère, bus processeur, processeur.

- hdparm pour la rapidite du disk
- smartmontools pour l'état du disk dur


Et badblocks pour détecter les secteurs défectueux, ce que ne font pas
les outils SMART.

Avatar
Samuel
Pour rester dans le sujet, quand on veut tester le fonctionnement
matériel d'une machine, quels tests faut-il faire ?
- Memtest pour la mémoire (ça teste aussi la carte mère non ?)


Ça teste les maillons du chemin de communication entre le processeur et
la mémoire : mémoire, bus mémoire, contrôleur mémoire du chipset de la
carte mère, bus processeur, processeur.


ok

- hdparm pour la rapidite du disk
- smartmontools pour l'état du disk dur


Et badblocks pour détecter les secteurs défectueux, ce que ne font pas
les outils SMART.


Je le rajoute dans ma petite liste, merci.

Samuel.


Avatar
c.moi
Samuel wrote:


Bref pensez-vous que je doive réinstaller mon système ?


Et si tu changeais de barrette mémoire ?

--
Je cherche comme cherche celui qui veut trouver,
et je trouve comme trouve celui qui a cherché. :o)