OVH Cloud OVH Cloud

[HELP] Plantage inopiné d'un serveur dédié OVH

16 réponses
Avatar
hermes94
Bonjour =E0 tous,

J'aurais besoin d'avis =E9clair=E9s concernant un probl=E8me de plantage
al=E9atoire d'un serveur d=E9di=E9 OVH (Bi-PiV, Red Hat 7.2 Enigma)

- Rien de sp=E9cial dans les logs
- SMART Ok pour le disque qui contient le systeme hda
- Pas de charge importante: quand je lance top, la charge d=E9passe
rarement 1, souvent entre 0.15 et 0.5

Et pourtant durant un instant tr=E9s bref la charge monte =E0 3 voire 5
(dans top) et le serveur se bloque, plus moyen d'acc=E9der en ssh.

Pas moyen de savoir quel processus bloque le serveur puisque tous les
process occupe moins de 1% du CPU et da la m=E9moire:

copie top:

[root@ns2835 root]# top
4:32pm up 1 day, 22:25, 1 user, load average: 3,81, 1,10, 0,41
84 processes: 83 sleeping, 1 running, 0 zombie, 0 stopped
CPU0 states: 0,1% user, 0,0% system, 0,0% nice, 99,4% idle
CPU1 states: 0,0% user, 0,1% system, 0,0% nice, 99,4% idle
Mem: 505496K av, 442012K used, 63484K free, 0K shrd,
123892K buff
Swap: 522104K av, 0K used, 522104K free
112824K cached

PID USER PRI NI SIZE RSS SHARE STAT %CPU %MEM TIME COMMAND
19306 root 10 0 2024 2024 1672 S 0,1 0,4 0:08 sshd
23887 root 16 0 1076 1076 828 R 0,1 0,2 0:01 top
1 root 9 0 524 524 456 S 0,0 0,1 0:07 init
2 root 9 0 0 0 0 SW 0,0 0,0 0:00 keventd
3 root 19 19 0 0 0 SWN 0,0 0,0 0:00
ksoftirqd_CPU0
4 root 19 19 0 0 0 SWN 0,0 0,0 0:02
ksoftirqd_CPU1
5 root 9 0 0 0 0 SW 0,0 0,0 0:00 kswapd
6 root 9 0 0 0 0 SW 0,0 0,0 0:00 bdflush
7 root 9 0 0 0 0 SW 0,0 0,0 0:06 kupdated
8 root -1 -20 0 0 0 SW< 0,0 0,0 0:00
mdrecoveryd
9 root 9 0 0 0 0 DW 0,0 0,0 3:54 kjournald
17253 root 9 0 0 0 0 DW 0,0 0,0 2:16 kjournald
11584 root 9 0 0 0 0 SW 0,0 0,0 0:00 kjournald
26347 root 9 0 1352 1352 1196 S 0,0 0,2 0:05 sshd
13917 root 9 0 596 596 488 D 0,0 0,1 0:04 syslogd
7042 root 9 0 516 516 440 S 0,0 0,1 0:00 klogd
16089 named 9 0 4516 4516 2036 S 0,0 0,8 0:00 named
27157 named 9 0 4516 4516 2036 S 0,0 0,8 0:01 named
26938 named 9 0 4516 4516 2036 S 0,0 0,8 0:18 named
1646 named 9 0 4516 4516 2036 S 0,0 0,8 0:19 named
30327 named 9 0 4516 4516 2036 S 0,0 0,8 0:01 named
28961 named 9 0 4516 4516 2036 S 0,0 0,8 0:06 named
28504 root 9 0 972 972 776 S 0,0 0,1 0:00 xinetd
22059 qmails 9 0 408 408 316 D 0,0 0,0 0:10
qmail-send
24086 qmaill 9 0 368 368 300 S 0,0 0,0 0:02 multilog
20468 root 9 0 500 500 424 S 0,0 0,0 0:01 tcpserver
25686 qmaill 9 0 504 504 432 S 0,0 0,0 0:00 tcpserver
2043 qmaill 9 0 292 292 232 S 0,0 0,0 0:00 tai64n
10755 root 9 0 332 332 272 S 0,0 0,0 0:00
qmail-lspawn
13879 qmailr 0 0 356 356 284 S 0,0 0,0 0:03
qmail-rspawn
22350 qmailq 9 0 352 352 288 S 0,0 0,0 0:03
qmail-clean
25775 root 8 0 3888 3888 3572 S 0,0 0,7 0:03 httpd
13448 root 9 0 660 660 556 S 0,0 0,1 0:00
couriertcpd
6096 root 9 0 460 460 388 S 0,0 0,0 0:00
courierlogger
24845 root 10 0 688 688 612 S 0,0 0,1 0:00 crond
28397 root 9 0 1044 1044 844 S 0,0 0,2 0:00
safe_mysqld
10960 daemon 9 0 576 576 492 S 0,0 0,1 0:00 atd
32331 root 0 0 1428 1428 1344 S 0,0 0,2 0:02 watchdog
6270 mysql 10 0 7572 7572 1296 S 0,0 1,4 0:03 mysqld
5257 root 9 0 304 304 248 S 0,0 0,0 0:00
clockspeed
24523 mysql 0 0 7572 7572 1296 S 0,0 1,4 0:05 mysqld
26823 mysql 9 0 7572 7572 1296 S 0,0 1,4 0:06 mysqld
15001 root 9 0 5104 5104 2064 S 0,0 1,0 0:02
miniserv.pl
18180 root 9 0 424 424 360 S 0,0 0,0 0:00 mingetty
14455 root 9 0 428 428 360 S 0,0 0,0 0:00 mingetty
23092 root 9 0 428 428 360 S 0,0 0,0 0:00 mingetty
10830 root 9 0 424 424 360 S 0,0 0,0 0:00 mingetty
10716 root 9 0 424 424 360 S 0,0 0,0 0:00 mingetty
3229 root 9 0 424 424 360 S 0,0 0,0 0:00 mingetty

J'avoue ne pas comprendre ce qui se passe...
Peut =EAtre un pb hardware ?

Si quelqu'un parmi vous peut m'aider, ce serait tr=E9s sympa de sa part.

Merci

10 réponses

1 2
Avatar
Christophe Baegert
hermes94 wrote:
Et pourtant durant un instant trés bref la charge monte à 3 voire 5
(dans top) et le serveur se bloque, plus moyen d'accéder en ssh.

J'avoue ne pas comprendre ce qui se passe...
Peut être un pb hardware ?


Possible que ce soit le disque, oui, même avec un SMART ok.

Est-ce que certaines valeurs de SMART sont dégradées même si elles restent
dans les normes ?

Normalement, toutes les valeurs doivent rester très proches des valeurs
constatées à neuf, s'il y a 20% de dégradation c'est déjà anormal.

Avatar
Patrick Mevzek
J'ai comme un doute. Comment peut-il y avoir 6 process named qui
tournent en même temps ?


C'est le fonctionnement standard de bind, il forke.

--
Patrick Mevzek . . . . . . Dot and Co (Paris, France)
<http://www.dotandco.net/> <http://www.dotandco.com/>
Dépêches sur le nommage <news://news.dotandco.net/dotandco.info.news>

Avatar
Laurent Sintes
Dans l'article ,
aléatoire d'un serveur dédié OVH (Bi-PiV, Red Hat 7.2 Enigma)
- SMART Ok pour le disque qui contient le systeme hda


Quel idée aussi de mettre un disque IDE sur un bi processeur :)
Je pense que ca vient (peut être) du disque, malgré le SMART OK,
en tout cas c'est ce qu'il y a de plus probable d'après vos symptômes.

--
Laurent - http://www.web1.fr/

Avatar
Jean-claude
"Philippe Chevalier" a écrit dans le message de news:

On 16 Sep 2005 01:41:46 -0700, hermes94 wrote:
16089 named 9 0 4516 4516 2036 S 0,0 0,8 0:00 named
27157 named 9 0 4516 4516 2036 S 0,0 0,8 0:01 named
26938 named 9 0 4516 4516 2036 S 0,0 0,8 0:18 named
1646 named 9 0 4516 4516 2036 S 0,0 0,8 0:19 named
30327 named 9 0 4516 4516 2036 S 0,0 0,8 0:01 named
28961 named 9 0 4516 4516 2036 S 0,0 0,8 0:06 named


J'ai comme un doute. Comment peut-il y avoir 6 process named qui
tournent en même temps ?

25775 root 8 0 3888 3888 3572 S 0,0 0,7 0:03 httpd


Un seul httpd sous root ? Par de childs préforkés ?

Cette machine est configurée très bizarrement.

K.
--
Kyoko Otonashi's shrine / Le temple de Kyoko Otonashi
My tribute to Maison Ikkoku / Mon hommage a Maison Ikkoku
Visit http://www.kyoko.org/




Passez sous OS Windows... ;-)

jean-claude


Avatar
oles
Laurent Sintes a ?crit:
Dans l'article ,
al?atoire d'un serveur d?di? OVH (Bi-PiV, Red Hat 7.2 Enigma)
- SMART Ok pour le disque qui contient le systeme hda


Quel id?e aussi de mettre un disque IDE sur un bi processeur :)


Laurent ... un peu de reserve ... l'age et l'experiance ...
car je ne connais pas des offres chez Ovh bi-cpu avec du ide ...
... bi-cpu avec 2 ou 6 disques SCSI en RAID-1e oui, des
celeron, piv avec du IDE oui, mais bi-cpu avec du ide, d?sol?,
je m'en souviens pas qu'on ait sorti ?a.

Octave

--
Simplifiez la gestion de votre hebergement et
telechargez MoM: http://www.ovh.com/fr/download
pour Windows, Mac ou Linux. C'est gratuit !


Avatar
Minasu
Est ce qu'il vous arrive de monter régulièrement a 100% de CPU system. Si
oui, pouvez vous copier vos lignes lorsque vous êtes a 100%

--
"Laurent Sintes" a écrit dans le message de news:

Dans l'article ,
aléatoire d'un serveur dédié OVH (Bi-PiV, Red Hat 7.2 Enigma)
- SMART Ok pour le disque qui contient le systeme hda


Quel idée aussi de mettre un disque IDE sur un bi processeur :)
Je pense que ca vient (peut être) du disque, malgré le SMART OK,
en tout cas c'est ce qu'il y a de plus probable d'après vos symptômes.

--
Laurent - http://www.web1.fr/




Avatar
Laurent Sintes
al?atoire d'un serveur d?di? OVH (Bi-PiV, Red Hat 7.2 Enigma)
Quel id?e aussi de mettre un disque IDE sur un bi processeur :)



Laurent ... un peu de reserve ...


Je le déduis du hda et du bi-pIV -:) Nullement mon intention
de critiquer les confrères.

car je ne connais pas des offres chez Ovh bi-cpu avec du ide ...


Je sais. Je croyais que c'était une machine appartenant au
client. Désolé Octave mais ce n'était pas contre toi.

--
Laurent - http://www.web1.fr/



Avatar
hermes94
Bonjour Octave,

Sauf erreur de ma part, le serveur est bien bi-processeur.

Lorsque je lance machine.sh, j'obtiens:

processeur:

model name : Intel(R) Pentium(R) 4 CPU 3.06GHz
cpu MHz : 3073.755
model name : Intel(R) Pentium(R) 4 CPU 3.06GHz
cpu MHz : 3073.755

Boot:
Partition root : /dev/hda1

A lire les réponses des uns et des autres (merci pour votre
réactivité à tous), il ne faut pas associer bi-proc et disque IDE ?

Merci encore pour vos réponses
Avatar
hermes94
Voici le resultat SMART:

Status of drive /dev/hda
Location IDE périphérique A
Drive size 38 GB
Make and model ST340014A
Supports SMART? Oui
SMART enabled? Oui
Passed drive check? Oui
Offline data collection status Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline data collection 430 seconds.
Offline data collection capabilities SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability Error logging supported.
General Purpose Logging supported.
Short self-test routine recommended polling time 1 minutes.
Extended self-test routine recommended polling time 31 minutes.
Raw Read Error Rate 145416760
Spin Up Time 0
Start Stop Count 0
Reallocated Sector Ct 0
Seek Error Rate 24672626
Power On Hours 2679
Spin Retry Count 0
Power Cycle Count 40
Temperature Celsius 43
Hardware ECC Recovered 145416760
Current Pending Sector 0
Offline Uncorrectable 0
Multi Zone Error Rate 0
TA Increase Count 0
Avatar
rene-marc
hermes94 :
Voici le resultat SMART:



Je ne voudrais pas déranger, mais vous etes plutot hors-sujet.

1 2