Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Plantage général du système

3 réponses
Avatar
steve
Bonjour,

hier soir, gros souci d'un coup sur mon serveur Sarge. D'abord je remarque =
que=20
toutes mes connexions ssh sont mortes et impossible de se reconnecter.=20
Ensuite, mes connexions wifi (driver madwifi) ne fonctionne plus. Puis je=20
vais voir sur le serveur lui-m=EAme et X a plant=E9, plus d'acc=E8s =E0 la =
machine,=20
le clavier ne r=E9pond plus. Donc je suis oblig=E9 d'=E9teindre sauvagement=
=2E=20
Reboot, =E7a marche mais plus de wifi. Un iwconfig me dit :

Warning: Driver for device ath0 has been compiled with version 18
of Wireless Extension, while this program supports up to version 17.
Some things may be broken...

Jamais vu =E7a auparavant...

Je vais voir dans syslog :

Nov 23 08:40:20 machine kernel: CPU: 0
Nov 23 08:40:20 machine kernel: EIP: 0060:[pg0+956415535/1069782016] =
=20
Tainted: P VLI
Nov 23 08:40:20 machine kernel: EFLAGS: 00013286 (2.6.13-arkamons.1)
Nov 23 08:40:20 machine kernel: EIP is at _nv001477rm+0x33/0x94 [nvidia]
Nov 23 08:40:20 machine kernel: eax: f510a800 ebx: f5169120 ecx: ea60f5=
0f =20
edx: f5169120
Nov 23 08:40:20 machine kernel: esi: f97437a0 edi: 00000007 ebp: f55a5d=
6c =20
esp: f55a5d44
Nov 23 08:40:20 machine kernel: ds: 007b es: 007b ss: 0068
Nov 23 08:40:20 machine kernel: Process XFree86 (pid: 4579,=20
threadinfo=3Df55a4000 task=3Df57a3570)
Nov 23 08:40:20 machine kernel: Stack: f7433c00 00000004 00000000 f97437a0=
=20
00000000 f97437a0 00000000 f55a5da0
Nov 23 08:40:20 machine kernel: f93e1a66 f7265800 f55a5d9c f93e0c14=
=20
f97437a0 c1d00005 00000007 00000000
Nov 23 08:40:20 machine kernel: f9743580 00000002 f50fea60 f97437b4=
=20
f97437cc f95e145a f55a5dcc f93e0d52
Nov 23 08:40:20 machine kernel: Call Trace:
Nov 23 08:40:20 machine kernel: [pg0+956418662/1069782016]=20
rm_disable_interrupts+0x42/0x54 [nvidia]
Nov 23 08:40:20 machine kernel: [pg0+956414996/1069782016]=20
_nv004752rm+0x38/0x58 [nvidia]
Nov 23 08:40:20 machine kernel: [pg0+958514266/1069782016]=20
os_pci_read_dword+0x3d/0x45 [nvidia]
Nov 23 08:40:20 machine kernel: [pg0+956415314/1069782016]=20
_nv001472rm+0x8a/0x94 [nvidia]
Nov 23 08:40:20 machine kernel: [pg0+956391690/1069782016]=20
_nv002123rm+0x12/0x18 [nvidia]
Nov 23 08:40:20 machine kernel: [pg0+956419934/1069782016]=20
rm_free_unused_clients+0x2e/0x88 [nvidia]
Nov 23 08:40:20 machine kernel: [pg0+956419989/1069782016]=20
rm_free_unused_clients+0x65/0x88 [nvidia]
Nov 23 08:40:20 machine kernel: [pg0+956419969/1069782016]=20
rm_free_unused_clients+0x51/0x88 [nvidia]
Nov 23 08:40:20 machine kernel: [pg0+958498188/1069782016]=20
nv_kern_close+0x7d/0x135 [nvidia]
Nov 23 08:40:20 machine kernel: [__fput+398/416] __fput+0x18e/0x1a0
Nov 23 08:40:20 machine kernel: [filp_close+77/128] filp_close+0x4d/0x80
Nov 23 08:40:20 machine kernel: [put_files_struct+86/192]=20
put_files_struct+0x56/0xc0
Nov 23 08:40:20 machine kernel: [do_exit+249/896] do_exit+0xf9/0x380
Nov 23 08:40:20 machine kernel: [do_group_exit+52/112]=20
do_group_exit+0x34/0x70
Nov 23 08:40:20 machine kernel: [get_signal_to_deliver+473/688]=20
get_signal_to_deliver+0x1d9/0x2b0
Nov 23 08:40:20 machine kernel: [do_signal+145/288] do_signal+0x91/0x120
Nov 23 08:40:20 machine kernel: [sys_tgkill+245/256] sys_tgkill+0xf5/0x100
Nov 23 08:40:20 machine kernel: [dput+398/416] dput+0x18e/0x1a0
Nov 23 08:40:20 machine kernel: [__fput+298/416] __fput+0x12a/0x1a0
Nov 23 08:40:20 machine kernel: [sigprocmask+72/176] sigprocmask+0x48/0xb0
Nov 23 08:40:20 machine kernel: [sys_rt_sigprocmask+130/224]=20
sys_rt_sigprocmask+0x82/0xe0
Nov 23 08:40:20 machine kernel: [do_notify_resume+53/56]=20
do_notify_resume+0x35/0x38
Nov 23 08:40:20 machine kernel: [work_notifysig+19/21]=20
work_notifysig+0x13/0x15
Nov 23 08:40:20 machine kernel: Code: 53 8b 75 08 8b 7d 10 83 c4 fc a1 44 b=
0=20
65 f9 6a 00 6a 04 50 8b 40 18 ff d0 8b 9e 88 0
0 00 00 89 da 00 c4 10 eb 0b 8d b6 00 00 00 <00> 89 da 8b 5b 18 85 db 74 48=
39=20
7b 14 75 f2 8b 45 0c 39 03 75
Nov 23 08:40:20 machine kernel: <1>Fixing recursive fault but reboot is=20
needed!

La carte graphique est une nvidia GeForce FX 5200, qui marchait tr=E8s bien=
avec=20
le driver proprio 7676.

Pas d'autre message inqui=E9tant dans ce fichier. Au d=E9marrage (et=20
dans /var/log/boot) , je lis :

Tue Aug 30 11:35:31 2005: Cleaning /tmpfind: ./1038349296: Input/output err=
or
Tue Aug 30 11:35:31 2005: find: ./ssh-kzaxng4226: Input/output error
Tue Aug 30 11:35:31 2005: find: ./ssh-WFZtfq4226: Input/output error
Tue Aug 30 11:35:31 2005: find: ./1038349296: Input/output error
Tue Aug 30 11:35:31 2005: find: ./ssh-kzaxng4226: Input/output error
Tue Aug 30 11:35:32 2005: find: ./ssh-WFZtfq4226: Input/output error

Remarquez la date: 30 ao=FBt ! on dirait que ce fichier n'a pas =E9t=E9 act=
ualis=E9=20
alors que j'ai red=E9marr=E9 ce matin !

Les machines tournent sur un noyau 2.6.13 compil=E9 par mes soins, sont tou=
tes=20
en Sarge, et je n'ai rien touch=E9 concernant le noyau avant ce plantage. T=
out=20
marchait nikel jusque l=E0 (uptime d'une 30aine de jours sur le serveur). L=
a=20
derni=E8re mise =E0 jour (celle de hier) :

[MIS A JOUR] libnetpbm10 2:10.0-8sarge1 -> 2:10.0-8sarge2
[MIS A JOUR] libnetpbm9 2:10.0-8sarge1 -> 2:10.0-8sarge2
[MIS A JOUR] netpbm 2:10.0-8sarge1 -> 2:10.0-8sarge2



Voil=E0 o=F9 j'en suis. J'ai cherch=E9 un peu partout dans les logs, et rie=
n qui ne=20
me met la puce =E0 l'oreille. Je continue mes recherches, mais si vous avez=
une=20
id=E9e, je suis tr=E8s preneur.


Merci d'avance.


Steve - tr=E8s perplexe...

3 réponses

Avatar
fabrice régnier
> Bonjour,


salut,

dans /var/log/boot) , je lis :
Remarquez la date: 30 août ! on dirait que ce fichier n'a pas été actualisé
alors que j'ai redémarré ce matin !



pour activer le log dans /var/log/boot ou kern.log (je ne sais plus) ,
il faut

FR-PORT:/# cat /etc/default/bootlogd
# Run bootlogd at startup ?
BOOTLOGD_ENABLE=yes

Peut-être BOOTLOGD_ENABLE n'est pas positionné ?

> le serveur lui-même et X a planté
Perso, je pense que les serveurs graphiques sur des serveurs de
production sont une mauvaise idée. ssh devrait convenir non ? ou webmin ?

a+

f.


--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Avatar
steve
Le Mercredi, 23 Novembre 2005 10.39, fabrice régnier a écrit :
> Bonjour,

salut,

> dans /var/log/boot) , je lis :
> Remarquez la date: 30 août ! on dirait que ce fichier n'a pas été
> actualisé alors que j'ai redémarré ce matin !

pour activer le log dans /var/log/boot ou kern.log (je ne sais plus) ,
il faut

FR-PORT:/# cat /etc/default/bootlogd
# Run bootlogd at startup ?
BOOTLOGD_ENABLE=yes



fait depuis le premier jour de l'installation.


Peut-être BOOTLOGD_ENABLE n'est pas positionné ?

> le serveur lui-même et X a planté

Perso, je pense que les serveurs graphiques sur des serveurs de
production sont une mauvaise idée. ssh devrait convenir non ? ou webmin ?



oui je suis d'accord, mais là c'est un serveur maison, donc pas trop de s ouci.
J'ai juste quelques utilisateurs mécontents ce matin ;-)

a+

f.


Avatar
steve
Le Mercredi, 23 Novembre 2005 11.22, steve a écrit :

Bonjour,

j'ai solutionné le problème par un simple changement de noyau -> 2.6.14 .2.

Néanmoins, je n'ai pas compris le pourquoi du comment ce qui me chagrine un
peu. De plus je trouve bizarre que d'un coup le système ait merdé de ce tte
façon, sans raison apparente, alors qu'il tournait très bien jusque-l à.

De plus le problème que le fichier /var/log/boot ne contienne pas les mes sages
de démarrage persiste, très bizarre...

Merci et belle journée.

steve