OVH Cloud OVH Cloud

Deconnection sous amule

2 réponses
Avatar
Betton lionel
Bonsoir

Mandrake 10.1
Routeur linksys
wifi pc54g2

Tout est installé et je n'ai aucun problème lors de mes connexions, sauf
pour amule, xmule et consors. Je suis deconnecté après, au maximun,
15-20mn sur amule. ex:

Lancement amule à 19:20:53
Arrêt programme vers 19:54
/var/log/messages indique :

Jan 14 19:09:44 ordi kernel: cdrom: hdd: mmc-3 profile capable, current profile: 8h
Jan 14 19:46:53 ordi drakconf.real[7017]: ### Program is starting ###
Jan 14 19:46:59 ordi drakconf.real[7026]: ### Program is starting ###
Jan 14 19:48:54 ordi rpmdrake[7105]: ### Program is starting ###
Jan 14 19:53:06 ordi kernel: Unable to handle kernel NULL pointer dereference at virtual address 00000004
Jan 14 19:53:06 ordi kernel: printing eip:
Jan 14 19:53:06 ordi kernel: c0298a3c
Jan 14 19:53:06 ordi kernel: *pde = 00000000
Jan 14 19:53:06 ordi kernel: Oops: 0002 [#1]
Jan 14 19:53:06 ordi kernel: Modules linked in: isofs md5 ipv6 binfmt_misc lp parport_pc parport rfcomm l2cap bluetooth usblp snd-seq-oss snd-seq-midi-event snd-seq snd-pcm-oss snd-mixer-oss snd-intel8x0 snd-ac97-codec snd-pcm snd-timer snd-page-alloc gameport snd-mpu401-uart snd-rawmidi snd-seq-device snd soundcore rt2500 af_packet floppy sis900 ide-cd cdrom loop nls_iso8859-15 ntfs supermount sis-agp agpgart nvidia ehci-hcd uhci-hcd ohci-hcd usbcore ext3 jbd
Jan 14 19:53:06 ordi kernel: CPU: 0
Jan 14 19:53:06 ordi kernel: EIP: 0060:[tcp_disconnect+332/1072] Tainted: P VLI
Jan 14 19:53:06 ordi kernel: EIP: 0060:[<c0298a3c>] Tainted: P VLI
Jan 14 19:53:06 ordi kernel: EFLAGS: 00210282 (2.6.8.1-12mdk)
Jan 14 19:53:06 ordi kernel: EIP is at tcp_disconnect+0x14c/0x430
Jan 14 19:53:06 ordi kernel: eax: 00000000 ebx: cf4bb400 ecx: df450320 edx: c2d7b980
Jan 14 19:53:06 ordi kernel: esi: cf4bb5d8 edi: cf4bb454 ebp: d49d9f3c esp: d49d9f10
Jan 14 19:53:06 ordi kernel: ds: 007b es: 007b ss: 0068
Jan 14 19:53:06 ordi kernel: Process amule (pid: 5978, threadinfo=d49d8000 task=db21ae10)
Jan 14 19:53:06 ordi kernel: Stack: c2d7b680 d49d9f28 c01589d3 d28f8ce4 cf4bb540 00200246 d49d9f38 00000002
Jan 14 19:53:06 ordi kernel: cf4bb400 00000003 d2eeb380 d49d9f5c c02b7b9e cf4bb400 00000800 00000000
Jan 14 19:53:06 ordi kernel: d2eeb380 00000002 087d9ccc d49d9f78 c026cd7d d2eeb380 00000002 00000000
Jan 14 19:53:06 ordi kernel: Call Trace:
Jan 14 19:53:06 ordi kernel: [show_stack+127/160] show_stack+0x7f/0xa0
Jan 14 19:53:06 ordi kernel: [<c0107bbf>] show_stack+0x7f/0xa0
Jan 14 19:53:06 ordi kernel: [show_registers+342/464] show_registers+0x156/0x1d0
Jan 14 19:53:06 ordi kernel: [<c0107d56>] show_registers+0x156/0x1d0
Jan 14 19:53:06 ordi kernel: [die+102/208] die+0x66/0xd0
Jan 14 19:53:06 ordi kernel: [<c0107ef6>] die+0x66/0xd0
Jan 14 19:53:06 ordi kernel: [do_page_fault+966/1456] do_page_fault+0x3c6/0x5b0
Jan 14 19:53:06 ordi kernel: [<c0119b26>] do_page_fault+0x3c6/0x5b0
Jan 14 19:53:06 ordi kernel: [error_code+45/56] error_code+0x2d/0x38
Jan 14 19:53:06 ordi kernel: [<c0107849>] error_code+0x2d/0x38
Jan 14 19:53:06 ordi kernel: [inet_shutdown+174/272] inet_shutdown+0xae/0x110
Jan 14 19:53:06 ordi kernel: [<c02b7b9e>] inet_shutdown+0xae/0x110
Jan 14 19:53:06 ordi kernel: [sys_shutdown+93/112] sys_shutdown+0x5d/0x70
Jan 14 19:53:06 ordi kernel: [<c026cd7d>] sys_shutdown+0x5d/0x70
Jan 14 19:53:06 ordi kernel: [sys_socketcall+460/576] sys_socketcall+0x1cc/0x240
Jan 14 19:53:06 ordi kernel: [<c026d40c>] sys_socketcall+0x1cc/0x240
Jan 14 19:53:06 ordi kernel: [sysenter_past_esp+82/113] sysenter_past_esp+0x52/0x71
Jan 14 19:53:06 ordi kernel: [<c0106dcd>] sysenter_past_esp+0x52/0x71
Jan 14 19:53:06 ordi kernel: Code: 74 0d ff 8a 98 00 00 00 0f 94 c0 84 c0 74 c0 89 14 24 e8 78 69 fd ff 8b 07 39 f8 75 b8 8d 7b 54 eb 4b 89 c2 8b 00 ff 4f 08 85 d2 <89> 78 04 89 43 54 c7 42 04 00 00 00 00 c7 02 00 00 00 00 c7 42 .

Cette fois ci, pas de plantages, mais impossibilité de relancer amule, le
programme ne répondant alors pas.
De plus, un ping sur mon routeur me donne "no buffer space".

Alors si quelqu'un y comprends quelque chose qu'il ne se prive pas
d'étaler sa science. Merci :)

2 réponses

Avatar
l'indien
On Fri, 14 Jan 2005 22:55:06 +0100, Betton lionel wrote:

Bonsoir

Mandrake 10.1
Routeur linksys
wifi pc54g2

Tout est installé et je n'ai aucun problème lors de mes connexions, sauf
pour amule, xmule et consors. Je suis deconnecté après, au maximun,
15-20mn sur amule. ex:

Lancement amule à 19:20:53
Arrêt programme vers 19:54
/var/log/messages indique :
[...]

Jan 14 19:53:06 ordi kernel: Unable to handle kernel NULL pointer dereference at virtual address 00000004
[...]

Jan 14 19:53:06 ordi kernel: Call Trace:
Jan 14 19:53:06 ordi kernel: [show_stack+127/160] show_stack+0x7f/0xa0
Jan 14 19:53:06 ordi kernel: [<c0107bbf>] show_stack+0x7f/0xa0
Jan 14 19:53:06 ordi kernel: [show_registers+342/464] show_registers+0x156/0x1d0
Jan 14 19:53:06 ordi kernel: [<c0107d56>] show_registers+0x156/0x1d0
Jan 14 19:53:06 ordi kernel: [die+102/208] die+0x66/0xd0
Jan 14 19:53:06 ordi kernel: [<c0107ef6>] die+0x66/0xd0
Jan 14 19:53:06 ordi kernel: [do_page_fault+966/1456] do_page_fault+0x3c6/0x5b0
Jan 14 19:53:06 ordi kernel: [<c0119b26>] do_page_fault+0x3c6/0x5b0
Jan 14 19:53:06 ordi kernel: [error_code+45/56] error_code+0x2d/0x38
Jan 14 19:53:06 ordi kernel: [<c0107849>] error_code+0x2d/0x38
Jan 14 19:53:06 ordi kernel: [inet_shutdown+174/272] inet_shutdown+0xae/0x110
Jan 14 19:53:06 ordi kernel: [<c02b7b9e>] inet_shutdown+0xae/0x110
Jan 14 19:53:06 ordi kernel: [sys_shutdown+93/112] sys_shutdown+0x5d/0x70
Jan 14 19:53:06 ordi kernel: [<c026cd7d>] sys_shutdown+0x5d/0x70
Jan 14 19:53:06 ordi kernel: [sys_socketcall+460/576] sys_socketcall+0x1cc/0x240
Jan 14 19:53:06 ordi kernel: [<c026d40c>] sys_socketcall+0x1cc/0x240
Jan 14 19:53:06 ordi kernel: [sysenter_past_esp+82/113] sysenter_past_esp+0x52/0x71
Jan 14 19:53:06 ordi kernel: [<c0106dcd>] sysenter_past_esp+0x52/0x71
Jan 14 19:53:06 ordi kernel: Code: 74 0d ff 8a 98 00 00 00 0f 94 c0 84 c0 74 c0 89 14 24 e8 78 69 fd ff 8b 07 39 f8 75 b8 8d 7b 54 eb 4b 89 c2 8b 00 ff 4f 08 85 d2 <89> 78 04 89 43 54 c7 42 04 00 00 00 00 c7 02 00 00 00 00 c7 42 .


Alors là, bravo: tu viens de mettre en évidence 2 bugs noyau d'un coup,
ce n'est pas tous les jours que ça arrive ;-)
Le premier: un appel à shutdown avec, sans doute, une socket invalide a
crashé. Déjà, ça c'est très grave.
Encore mieux:
La routine 'die' qui est censée imprimer l'état du process qui a crashé
a elle même crashé ! C'est assez inattendu...
Il y a, pour moi, 2 hypothèses:
- les structures du noyau concernant ce process ont été vérolées.
Ca peut être du à un bug kernel ou à de la RAM deffectueuse. Si c'est
la cas, c'est très grave.
- il y a vraiment un bug dans 'shutdown' qui, en crashant, a vérolé des
structures du noyau et a provoqué le crash suivant. C'est le plus
vraissemblable.
Si tu arrives à le reproduire, il faudra le tracker, ce bug !

Cette fois ci, pas de plantages, mais impossibilité de relancer amule, le
programme ne répondant alors pas.


Vu le crash que tu as eu, j'éspère que tu as rebooté avant de retester !
Si ça n'est pas le cas, reboote avant que ton noyau ne crashe
complètement: il a maintenant des structures vérolées, c'est certain.

De plus, un ping sur mon routeur me donne "no buffer space".


Hum, à mon avis il y a des tables qui débordent. Soit les tables de
routage, soit les entrées de 'tracking' du firewall, s'il contient un
firewall statefull. Dans ces cas là, ça devrait s'arranger une fois que
les timeouts seront expirés. Sinon, reboote assuré...

Alors si quelqu'un y comprends quelque chose qu'il ne se prive pas
d'étaler sa science. Merci :)


Bah, voilà toujours quelques pistes...

Avatar
Betton lionel
Le Sat, 15 Jan 2005 00:47:13 +0100, l'indien a écrit :

On Fri, 14 Jan 2005 22:55:06 +0100, Betton lionel wrote:

Bonsoir

Mandrake 10.1
Routeur linksys
wifi pc54g2

Tout est installé et je n'ai aucun problème lors de mes connexions, sauf
pour amule, xmule et consors. Je suis deconnecté après, au maximun,
15-20mn sur amule. ex:

Lancement amule à 19:20:53
Arrêt programme vers 19:54
/var/log/messages indique :
[...]

Jan 14 19:53:06 ordi kernel: Unable to handle kernel NULL pointer dereference at virtual address 00000004
[...]

Jan 14 19:53:06 ordi kernel: Call Trace:
Jan 14 19:53:06 ordi kernel: [show_stack+127/160] show_stack+0x7f/0xa0
Jan 14 19:53:06 ordi kernel: [<c0107bbf>] show_stack+0x7f/0xa0
Jan 14 19:53:06 ordi kernel: [show_registers+342/464] show_registers+0x156/0x1d0
Jan 14 19:53:06 ordi kernel: [<c0107d56>] show_registers+0x156/0x1d0
Jan 14 19:53:06 ordi kernel: [die+102/208] die+0x66/0xd0
Jan 14 19:53:06 ordi kernel: [<c0107ef6>] die+0x66/0xd0
Jan 14 19:53:06 ordi kernel: [do_page_fault+966/1456] do_page_fault+0x3c6/0x5b0
Jan 14 19:53:06 ordi kernel: [<c0119b26>] do_page_fault+0x3c6/0x5b0
Jan 14 19:53:06 ordi kernel: [error_code+45/56] error_code+0x2d/0x38
Jan 14 19:53:06 ordi kernel: [<c0107849>] error_code+0x2d/0x38
Jan 14 19:53:06 ordi kernel: [inet_shutdown+174/272] inet_shutdown+0xae/0x110
Jan 14 19:53:06 ordi kernel: [<c02b7b9e>] inet_shutdown+0xae/0x110
Jan 14 19:53:06 ordi kernel: [sys_shutdown+93/112] sys_shutdown+0x5d/0x70
Jan 14 19:53:06 ordi kernel: [<c026cd7d>] sys_shutdown+0x5d/0x70
Jan 14 19:53:06 ordi kernel: [sys_socketcall+460/576] sys_socketcall+0x1cc/0x240
Jan 14 19:53:06 ordi kernel: [<c026d40c>] sys_socketcall+0x1cc/0x240
Jan 14 19:53:06 ordi kernel: [sysenter_past_esp+82/113] sysenter_past_esp+0x52/0x71
Jan 14 19:53:06 ordi kernel: [<c0106dcd>] sysenter_past_esp+0x52/0x71
Jan 14 19:53:06 ordi kernel: Code: 74 0d ff 8a 98 00 00 00 0f 94 c0 84 c0 74 c0 89 14 24 e8 78 69 fd ff 8b 07 39 f8 75 b8 8d 7b 54 eb 4b 89 c2 8b 00 ff 4f 08 85 d2 <89> 78 04 89 43 54 c7 42 04 00 00 00 00 c7 02 00 00 00 00 c7 42 .


Alors là, bravo: tu viens de mettre en évidence 2 bugs noyau d'un coup,
ce n'est pas tous les jours que ça arrive ;-)
Le premier: un appel à shutdown avec, sans doute, une socket invalide a
crashé. Déjà, ça c'est très grave.
Encore mieux:
La routine 'die' qui est censée imprimer l'état du process qui a crashé
a elle même crashé ! C'est assez inattendu...
Il y a, pour moi, 2 hypothèses:
- les structures du noyau concernant ce process ont été vérolées.
Ca peut être du à un bug kernel ou à de la RAM deffectueuse. Si c'est
la cas, c'est très grave.
- il y a vraiment un bug dans 'shutdown' qui, en crashant, a vérolé des
structures du noyau et a provoqué le crash suivant. C'est le plus
vraissemblable.
Si tu arrives à le reproduire, il faudra le tracker, ce bug !

Cette fois ci, pas de plantages, mais impossibilité de relancer amule, le
programme ne répondant alors pas.


Vu le crash que tu as eu, j'éspère que tu as rebooté avant de retester !
Si ça n'est pas le cas, reboote avant que ton noyau ne crashe
complètement: il a maintenant des structures vérolées, c'est certain.

De plus, un ping sur mon routeur me donne "no buffer space".


Hum, à mon avis il y a des tables qui débordent. Soit les tables de
routage, soit les entrées de 'tracking' du firewall, s'il contient un
firewall statefull. Dans ces cas là, ça devrait s'arranger une fois que
les timeouts seront expirés. Sinon, reboote assuré...

Alors si quelqu'un y comprends quelque chose qu'il ne se prive pas
d'étaler sa science. Merci :)


Bah, voilà toujours quelques pistes...




Merci pour ces pistes, et pour info, ce bug est reproductible, à chaque
lancement de aule, avec une variante. En effet, parfois le bug fait
planter la machine et je dois faire un reboot mécanique à chaud.
Ctrl+Alt+F1 ... et autres ne répondant pas.