kernel bug - Lenny 2.6.26-2-amd64

Le
Alain Vaugham
Bonsoir la liste,


La machine a planté lors de copies de backup (quelques Go).
Je l'ai redémarré. Tout me sembe fonctionner normalement.

Que me faudrait-il vérifier en particulier?


Là où ça s'est planté :

Aug 10 20:57:01 mach05 /USR/SBIN/CRON[1742]: (userfacteur) CMD (fetchmail
> /dev/null 2>&1)
Aug 10 20:57:51 mach05 kernel: [40268.916052] BUG: unable to handle kernel=

paging request at ffffa469c1d84000
Aug 10 20:57:51 mach05 kernel: [40268.916126] IP: [<ffffffff8028166a>]
handle_mm_fault+0xdb/0x867
Aug 10 20:57:51 mach05 kernel: [40268.916184] PGD 0
Aug 10 20:57:51 mach05 kernel: [40268.916215] Oops: 0000 [1] SMP
Aug 10 20:57:51 mach05 kernel: [40268.916251] CPU 0
Aug 10 20:57:51 mach05 kernel: [40268.916282] Modules linked in: appletalk=

nfsd lockd nfs_acl auth_rpcgss sunrpc exportfs ipv6 loop psmouse pcspkr
serio_raw snd_pcm snd_timer snd soundcore snd_page_alloc k8temp i2c_piix4
button i2c_cor
e shpchp pci_hotplug evdev ext3 jbd mbcache sd_mod ide_disk ide_pci_generic=

3c59x mii e1000 ehci_hcd ohci_hcd sata_svw serverworks ide_core ata_generic=

libata scsi_mod dock thermal processor fan thermal_sys [last unloaded:
scsi_wait_scan]
Aug 10 20:57:51 mach05 kernel: [40268.916623] Pid: 3623, comm: imap-login N=
ot
tainted 2.6.26-2-amd64 #1
Aug 10 20:57:51 mach05 kernel: [40268.916665] RIP: 0010:[<ffffffff8028166a>=
]
[<ffffffff8028166a>] handle_mm_fault+0xdb/0x86
[]


--
Alain Vaugham
Clef GPG : 0xD26D18BC

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers debian-user-french-REQUEST@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmaster@lists.debian.org
Archive: http://lists.debian.org/201008102243.48343.alain@vaugham.com
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Jean-Yves F. Barbier
Le #22459421
Le Tue, 10 Aug 2010 22:43:48 +0200,
Alain Vaugham
Aug 10 20:57:01 mach05 /USR/SBIN/CRON[1742]: (userfacteur) CMD (fetchmail
> /dev/null 2>&1)



Etonnant, d'habitude c'est l'inverse qu'on fait: redirection de stderr vers
stdin, puis le tout vers /dev/null, soit: fetchmail 2>&1 >/dev/null

Aug 10 20:57:51 mach05 kernel: [40268.916052] BUG: unable to handle
kernel paging request at ffffa469c1d84000
Aug 10 20:57:51 mach05 kernel: [40268.916126] IP: [<ffffffff8028166a>]
handle_mm_fault+0xdb/0x867



Apparemment c'est une faute RAM; lance un memtest86+ soit à partir de
ton bootloader, soit à partir d'un CD bootable pour voir ce qu'il
rapporte (ET laisse-le tourner longtemps -> plusieurs cycles complets
parce que certaines pannes nécessitent une certaine montée en tem pérature
avant déclenchement.)

--
The final delusion is the belief that one has lost all delusions.
-- Maurice Chapelain, "Main courante"

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Alain Vaugham
Le #22459571
Le Tuesday 10 August 2010 22:56:36 Jean-Yves F. Barbier, vous avez écr it :
Le Tue, 10 Aug 2010 22:43:48 +0200,

Alain Vaugham > Aug 10 20:57:01 mach05 /USR/SBIN/CRON[1742]: (userfacteur) CMD (fetchma il
>
> > /dev/null 2>&1)

Etonnant, d'habitude c'est l'inverse qu'on fait: redirection de stderr ve rs
stdin, puis le tout vers /dev/null, soit: fetchmail 2>&1 >/dev/null



J'ai recopié ça depuis un tuto sans connaître le principe.


> Aug 10 20:57:51 mach05 kernel: [40268.916052] BUG: unable to handle
> kernel paging request at ffffa469c1d84000
> Aug 10 20:57:51 mach05 kernel: [40268.916126] IP: [<ffffffff8028166a>]
> handle_mm_fault+0xdb/0x867

Apparemment c'est une faute RAM; lance un memtest86+ soit à partir de



J'ai testé la RAM pendant au moins 48h avant la mise en service. il y a
plusieurs mois. Je vais le refaire


Merci

--
Alain Vaugham
Clef GPG : 0xD26D18BC

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Jean-Yves F. Barbier
Le #22459561
Le Tue, 10 Aug 2010 23:14:45 +0200,
Alain Vaugham
...
> > Aug 10 20:57:51 mach05 kernel: [40268.916052] BUG: unable to handle
> > kernel paging request at ffffa469c1d84000
> > Aug 10 20:57:51 mach05 kernel: [40268.916126] IP: [<ffffffff8028166a>]
> > handle_mm_fault+0xdb/0x867
>
> Apparemment c'est une faute RAM; lance un memtest86+ soit à partir de

J'ai testé la RAM pendant au moins 48h avant la mise en service. il y a
plusieurs mois. Je vais le refaire



J'ai récemment vu de la RAM se mettre à déconner (sans doute à cause d'une
dérive des tolérances composants) au bout de 3 ans de bons servic es.

*SI* elle est protégée par des radiateurs, le premier test est de couper,
les démonter et les prendre en main (PAS les pins de contact!!) pour v oir
s'il n'y a pas une (grosse) différence de température; la plus ch aude étant
celle en faute (héhé:)
Et pas touche si les chips ne sont pas protégés.

Sinon laisse tourner le test 48H.

Si après 48H tu n'as pas d'erreurs, c'est que ça viendrait plut ôt d'une
compilation locale utilisant vraisemblablement pgalloc.

--
Wisdom is rarely found on the best-seller list.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Jean-Yves F. Barbier
Le #22459591
Le Tue, 10 Aug 2010 23:14:45 +0200,
Alain Vaugham
Oops: gros oubli. évidemment, ça peut très bien venir du ker nel aussi...

--
Live Free or Live in Massachusetts.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Sylvain Sauvage
Le #22459811
Alain Vaugham, mardi 10 août 2010, 23:14:45 CEST
[…]
> > > /dev/null 2>&1)
>
> Etonnant, d'habitude c'est l'inverse qu'on fait: redirection de stderr vers
> stdin, puis le tout vers /dev/null, soit: fetchmail 2>&1 >/dev/null


^^ out

J'ai recopié ça depuis un tuto sans connaître le principe.



Et c’est la bonne façon si on veut tout envoyer vers /dev/nu ll.
a) '2>&1' redirige le descripteur de fichier n°2 (= stderr)
vers le même fichier que le n°1 (= stdout),
b) '>/dev/null' redirige le n°1 vers le fichier /dev/null.

a) puis b) redirige donc d’abord 2 vers le tty (puisque c†™est
ce que pointe 1 à ce moment-là) puis 1 vers /dev/null — d onc on
a les erreurs en sortie standard —, alors que b) puis a) (comme
tu le fais) envoie la sortie standard vers /dev/null puis la
sortie d’erreur sur la même chose que la 1, donc /dev/null.

$ { echo out; echo err >&2; } 2>&1 >/dev/null
→ "err"
$ { echo out; echo err >&2; } >/dev/null 2>&1
→ # RIEN

En cas de doute : tester… ou '>/dev/null 2>/dev/null' :o)

[…]
J'ai testé la RAM pendant au moins 48h avant la mise en service. il y a
plusieurs mois. Je vais le refaire



Vérifie aussi si tes barrettes sont à la bonne tension, si
c’est réglable par le bios (et que la tension préfér ée des
barrettes t’est connue…) ; le bios n’ajuste pa s forcément
correctement (tension plus haute → plus chaud ; j’ai e u le
problème avec des « basse tension »).

--
Sylvain Sauvage

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Jean-Yves F. Barbier
Le #22460871
Le Wed, 11 Aug 2010 04:56:17 +0200,
Sylvain Sauvage
...
Et c’est la bonne façon si on veut tout envoyer vers /dev/ null.



Mouarf: je viens de retrouver ma note d'il-y-a 8 ans expliquant ça; po ur
une fois que je peux me relire facilement, j'aurai dû:)

--
f u cn rd ths, itn tyg h myxbl cd.

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Alain Vaugham
Le #22461061
Le Wednesday 11 August 2010 04:56:17 Sylvain Sauvage, vous avez écrit  :
Alain Vaugham, mardi 10 août 2010, 23:14:45 CEST



[...]

> J'ai recopié ça depuis un tuto sans connaître le princip e.

Et c’est la bonne façon si on veut tout envoyer vers /dev/ null.


$ { echo out; echo err >&2; } 2>&1 >/dev/null
→ "err"
$ { echo out; echo err >&2; } >/dev/null 2>&1
→ # RIEN

En cas de doute : tester… ou '>/dev/null 2>/dev/null' :o)



Merci beaucoup pour l'explication. Je n'ai pas encore tout compris mais cel a
va me permettre de pratiquer.



Vérifie aussi si tes barrettes sont à la bonne tension, si



Je vais vérifier ça ce week-end avec le test de mémoire pend ant 48h.


--
Alain Vaugham
Clef GPG : 0xD26D18BC

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Archive: http://lists.debian.org/
Publicité
Poster une réponse
Anonyme