hier soir, gros souci d'un coup sur mon serveur Sarge. D'abord je remarque =
que=20
toutes mes connexions ssh sont mortes et impossible de se reconnecter.=20
Ensuite, mes connexions wifi (driver madwifi) ne fonctionne plus. Puis je=20
vais voir sur le serveur lui-m=EAme et X a plant=E9, plus d'acc=E8s =E0 la =
machine,=20
le clavier ne r=E9pond plus. Donc je suis oblig=E9 d'=E9teindre sauvagement=
=2E=20
Reboot, =E7a marche mais plus de wifi. Un iwconfig me dit :
Warning: Driver for device ath0 has been compiled with version 18
of Wireless Extension, while this program supports up to version 17.
Some things may be broken...
Jamais vu =E7a auparavant...
Je vais voir dans syslog :
Nov 23 08:40:20 machine kernel: CPU: 0
Nov 23 08:40:20 machine kernel: EIP: 0060:[pg0+956415535/1069782016] =
=20
Tainted: P VLI
Nov 23 08:40:20 machine kernel: EFLAGS: 00013286 (2.6.13-arkamons.1)
Nov 23 08:40:20 machine kernel: EIP is at _nv001477rm+0x33/0x94 [nvidia]
Nov 23 08:40:20 machine kernel: eax: f510a800 ebx: f5169120 ecx: ea60f5=
0f =20
edx: f5169120
Nov 23 08:40:20 machine kernel: esi: f97437a0 edi: 00000007 ebp: f55a5d=
6c =20
esp: f55a5d44
Nov 23 08:40:20 machine kernel: ds: 007b es: 007b ss: 0068
Nov 23 08:40:20 machine kernel: Process XFree86 (pid: 4579,=20
threadinfo=3Df55a4000 task=3Df57a3570)
Nov 23 08:40:20 machine kernel: Stack: f7433c00 00000004 00000000 f97437a0=
=20
00000000 f97437a0 00000000 f55a5da0
Nov 23 08:40:20 machine kernel: f93e1a66 f7265800 f55a5d9c f93e0c14=
=20
f97437a0 c1d00005 00000007 00000000
Nov 23 08:40:20 machine kernel: f9743580 00000002 f50fea60 f97437b4=
=20
f97437cc f95e145a f55a5dcc f93e0d52
Nov 23 08:40:20 machine kernel: Call Trace:
Nov 23 08:40:20 machine kernel: [pg0+956418662/1069782016]=20
rm_disable_interrupts+0x42/0x54 [nvidia]
Nov 23 08:40:20 machine kernel: [pg0+956414996/1069782016]=20
_nv004752rm+0x38/0x58 [nvidia]
Nov 23 08:40:20 machine kernel: [pg0+958514266/1069782016]=20
os_pci_read_dword+0x3d/0x45 [nvidia]
Nov 23 08:40:20 machine kernel: [pg0+956415314/1069782016]=20
_nv001472rm+0x8a/0x94 [nvidia]
Nov 23 08:40:20 machine kernel: [pg0+956391690/1069782016]=20
_nv002123rm+0x12/0x18 [nvidia]
Nov 23 08:40:20 machine kernel: [pg0+956419934/1069782016]=20
rm_free_unused_clients+0x2e/0x88 [nvidia]
Nov 23 08:40:20 machine kernel: [pg0+956419989/1069782016]=20
rm_free_unused_clients+0x65/0x88 [nvidia]
Nov 23 08:40:20 machine kernel: [pg0+956419969/1069782016]=20
rm_free_unused_clients+0x51/0x88 [nvidia]
Nov 23 08:40:20 machine kernel: [pg0+958498188/1069782016]=20
nv_kern_close+0x7d/0x135 [nvidia]
Nov 23 08:40:20 machine kernel: [__fput+398/416] __fput+0x18e/0x1a0
Nov 23 08:40:20 machine kernel: [filp_close+77/128] filp_close+0x4d/0x80
Nov 23 08:40:20 machine kernel: [put_files_struct+86/192]=20
put_files_struct+0x56/0xc0
Nov 23 08:40:20 machine kernel: [do_exit+249/896] do_exit+0xf9/0x380
Nov 23 08:40:20 machine kernel: [do_group_exit+52/112]=20
do_group_exit+0x34/0x70
Nov 23 08:40:20 machine kernel: [get_signal_to_deliver+473/688]=20
get_signal_to_deliver+0x1d9/0x2b0
Nov 23 08:40:20 machine kernel: [do_signal+145/288] do_signal+0x91/0x120
Nov 23 08:40:20 machine kernel: [sys_tgkill+245/256] sys_tgkill+0xf5/0x100
Nov 23 08:40:20 machine kernel: [dput+398/416] dput+0x18e/0x1a0
Nov 23 08:40:20 machine kernel: [__fput+298/416] __fput+0x12a/0x1a0
Nov 23 08:40:20 machine kernel: [sigprocmask+72/176] sigprocmask+0x48/0xb0
Nov 23 08:40:20 machine kernel: [sys_rt_sigprocmask+130/224]=20
sys_rt_sigprocmask+0x82/0xe0
Nov 23 08:40:20 machine kernel: [do_notify_resume+53/56]=20
do_notify_resume+0x35/0x38
Nov 23 08:40:20 machine kernel: [work_notifysig+19/21]=20
work_notifysig+0x13/0x15
Nov 23 08:40:20 machine kernel: Code: 53 8b 75 08 8b 7d 10 83 c4 fc a1 44 b=
0=20
65 f9 6a 00 6a 04 50 8b 40 18 ff d0 8b 9e 88 0
0 00 00 89 da 00 c4 10 eb 0b 8d b6 00 00 00 <00> 89 da 8b 5b 18 85 db 74 48=
39=20
7b 14 75 f2 8b 45 0c 39 03 75
Nov 23 08:40:20 machine kernel: <1>Fixing recursive fault but reboot is=20
needed!
La carte graphique est une nvidia GeForce FX 5200, qui marchait tr=E8s bien=
avec=20
le driver proprio 7676.
Pas d'autre message inqui=E9tant dans ce fichier. Au d=E9marrage (et=20
dans /var/log/boot) , je lis :
Tue Aug 30 11:35:31 2005: Cleaning /tmpfind: ./1038349296: Input/output err=
or
Tue Aug 30 11:35:31 2005: find: ./ssh-kzaxng4226: Input/output error
Tue Aug 30 11:35:31 2005: find: ./ssh-WFZtfq4226: Input/output error
Tue Aug 30 11:35:31 2005: find: ./1038349296: Input/output error
Tue Aug 30 11:35:31 2005: find: ./ssh-kzaxng4226: Input/output error
Tue Aug 30 11:35:32 2005: find: ./ssh-WFZtfq4226: Input/output error
Remarquez la date: 30 ao=FBt ! on dirait que ce fichier n'a pas =E9t=E9 act=
ualis=E9=20
alors que j'ai red=E9marr=E9 ce matin !
Les machines tournent sur un noyau 2.6.13 compil=E9 par mes soins, sont tou=
tes=20
en Sarge, et je n'ai rien touch=E9 concernant le noyau avant ce plantage. T=
out=20
marchait nikel jusque l=E0 (uptime d'une 30aine de jours sur le serveur). L=
a=20
derni=E8re mise =E0 jour (celle de hier) :
[MIS A JOUR] libnetpbm10 2:10.0-8sarge1 -> 2:10.0-8sarge2
[MIS A JOUR] libnetpbm9 2:10.0-8sarge1 -> 2:10.0-8sarge2
[MIS A JOUR] netpbm 2:10.0-8sarge1 -> 2:10.0-8sarge2
Voil=E0 o=F9 j'en suis. J'ai cherch=E9 un peu partout dans les logs, et rie=
n qui ne=20
me met la puce =E0 l'oreille. Je continue mes recherches, mais si vous avez=
une=20
id=E9e, je suis tr=E8s preneur.
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
fabrice régnier
> Bonjour,
salut,
dans /var/log/boot) , je lis : Remarquez la date: 30 août ! on dirait que ce fichier n'a pas été actualisé alors que j'ai redémarré ce matin !
pour activer le log dans /var/log/boot ou kern.log (je ne sais plus) , il faut
FR-PORT:/# cat /etc/default/bootlogd # Run bootlogd at startup ? BOOTLOGD_ENABLE=yes
Peut-être BOOTLOGD_ENABLE n'est pas positionné ?
> le serveur lui-même et X a planté Perso, je pense que les serveurs graphiques sur des serveurs de production sont une mauvaise idée. ssh devrait convenir non ? ou webmin ?
a+
f.
-- Pensez à lire la FAQ de la liste avant de poser une question : http://wiki.debian.net/?DebianFrench
Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"
To UNSUBSCRIBE, email to with a subject of "unsubscribe". Trouble? Contact
> Bonjour,
salut,
dans /var/log/boot) , je lis :
Remarquez la date: 30 août ! on dirait que ce fichier n'a pas été actualisé
alors que j'ai redémarré ce matin !
pour activer le log dans /var/log/boot ou kern.log (je ne sais plus) ,
il faut
FR-PORT:/# cat /etc/default/bootlogd
# Run bootlogd at startup ?
BOOTLOGD_ENABLE=yes
Peut-être BOOTLOGD_ENABLE n'est pas positionné ?
> le serveur lui-même et X a planté
Perso, je pense que les serveurs graphiques sur des serveurs de
production sont une mauvaise idée. ssh devrait convenir non ? ou webmin ?
a+
f.
--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench
Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"
To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org
dans /var/log/boot) , je lis : Remarquez la date: 30 août ! on dirait que ce fichier n'a pas été actualisé alors que j'ai redémarré ce matin !
pour activer le log dans /var/log/boot ou kern.log (je ne sais plus) , il faut
FR-PORT:/# cat /etc/default/bootlogd # Run bootlogd at startup ? BOOTLOGD_ENABLE=yes
Peut-être BOOTLOGD_ENABLE n'est pas positionné ?
> le serveur lui-même et X a planté Perso, je pense que les serveurs graphiques sur des serveurs de production sont une mauvaise idée. ssh devrait convenir non ? ou webmin ?
a+
f.
-- Pensez à lire la FAQ de la liste avant de poser une question : http://wiki.debian.net/?DebianFrench
Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"
To UNSUBSCRIBE, email to with a subject of "unsubscribe". Trouble? Contact
steve
Le Mercredi, 23 Novembre 2005 10.39, fabrice régnier a écrit :
> Bonjour,
salut,
> dans /var/log/boot) , je lis : > Remarquez la date: 30 août ! on dirait que ce fichier n'a pas été > actualisé alors que j'ai redémarré ce matin !
pour activer le log dans /var/log/boot ou kern.log (je ne sais plus) , il faut
FR-PORT:/# cat /etc/default/bootlogd # Run bootlogd at startup ? BOOTLOGD_ENABLE=yes
fait depuis le premier jour de l'installation.
Peut-être BOOTLOGD_ENABLE n'est pas positionné ?
> le serveur lui-même et X a planté
Perso, je pense que les serveurs graphiques sur des serveurs de production sont une mauvaise idée. ssh devrait convenir non ? ou webmin ?
oui je suis d'accord, mais là c'est un serveur maison, donc pas trop de s ouci. J'ai juste quelques utilisateurs mécontents ce matin ;-)
a+
f.
Le Mercredi, 23 Novembre 2005 10.39, fabrice régnier a écrit :
> Bonjour,
salut,
> dans /var/log/boot) , je lis :
> Remarquez la date: 30 août ! on dirait que ce fichier n'a pas été
> actualisé alors que j'ai redémarré ce matin !
pour activer le log dans /var/log/boot ou kern.log (je ne sais plus) ,
il faut
FR-PORT:/# cat /etc/default/bootlogd
# Run bootlogd at startup ?
BOOTLOGD_ENABLE=yes
fait depuis le premier jour de l'installation.
Peut-être BOOTLOGD_ENABLE n'est pas positionné ?
> le serveur lui-même et X a planté
Perso, je pense que les serveurs graphiques sur des serveurs de
production sont une mauvaise idée. ssh devrait convenir non ? ou webmin ?
oui je suis d'accord, mais là c'est un serveur maison, donc pas trop de s ouci.
J'ai juste quelques utilisateurs mécontents ce matin ;-)
Le Mercredi, 23 Novembre 2005 10.39, fabrice régnier a écrit :
> Bonjour,
salut,
> dans /var/log/boot) , je lis : > Remarquez la date: 30 août ! on dirait que ce fichier n'a pas été > actualisé alors que j'ai redémarré ce matin !
pour activer le log dans /var/log/boot ou kern.log (je ne sais plus) , il faut
FR-PORT:/# cat /etc/default/bootlogd # Run bootlogd at startup ? BOOTLOGD_ENABLE=yes
fait depuis le premier jour de l'installation.
Peut-être BOOTLOGD_ENABLE n'est pas positionné ?
> le serveur lui-même et X a planté
Perso, je pense que les serveurs graphiques sur des serveurs de production sont une mauvaise idée. ssh devrait convenir non ? ou webmin ?
oui je suis d'accord, mais là c'est un serveur maison, donc pas trop de s ouci. J'ai juste quelques utilisateurs mécontents ce matin ;-)
a+
f.
steve
Le Mercredi, 23 Novembre 2005 11.22, steve a écrit :
Bonjour,
j'ai solutionné le problème par un simple changement de noyau -> 2.6.14 .2.
Néanmoins, je n'ai pas compris le pourquoi du comment ce qui me chagrine un peu. De plus je trouve bizarre que d'un coup le système ait merdé de ce tte façon, sans raison apparente, alors qu'il tournait très bien jusque-l à.
De plus le problème que le fichier /var/log/boot ne contienne pas les mes sages de démarrage persiste, très bizarre...
Merci et belle journée.
steve
Le Mercredi, 23 Novembre 2005 11.22, steve a écrit :
Bonjour,
j'ai solutionné le problème par un simple changement de noyau -> 2.6.14 .2.
Néanmoins, je n'ai pas compris le pourquoi du comment ce qui me chagrine un
peu. De plus je trouve bizarre que d'un coup le système ait merdé de ce tte
façon, sans raison apparente, alors qu'il tournait très bien jusque-l à.
De plus le problème que le fichier /var/log/boot ne contienne pas les mes sages
de démarrage persiste, très bizarre...
Le Mercredi, 23 Novembre 2005 11.22, steve a écrit :
Bonjour,
j'ai solutionné le problème par un simple changement de noyau -> 2.6.14 .2.
Néanmoins, je n'ai pas compris le pourquoi du comment ce qui me chagrine un peu. De plus je trouve bizarre que d'un coup le système ait merdé de ce tte façon, sans raison apparente, alors qu'il tournait très bien jusque-l à.
De plus le problème que le fichier /var/log/boot ne contienne pas les mes sages de démarrage persiste, très bizarre...