reboot de serveur, et aucune piste du pourquoi ???
2 réponses
Eric Belhomme
Bonjour,
j'ai un serveur perso qui tourne sous GNU/linux Debian woody et qui fait
plein de choses :
- hot spot wifi
- routeur Internet
- firewall
- werveur ouèbe
- serveur de mail (SMTP/IMAP/webmail)
- serveur de news
- serveur de fichiers (NFS/SMB) avec du LVM
- ... des trucs que j'oublie encore !
depuis quelques jours, ce PC reboote tout seul !
hole:/home/rico# last
rico pts/0 192.168.12.58 Wed Feb 9 09:05 still logged in
reboot system boot 2.4.26 Wed Feb 9 07:01 (02:12)
reboot system boot 2.4.26 Wed Feb 9 06:31 (02:42)
reboot system boot 2.4.26 Tue Feb 8 23:11 (10:02)
reboot system boot 2.4.26 Tue Feb 8 22:31 (10:42)
reboot system boot 2.4.26 Tue Feb 8 20:36 (12:37)
reboot system boot 2.4.26 Tue Feb 8 19:26 (13:47)
reboot system boot 2.4.26 Tue Feb 8 17:46 (15:27)
rico pts/0 192.168.12.58 Tue Feb 8 16:43 - crash (01:02)
reboot system boot 2.4.26 Tue Feb 8 16:34 (16:39)
rico pts/0 192.168.12.58 Tue Feb 8 14:42 - crash (01:52)
reboot system boot 2.4.26 Tue Feb 8 14:26 (18:47)
rico pts/0 192.168.12.58 Tue Feb 8 11:33 - crash (02:52)
reboot system boot 2.4.26 Tue Feb 8 11:31 (21:42)
rico pts/1 192.168.12.58 Tue Feb 8 11:25 - crash (00:06)
rico pts/0 192.168.12.58 Tue Feb 8 11:17 - crash (00:14)
reboot system boot 2.4.26 Tue Feb 8 10:36 (22:37)
rico pts/1 192.168.12.58 Tue Feb 8 09:34 - crash (01:02)
rico pts/0 192.168.12.58 Tue Feb 8 09:12 - crash (01:23)
Je ne trouve aucune trace de crash dans mes logs et je n'ai vraiment
aucune idée de ce qui peut bien se passer... Alors je suis ouvert à
toutes les suggestions...
Voici mon dmesg :
hole:/home/rico# cat /var/log/dmesg
Linux version 2.4.26 (root@devtux) (gcc version 2.95.4 20011002 (Debian
prerelease)) #1 lun jun 28 22:46:40 CEST 2004
BIOS-provided physical RAM map:
BIOS-e820: 0000000000000000 - 000000000009fc00 (usable)
BIOS-e820: 000000000009fc00 - 00000000000a0000 (reserved)
BIOS-e820: 00000000000f0000 - 0000000000100000 (reserved)
BIOS-e820: 0000000000100000 - 000000001ffec000 (usable)
BIOS-e820: 000000001ffec000 - 000000001ffef000 (ACPI data)
BIOS-e820: 000000001ffef000 - 000000001ffff000 (reserved)
BIOS-e820: 000000001ffff000 - 0000000020000000 (ACPI NVS)
BIOS-e820: 00000000ffff0000 - 0000000100000000 (reserved)
511MB LOWMEM available.
On node 0 totalpages: 131052
zone(0): 4096 pages.
zone(1): 126956 pages.
zone(2): 0 pages.
ACPI: RSDP (v000 ASUS ) @ 0x000f6d90
ACPI: RSDT (v001 ASUS A7V266 0x30303031 MSFT 0x31313031) @ 0x1ffec000
ACPI: FADT (v001 ASUS A7V266 0x30303031 MSFT 0x31313031) @ 0x1ffec080
ACPI: BOOT (v001 ASUS A7V266 0x30303031 MSFT 0x31313031) @ 0x1ffec040
ACPI: DSDT (v001 ASUS A7V266 0x00001000 MSFT 0x0100000b) @ 0x00000000
Kernel command line: auto BOOT_IMAGE=Linux_2.4.26 ro root=806
Initializing CPU#0
Detected 1477.400 MHz processor.
Console: colour dummy device 80x25
Calibrating delay loop... 2949.12 BogoMIPS
Memory: 515088k/524208k available (1877k kernel code, 8732k reserved,
780k data, 112k init, 0k highmem)
Dentry cache hash table entries: 65536 (order: 7, 524288 bytes)
Inode cache hash table entries: 32768 (order: 6, 262144 bytes)
Mount cache hash table entries: 512 (order: 0, 4096 bytes)
Buffer cache hash table entries: 32768 (order: 5, 131072 bytes)
Page-cache hash table entries: 131072 (order: 7, 524288 bytes)
CPU: L1 I Cache: 64K (64 bytes/line), D cache 64K (64 bytes/line)
CPU: L2 Cache: 256K (64 bytes/line)
Intel machine check architecture supported.
Intel machine check reporting enabled on CPU#0.
CPU: After generic, caps: 0383f9ff c1cbf9ff 00000000 00000000
CPU: Common caps: 0383f9ff c1cbf9ff 00000000 00000000
CPU: AMD Athlon(TM) XP1700+ stepping 02
Enabling fast FPU save and restore... done.
Enabling unmasked SIMD FPU exception support... done.
Checking 'hlt' instruction... OK.
POSIX conformance testing by UNIFIX
mtrr: v1.40 (20010327) Richard Gooch (rgooch@atnf.csiro.au)
mtrr: detected mtrr type: Intel
ACPI: Subsystem revision 20040326
PCI: PCI BIOS revision 2.10 entry at 0xf0ec0, last bus=1
PCI: Using configuration type 1
ACPI: IRQ9 SCI: Level Trigger.
ACPI-0165: *** Error: No object was returned from
[\_SB_.PCI0.PX40.UAR2._STA] (Node c1596300), AE_NOT_EXIST
ACPI: Interpreter enabled
ACPI: Using PIC for interrupt routing
ACPI: System [ACPI] (supports S0 S1 S4 S5)
ACPI: PCI Interrupt Link [LNKA] (IRQs 3 4 5 6 7 9 10 *11 12 14 15)
ACPI: PCI Interrupt Link [LNKB] (IRQs 3 4 5 6 7 9 10 11 12 14 15)
ACPI: PCI Interrupt Link [LNKC] (IRQs 3 4 5 6 7 9 10 11 12 14 15)
ACPI: PCI Interrupt Link [LNKD] (IRQs 3 4 5 6 7 *9 10 11 12 14 15)
ACPI: PCI Root Bridge [PCI0] (00:00)
PCI: Probing PCI hardware (bus 00)
ACPI: PCI Interrupt Routing Table [\_SB_.PCI0._PRT]
ACPI: PCI Interrupt Routing Table [\_SB_.PCI0.PCI1._PRT]
PCI: Probing PCI hardware
ACPI: PCI Interrupt Link [LNKB] enabled at IRQ 11
ACPI: PCI Interrupt Link [LNKD] enabled at IRQ 9
ACPI: PCI Interrupt Link [LNKA] enabled at IRQ 11
ACPI: PCI Interrupt Link [LNKC] enabled at IRQ 10
PCI: Using ACPI for IRQ routing
PCI: if you experience problems, try using option 'pci=noacpi' or even
'acpi=off'
isapnp: Scanning for PnP cards...
isapnp: No Plug & Play device found
Linux NET4.0 for Linux 2.4
Based upon Swansea University Computer Society NET3.039
Initializing RT netlink socket
IA-32 Microcode Update Driver: v1.14 <tigran@veritas.com>
Starting kswapd
VFS: Disk quotas vdquot_6.5.1
Journalled Block Device driver loaded
Installing knfsd (copyright (C) 1996 okir@monad.swb.de).
ACPI: Power Button (FF) [PWRF]
ACPI: Processor [CPU0] (supports C1)
parport0: PC-style at 0x378 (0x778) [PCSPP,TRISTATE,EPP]
parport0: irq 7 detected
vesafb: framebuffer at 0xfa000000, mapped to 0xe0813000, size 1536k
vesafb: mode is 1024x768x8, linelength=1024, pages=4
vesafb: protected mode interface info at c000:0590
vesafb: scrolling: redraw
Console: switching to colour frame buffer device 128x48
fb0: VESA VGA frame buffer device
pty: 256 Unix98 ptys configured
Serial driver version 5.05c (2001-07-08) with MANY_PORTS SHARE_IRQ
SERIAL_PCI ISAPNP enabled
ttyS00 at 0x03f8 (irq = 4) is a 16550A
ttyS01 at 0x02f8 (irq = 3) is a 16550A
Floppy drive(s): fd0 is 1.44M
FDC 0 is a post-1991 82077
Linux agpgart interface v0.99 (c) Jeff Hartmann
agpgart: Maximum main memory to use for agp memory: 439M
agpgart: Detected Via Apollo Pro KT266 chipset
agpgart: AGP aperture is 32M @ 0xfc000000
Uniform Multi-Platform E-IDE driver Revision: 7.00beta4-2.4
ide: Assuming 33MHz system bus speed for PIO modes; override with
idebus=xx
VP_IDE: IDE controller at PCI slot 00:11.1
VP_IDE: chipset revision 6
VP_IDE: not 100% native mode: will probe irqs later
ide: Assuming 33MHz system bus speed for PIO modes; override with
idebus=xx
VP_IDE: VIA vt8233 (rev 00) IDE UDMA100 controller on pci00:11.1
ide0: BM-DMA at 0xb400-0xb407, BIOS settings: hda:DMA, hdb:pio
ide1: BM-DMA at 0xb408-0xb40f, BIOS settings: hdc:DMA, hdd:pio
hda: ST3120026A, ATA DISK drive
blk: queue c03e1300, I/O limit 4095Mb (mask 0xffffffff)
hdc: ST3120026A, ATA DISK drive
blk: queue c03e176c, I/O limit 4095Mb (mask 0xffffffff)
ide0 at 0x1f0-0x1f7,0x3f6 on irq 14
ide1 at 0x170-0x177,0x376 on irq 15
hda: attached ide-disk driver.
hda: host protected area => 1
hda: 234441648 sectors (120034 MB) w/8192KiB Cache, CHS=14593/255/63,
UDMA(100)
hdc: attached ide-disk driver.
hdc: host protected area => 1
hdc: 234441648 sectors (120034 MB) w/8192KiB Cache, CHS=14593/255/63,
UDMA(100)
Partition check:
hda: unknown partition table
hdc: unknown partition table
SCSI subsystem driver Revision: 1.00
scsi0 : Adaptec AIC7XXX EISA/VLB/PCI SCSI HBA DRIVER, Rev 6.2.36
<Adaptec 2940 Ultra SCSI adapter>
aic7880: Ultra Wide Channel A, SCSI Id=7, 16/253 SCBs
(scsi0:A:0): 40.000MB/s transfers (20.000MHz, offset 8, 16bit)
Vendor: IBM Model: DDRS-34560W Rev: S97B
Type: Direct-Access ANSI SCSI revision: 02
(scsi0:A:1): 20.000MB/s transfers (20.000MHz, offset 15)
Vendor: IBM Model: DDRS-39130 Rev: S97B
Type: Direct-Access ANSI SCSI revision: 02
(scsi0:A:2): 20.000MB/s transfers (20.000MHz, offset 15)
Vendor: IBM Model: DDRS-39130 Rev: S97B
Type: Direct-Access ANSI SCSI revision: 02
(scsi0:A:5): 20.000MB/s transfers (20.000MHz, offset 7)
Vendor: YAMAHA Model: CRW2100S Rev: 1.0H
Type: CD-ROM ANSI SCSI revision: 02
(scsi0:A:6): 5.000MB/s transfers (5.000MHz, offset 8)
Vendor: SONY Model: SDT-5000 Rev: 325H
Type: Sequential-Access ANSI SCSI revision: 02
scsi0:A:0:0: Tagged Queuing enabled. Depth 253
scsi0:A:1:0: Tagged Queuing enabled. Depth 253
scsi0:A:2:0: Tagged Queuing enabled. Depth 253
Attached scsi disk sda at scsi0, channel 0, id 0, lun 0
Attached scsi disk sdb at scsi0, channel 0, id 1, lun 0
Attached scsi disk sdc at scsi0, channel 0, id 2, lun 0
SCSI device sda: 8925000 512-byte hdwr sectors (4570 MB)
sda: sda1 sda2 < sda5 sda6 >
SCSI device sdb: 17850000 512-byte hdwr sectors (9139 MB)
sdb: unknown partition table
SCSI device sdc: 17850000 512-byte hdwr sectors (9139 MB)
sdc: unknown partition table
usb.c: registered new driver usbdevfs
usb.c: registered new driver hub
host/usb-uhci.c: $Revision: 1.275 $ time 22:49:08 Jun 28 2004
host/usb-uhci.c: High bandwidth mode enabled
host/usb-uhci.c: USB UHCI at I/O 0xb000, IRQ 9
host/usb-uhci.c: Detected 2 ports
usb.c: new USB bus registered, assigned bus number 1
hub.c: USB hub found
hub.c: 2 ports detected
host/usb-uhci.c: USB UHCI at I/O 0xa800, IRQ 9
host/usb-uhci.c: Detected 2 ports
usb.c: new USB bus registered, assigned bus number 2
hub.c: USB hub found
hub.c: 2 ports detected
host/usb-uhci.c: USB UHCI at I/O 0xa400, IRQ 9
host/usb-uhci.c: Detected 2 ports
usb.c: new USB bus registered, assigned bus number 3
hub.c: USB hub found
hub.c: 2 ports detected
host/usb-uhci.c: v1.275:USB Universal Host Controller Interface driver
I2O Core - (C) Copyright 1999 Red Hat Software
I2O: Event thread created as pid 13
I2O configuration manager v 0.04.
(C) Copyright 1999 Red Hat Software
i2c-core.o: i2c core module version 2.8.4 (20040207)
i2c-dev.o: i2c /dev entries driver module version 2.8.4 (20040207)
i2c-proc.o version 2.8.4 (20040207)
md: md driver 0.90.0 MAX_MD_DEVS=256, MD_SB_DISKS=27
md: Autodetecting RAID arrays.
md: autorun ...
md: ... autorun DONE.
LVM version 1.0.8(17/11/2003)
pci_hotplug: PCI Hot Plug PCI Core version: 0.5
Initializing Cryptographic API
NET4: Linux TCP/IP 1.0 for NET4.0
IP Protocols: ICMP, UDP, TCP
IP: routing cache hash table of 4096 buckets, 32Kbytes
TCP: Hash tables configured (established 32768 bind 32768)
ip_conntrack version 2.1 (4095 buckets, 32760 max) - 288 bytes per
conntrack
ip_tables: (C) 2000-2002 Netfilter core team
arp_tables: (C) 2002 David S. Miller
NET4: Unix domain sockets 1.0/SMP for Linux NET4.0.
NET4: Ethernet Bridge 008 for NET4.0
EXT3-fs: INFO: recovery required on readonly filesystem.
EXT3-fs: write access will be enabled during recovery.
kjournald starting. Commit interval 5 seconds
EXT3-fs: sd(8,6): orphan cleanup on readonly fs
ext3_orphan_cleanup: deleting unreferenced inode 97948
ext3_orphan_cleanup: deleting unreferenced inode 97923
EXT3-fs: sd(8,6): 2 orphan inodes deleted
EXT3-fs: recovery complete.
EXT3-fs: mounted filesystem with ordered data mode.
VFS: Mounted root (ext3 filesystem) readonly.
Freeing unused kernel memory: 112k freed
Adding Swap: 265032k swap-space (priority -1)
EXT3 FS 2.4-0.9.19, 19 August 2002 on sd(8,6), internal journal
Real Time Clock Driver v1.10f
PCI: Enabling device 00:10.0 (0014 -> 0017)
3c59x: Donald Becker and others. www.scyld.com/network/vortex.html
See Documentation/networking/vortex.txt
00:10.0: 3Com PCI 3c905B Cyclone 100baseTx at 0xb800. Vers LK1.1.18-ac
00:04:76:19:94:f3, IRQ 9
product code 4d4c rev 00.12 date 02-01-01
Internal config register is 1800000, transceivers 0xa.
8K byte-wide RAM 5:3 Rx:Tx split, autoselect/Autonegotiate interface.
MII transceiver found at address 24, status 786d.
Enabling bus-master transmits and whole-frame receives.
00:10.0: scatter/gather enabled. h/w checksums enabled
epic100.c:v1.11 1/7/2001 Written by Donald Becker <becker@scyld.com>
http://www.scyld.com/network/epic100.html
(unofficial 2.4.x kernel port, version 1.11+LK1.1.14, Aug 4, 2002)
PCI: Enabling device 00:0f.0 (0004 -> 0007)
epic100(00:0f.0): MII transceiver #3 control 3000 status 7809.
epic100(00:0f.0): Autonegotiation advertising 01e1 link partner 0001.
eth1: SMSC EPIC/100 83c170 at 0xd000, IRQ 10, 00:e0:29:47:95:44.
Loaded prism54 driver, version 1.2
PCI: Enabling device 00:0d.0 (0014 -> 0016)
eth2: prism54 driver detected card model: SMC2802W
IPv6 v0.8 for NET4.0
IPv6 over IPv4 tunneling driver
i2c-viapro.o version 2.8.6 (20040405)
i2c-dev.o: Registered 'SMBus Via Pro adapter at e800' as minor 0
i2c-isa.o version 2.8.6 (20040405)
i2c-dev.o: Registered 'ISA main adapter' as minor 1
w83781d.o version 2.8.6 (20040405)
Attached scsi CD-ROM sr0 at scsi0, channel 0, id 5, lun 0
sr0: scsi3-mmc drive: 40x/40x writer cd/rw xa/form2 cdda tray
Uniform CD-ROM driver Revision: 3.12
loop: loaded (max 8 devices)
ttyS2: LSR safety check engaged!
ttyS2: LSR safety check engaged!
kjournald starting. Commit interval 5 seconds
EXT3 FS 2.4-0.9.19, 19 August 2002 on lvm(58,2), internal journal
EXT3-fs: mounted filesystem with ordered data mode.
kjournald starting. Commit interval 5 seconds
EXT3 FS 2.4-0.9.19, 19 August 2002 on lvm(58,0), internal journal
EXT3-fs: mounted filesystem with ordered data mode.
eth2: islpci_open()
eth2: resetting device...
eth2: uploading firmware...
eth2: firmware uploaded done, now triggering reset...
eth2: mgt_commit has failed. Restart the device
hole:/home/rico#
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
Michel Tatoute
Le Wed, 09 Feb 2005 07:10:48 +0000, Eric Belhomme a écrit :
Bonjour,
j'ai un serveur perso qui tourne sous GNU/linux Debian woody et qui fait plein de choses : - hot spot wifi - routeur Internet - firewall - werveur ouèbe - serveur de mail (SMTP/IMAP/webmail) - serveur de news - serveur de fichiers (NFS/SMB) avec du LVM - ... des trucs que j'oublie encore !
depuis quelques jours, ce PC reboote tout seul !
hole:/home/rico# last rico pts/0 192.168.12.58 Wed Feb 9 09:05 still logged in reboot system boot 2.4.26 Wed Feb 9 07:01 (02:12) reboot system boot 2.4.26 Wed Feb 9 06:31 (02:42) reboot system boot 2.4.26 Tue Feb 8 23:11 (10:02) reboot system boot 2.4.26 Tue Feb 8 22:31 (10:42) reboot system boot 2.4.26 Tue Feb 8 20:36 (12:37) reboot system boot 2.4.26 Tue Feb 8 19:26 (13:47) reboot system boot 2.4.26 Tue Feb 8 17:46 (15:27) rico pts/0 192.168.12.58 Tue Feb 8 16:43 - crash (01:02) reboot system boot 2.4.26 Tue Feb 8 16:34 (16:39) rico pts/0 192.168.12.58 Tue Feb 8 14:42 - crash (01:52) reboot system boot 2.4.26 Tue Feb 8 14:26 (18:47) rico pts/0 192.168.12.58 Tue Feb 8 11:33 - crash (02:52) reboot system boot 2.4.26 Tue Feb 8 11:31 (21:42) rico pts/1 192.168.12.58 Tue Feb 8 11:25 - crash (00:06) rico pts/0 192.168.12.58 Tue Feb 8 11:17 - crash (00:14) reboot system boot 2.4.26 Tue Feb 8 10:36 (22:37) rico pts/1 192.168.12.58 Tue Feb 8 09:34 - crash (01:02) rico pts/0 192.168.12.58 Tue Feb 8 09:12 - crash (01:23)
Je ne trouve aucune trace de crash dans mes logs et je n'ai vraiment aucune idée de ce qui peut bien se passer... Alors je suis ouvert à toutes les suggestions...
Voici mon dmesg :
hole:/home/rico# cat /var/log/dmesg Linux version 2.4.26 () (gcc version 2.95.4 20011002 (Debian prerelease)) #1 lun jun 28 22:46:40 CEST 2004 [...]
eth2: islpci_open() eth2: resetting device... eth2: uploading firmware... eth2: firmware uploaded done, now triggering reset... eth2: mgt_commit has failed. Restart the device hole:/home/rico#
On dirait un watchdog. Pas sur mais ce <<triggering reset>> ...
Tu n'as pas quelque part un 'netdev watchdog'? Quoi que cela soit?
Un watchdog est un systeme qui reboote la machine si on ne le calme pas régulièrement (si on ne lui signale pas qu'on est vivant). C'est bien pratique dans un serveur pour assurer une continuité de service face a une défaillance, mais ca peut faire rebooter indefiniment en cas de pb.
Michel.
Merci pur votre aide
Le Wed, 09 Feb 2005 07:10:48 +0000, Eric Belhomme a écrit :
Bonjour,
j'ai un serveur perso qui tourne sous GNU/linux Debian woody et qui fait
plein de choses :
- hot spot wifi
- routeur Internet
- firewall
- werveur ouèbe
- serveur de mail (SMTP/IMAP/webmail)
- serveur de news
- serveur de fichiers (NFS/SMB) avec du LVM
- ... des trucs que j'oublie encore !
depuis quelques jours, ce PC reboote tout seul !
hole:/home/rico# last
rico pts/0 192.168.12.58 Wed Feb 9 09:05 still logged in
reboot system boot 2.4.26 Wed Feb 9 07:01 (02:12)
reboot system boot 2.4.26 Wed Feb 9 06:31 (02:42)
reboot system boot 2.4.26 Tue Feb 8 23:11 (10:02)
reboot system boot 2.4.26 Tue Feb 8 22:31 (10:42)
reboot system boot 2.4.26 Tue Feb 8 20:36 (12:37)
reboot system boot 2.4.26 Tue Feb 8 19:26 (13:47)
reboot system boot 2.4.26 Tue Feb 8 17:46 (15:27)
rico pts/0 192.168.12.58 Tue Feb 8 16:43 - crash (01:02)
reboot system boot 2.4.26 Tue Feb 8 16:34 (16:39)
rico pts/0 192.168.12.58 Tue Feb 8 14:42 - crash (01:52)
reboot system boot 2.4.26 Tue Feb 8 14:26 (18:47)
rico pts/0 192.168.12.58 Tue Feb 8 11:33 - crash (02:52)
reboot system boot 2.4.26 Tue Feb 8 11:31 (21:42)
rico pts/1 192.168.12.58 Tue Feb 8 11:25 - crash (00:06)
rico pts/0 192.168.12.58 Tue Feb 8 11:17 - crash (00:14)
reboot system boot 2.4.26 Tue Feb 8 10:36 (22:37)
rico pts/1 192.168.12.58 Tue Feb 8 09:34 - crash (01:02)
rico pts/0 192.168.12.58 Tue Feb 8 09:12 - crash (01:23)
Je ne trouve aucune trace de crash dans mes logs et je n'ai vraiment
aucune idée de ce qui peut bien se passer... Alors je suis ouvert à
toutes les suggestions...
Voici mon dmesg :
hole:/home/rico# cat /var/log/dmesg
Linux version 2.4.26 (root@devtux) (gcc version 2.95.4 20011002 (Debian
prerelease)) #1 lun jun 28 22:46:40 CEST 2004
[...]
eth2: islpci_open()
eth2: resetting device...
eth2: uploading firmware...
eth2: firmware uploaded done, now triggering reset...
eth2: mgt_commit has failed. Restart the device
hole:/home/rico#
On dirait un watchdog. Pas sur mais ce <<triggering reset>> ...
Tu n'as pas quelque part un 'netdev watchdog'? Quoi que cela soit?
Un watchdog est un systeme qui reboote la machine si on ne le calme pas
régulièrement (si on ne lui signale pas qu'on est vivant). C'est bien
pratique dans un serveur pour assurer une continuité de service face a
une défaillance, mais ca peut faire rebooter indefiniment en cas de pb.
Le Wed, 09 Feb 2005 07:10:48 +0000, Eric Belhomme a écrit :
Bonjour,
j'ai un serveur perso qui tourne sous GNU/linux Debian woody et qui fait plein de choses : - hot spot wifi - routeur Internet - firewall - werveur ouèbe - serveur de mail (SMTP/IMAP/webmail) - serveur de news - serveur de fichiers (NFS/SMB) avec du LVM - ... des trucs que j'oublie encore !
depuis quelques jours, ce PC reboote tout seul !
hole:/home/rico# last rico pts/0 192.168.12.58 Wed Feb 9 09:05 still logged in reboot system boot 2.4.26 Wed Feb 9 07:01 (02:12) reboot system boot 2.4.26 Wed Feb 9 06:31 (02:42) reboot system boot 2.4.26 Tue Feb 8 23:11 (10:02) reboot system boot 2.4.26 Tue Feb 8 22:31 (10:42) reboot system boot 2.4.26 Tue Feb 8 20:36 (12:37) reboot system boot 2.4.26 Tue Feb 8 19:26 (13:47) reboot system boot 2.4.26 Tue Feb 8 17:46 (15:27) rico pts/0 192.168.12.58 Tue Feb 8 16:43 - crash (01:02) reboot system boot 2.4.26 Tue Feb 8 16:34 (16:39) rico pts/0 192.168.12.58 Tue Feb 8 14:42 - crash (01:52) reboot system boot 2.4.26 Tue Feb 8 14:26 (18:47) rico pts/0 192.168.12.58 Tue Feb 8 11:33 - crash (02:52) reboot system boot 2.4.26 Tue Feb 8 11:31 (21:42) rico pts/1 192.168.12.58 Tue Feb 8 11:25 - crash (00:06) rico pts/0 192.168.12.58 Tue Feb 8 11:17 - crash (00:14) reboot system boot 2.4.26 Tue Feb 8 10:36 (22:37) rico pts/1 192.168.12.58 Tue Feb 8 09:34 - crash (01:02) rico pts/0 192.168.12.58 Tue Feb 8 09:12 - crash (01:23)
Je ne trouve aucune trace de crash dans mes logs et je n'ai vraiment aucune idée de ce qui peut bien se passer... Alors je suis ouvert à toutes les suggestions...
Voici mon dmesg :
hole:/home/rico# cat /var/log/dmesg Linux version 2.4.26 () (gcc version 2.95.4 20011002 (Debian prerelease)) #1 lun jun 28 22:46:40 CEST 2004 [...]
eth2: islpci_open() eth2: resetting device... eth2: uploading firmware... eth2: firmware uploaded done, now triggering reset... eth2: mgt_commit has failed. Restart the device hole:/home/rico#
On dirait un watchdog. Pas sur mais ce <<triggering reset>> ...
Tu n'as pas quelque part un 'netdev watchdog'? Quoi que cela soit?
Un watchdog est un systeme qui reboote la machine si on ne le calme pas régulièrement (si on ne lui signale pas qu'on est vivant). C'est bien pratique dans un serveur pour assurer une continuité de service face a une défaillance, mais ca peut faire rebooter indefiniment en cas de pb.
Michel.
Merci pur votre aide
Eric Belhomme
Michel Tatoute wrote in news::
On dirait un watchdog. Pas sur mais ce <<triggering reset>> ... Tu n'as pas quelque part un 'netdev watchdog'? Quoi que cela soit?
Il n'y a pas de watchdog sur cette machine.
Un watchdog est un systeme qui reboote la machine si on ne le calme pas rgulirement (si on ne lui signale pas qu'on est vivant). C'est bien pratique dans un serveur pour assurer une continuit de service face a une dfaillance, mais ca peut faire rebooter indefiniment en cas de pb.
non, rien à voir de ce coté là. ma carte wifi utilise le module prism54. Ce module s'appuie sur le sous-système hotplug pour uploader le firmware de la carte lors de son initialisation. Une fois le firmware chargé, la carte est resetté, c'est tout !
-- Rico
Michel Tatoute <tatoute@alussinan.org> wrote in
news:pan.2005.02.09.12.59.21.701955@alussinan.org:
On dirait un watchdog. Pas sur mais ce <<triggering reset>> ...
Tu n'as pas quelque part un 'netdev watchdog'? Quoi que cela soit?
Il n'y a pas de watchdog sur cette machine.
Un watchdog est un systeme qui reboote la machine si on ne le calme pas
rgulirement (si on ne lui signale pas qu'on est vivant). C'est bien
pratique dans un serveur pour assurer une continuit de service face a
une dfaillance, mais ca peut faire rebooter indefiniment en cas de pb.
non, rien à voir de ce coté là. ma carte wifi utilise le module prism54. Ce
module s'appuie sur le sous-système hotplug pour uploader le firmware de la
carte lors de son initialisation. Une fois le firmware chargé, la carte est
resetté, c'est tout !
On dirait un watchdog. Pas sur mais ce <<triggering reset>> ... Tu n'as pas quelque part un 'netdev watchdog'? Quoi que cela soit?
Il n'y a pas de watchdog sur cette machine.
Un watchdog est un systeme qui reboote la machine si on ne le calme pas rgulirement (si on ne lui signale pas qu'on est vivant). C'est bien pratique dans un serveur pour assurer une continuit de service face a une dfaillance, mais ca peut faire rebooter indefiniment en cas de pb.
non, rien à voir de ce coté là. ma carte wifi utilise le module prism54. Ce module s'appuie sur le sous-système hotplug pour uploader le firmware de la carte lors de son initialisation. Une fois le firmware chargé, la carte est resetté, c'est tout !