Depuis aujourd'hui midi, j'ai plein d'erreurs DMA lors d'opérations disque.
Dans le doute j'ai :
- changé de disque dur
- changé la nappe du disque dur
- changé de connecteur sur la carte mère
Malgrès tout, rien n'y fait j'ai toujours ces erreurs (voir en fin de
message)
A savoir que cet ensemble de messages d'erreur vient d'avant le
changement de disque dur (un vieux Maxtor 1 Go même pas UDMA). Ces
messages d'erreur se sont terminé par un plantage de la machine, et une
impossibilité de rebooter (erreur d'accès au disque lors du dmesg)
J'ai donc changé de disque dur (un je sais plus quoi, repris d'un vieux
G3 beige, 8 Go, UDMA33). Lors de l'install d'OpenBSD, j'avais les
messages de timeout et de downgradage de UDMA2 vers UDMA1.
J'ai donc déplacé le disque sur un autre connecteur de la carte mère, et
l'install s'est déroulée sans erreur. En revanche, lors de
l'installation de cvsup via les ports, j'ai de nouveau eu les messages
timeout / downgrade
Dois-je en déduire que la carte mère est au bord du décès ? Ou bien
forcer le BIOS en PIO et non UDMA (chose que je n'ai pas encore essayé)
pourrait changer la donne ?
Messages d'erreur (long)
Oct 8 11:30:23 bampeikun /bsd: wd0(pciide0:0:1): timeout
Oct 8 11:32:37 bampeikun /bsd: type: ata
Oct 8 11:32:37 bampeikun /bsd: c_bcount: 16384
Oct 8 11:32:37 bampeikun /bsd: c_skip: 0
Oct 8 11:32:37 bampeikun /bsd: wd0a: device timeout writing fsbn 3200 of
3200-3231 (wd0 bn 3263; cn 0 tn 51 sn 50), retrying
Oct 8 11:32:38 bampeikun /bsd: wd0(pciide0:0:1): timeout
Oct 8 11:32:38 bampeikun /bsd: type: ata
Oct 8 11:32:38 bampeikun /bsd: c_bcount: 16384
Oct 8 11:32:38 bampeikun /bsd: c_skip: 0
Oct 8 11:32:38 bampeikun /bsd: wd0a: device timeout writing fsbn 3200 of
3200-3231 (wd0 bn 3263; cn 0 tn 51 sn 50), retrying
Oct 8 11:32:38 bampeikun /bsd: wd0(pciide0:0:1): timeout
Oct 8 11:32:38 bampeikun /bsd: type: ata
Oct 8 11:32:38 bampeikun /bsd: c_bcount: 16384
Oct 8 11:32:38 bampeikun /bsd: c_skip: 0
Oct 8 11:32:38 bampeikun /bsd: wd0a: device timeout writing fsbn 3200 of
3200-3231 (wd0 bn 3263; cn 0 tn 51 sn 50), retrying
Oct 8 11:32:38 bampeikun /bsd: wd0(pciide0:0:1): timeout
Oct 8 11:32:38 bampeikun /bsd: type: ata
Oct 8 11:32:38 bampeikun /bsd: c_bcount: 16384
Oct 8 11:32:39 bampeikun /bsd: c_skip: 0
Oct 8 11:32:39 bampeikun /bsd: wd0: transfer error, downgrading to PIO
mode 4
Oct 8 11:32:39 bampeikun /bsd: wd0(pciide0:0:1): using PIO mode 4
Oct 8 11:32:39 bampeikun /bsd: wd0a: device timeout writing fsbn 3200 of
3200-3231 (wd0 bn 3263; cn 0 tn 51 sn 50), retrying
Oct 8 11:32:39 bampeikun /bsd: wd0: soft error (corrected)
Oct 8 11:32:39 bampeikun /bsd: wd0(pciide0:0:1): timeout
Oct 8 11:32:39 bampeikun /bsd: type: ata
Oct 8 11:32:39 bampeikun /bsd: c_bcount: 16384
Oct 8 11:32:39 bampeikun /bsd: c_skip: 0
Oct 8 11:32:39 bampeikun /bsd: wd0a: device timeout writing fsbn 3232 of
3232-3263 (wd0 bn 3295; cn 0 tn 52 sn 19), retrying
Oct 8 11:32:39 bampeikun /bsd: wd0: soft error (corrected)
Oct 8 11:33:24 bampeikun /bsd: wd0(pciide0:0:1): timeout
Oct 8 11:33:24 bampeikun /bsd: type: ata
Oct 8 11:33:24 bampeikun /bsd: c_bcount: 16384
Oct 8 11:33:24 bampeikun /bsd: c_skip: 0
Oct 8 11:33:24 bampeikun /bsd: pciide0 channel 0: reset failed for drive 1
Oct 8 11:33:24 bampeikun /bsd: wd0a: device timeout writing fsbn 332448 of
332448-332479 (wd0 bn 332511; cn 82 tn 29 sn 60), retrying
Oct 8 11:33:24 bampeikun /bsd: pciide0:0:1: not ready,
st=0xff<BSY,DRDY,DWF,DSC,DRQ,CORR,IDX,ERR>, err=0x00
Oct 8 11:33:25 bampeikun /bsd: wd0a: device timeout writing fsbn 332448 of
332448-332479 (wd0 bn 332511; cn 82 tn 29 sn 60), retrying
Oct 8 11:33:25 bampeikun /bsd: wd0(pciide0:0:1): timeout
Oct 8 11:33:25 bampeikun /bsd: type: ata
Oct 8 11:33:25 bampeikun /bsd: c_bcount: 16384
Oct 8 11:33:25 bampeikun /bsd: c_skip: 0
Oct 8 11:33:25 bampeikun /bsd: wd0a: device timeout writing fsbn 332448 of
332448-332479 (wd0 bn 332511; cn 82 tn 29 sn 60), retrying
Oct 8 11:33:25 bampeikun /bsd: wd0: soft error (corrected)
Oct 8 11:32:26 bampeikun openvpn[17213]: write UDPv4: No buffer space
available (code=55)
Oct 8 11:33:25 bampeikun /bsd: pciide0:0:1: timeout waiting for DRQ,
st=0x51<DRDY,DSC,ERR>, err=0x00
Oct 8 11:33:25 bampeikun /bsd: wd0a: device timeout writing fsbn 448160 of
448160-448187 (wd0 bn 448223; cn 111 tn 10 sn 41), retrying
Oct 8 11:33:25 bampeikun /bsd: wd0: soft error (corrected)
Oct 8 11:33:25 bampeikun /bsd: pciide0:0:1: timeout waiting for DRQ,
st=0x51<DRDY,DSC,ERR>, err=0x00
Oct 8 11:33:25 bampeikun /bsd: wd0a: device timeout writing fsbn 330976 of
330976-331007 (wd0 bn 331039; cn 82 tn 6 sn 37), retrying
Oct 8 11:33:25 bampeikun /bsd: wd0(pciide0:0:1): timeout
Oct 8 11:33:26 bampeikun /bsd: type: ata
Oct 8 11:33:26 bampeikun /bsd: c_bcount: 16384
Oct 8 11:33:26 bampeikun /bsd: c_skip: 0
Oct 8 11:33:26 bampeikun /bsd: wd0a: device timeout writing fsbn 330976 of
330976-331007 (wd0 bn 331039; cn 82 tn 6 sn 37), retrying
Oct 8 11:33:26 bampeikun /bsd: wd0: soft error (corrected)
Oct 8 11:32:26 bampeikun last message repeated 2 times
Oct 8 11:33:24 bampeikun ppp[794]: Warning: Carrier settings ignored
Oct 8 11:33:34 bampeikun /bsd: wd0a: aborted command reading fsbn
121724 of
121724-121727 (wd0 bn 121787; cn 30 tn 13 sn 8), retrying
Oct 8 11:41:15 bampeikun /bsd: wd0: soft error (corrected)
Oct 8 11:41:15 bampeikun /bsd: pciide0:0:1: not ready,
st=0xff<BSY,DRDY,DWF,DSC,DRQ,CORR,IDX,ERR>, err=0x00
Oct 8 11:41:15 bampeikun /bsd: wd0a: device timeout writing fsbn 448160 of
448160-448191 (wd0 bn 448223; cn 111 tn 10 sn 41), retrying
Oct 8 11:41:15 bampeikun /bsd: wd0(pciide0:0:1): timeout
Oct 8 11:41:15 bampeikun /bsd: type: ata
Oct 8 11:41:15 bampeikun /bsd: c_bcount: 16384
Oct 8 11:41:16 bampeikun /bsd: c_skip: 0
Oct 8 11:41:16 bampeikun /bsd: wd0a: device timeout writing fsbn 448160 of
448160-448191 (wd0 bn 448223; cn 111 tn 10 sn 41), retrying
Oct 8 11:41:16 bampeikun /bsd: wd0(pciide0:0:1): timeout
Oct 8 11:41:16 bampeikun /bsd: type: ata
Oct 8 11:41:16 bampeikun /bsd: c_bcount: 16384
Oct 8 11:41:16 bampeikun /bsd: c_skip: 0
Oct 8 11:41:16 bampeikun /bsd: wd0a: device timeout writing fsbn 448160 of
448160-448191 (wd0 bn 448223; cn 111 tn 10 sn 41), retrying
Oct 8 11:41:17 bampeikun /bsd: wd0(pciide0:0:1): timeout
Oct 8 11:41:17 bampeikun /bsd: type: ata
Oct 8 11:41:17 bampeikun /bsd: c_bcount: 16384
Oct 8 11:41:17 bampeikun /bsd: c_skip: 0
Oct 8 11:41:17 bampeikun /bsd: pciide0 channel 0: reset failed for drive 1
Oct 8 11:41:17 bampeikun /bsd: wd0a: device timeout writing fsbn 448160 of
448160-448191 (wd0 bn 448223; cn 111 tn 10 sn 41), retrying
Oct 8 11:41:17 bampeikun /bsd: pciide0:0:1: not ready,
st=0xff<BSY,DRDY,DWF,DSC,DRQ,CORR,IDX,ERR>, err=0x00
Oct 8 11:41:17 bampeikun /bsd: wd0a: device timeout writing fsbn 448160 of
448160-448191 (wd0 bn 448223; cn 111 tn 10 sn 41), retrying
Oct 8 11:41:17 bampeikun /bsd: wd0: soft error (corrected)
Oct 8 11:41:18 bampeikun /bsd: wd0(pciide0:0:1): timeout
Oct 8 11:41:18 bampeikun /bsd: type: ata
Oct 8 11:41:18 bampeikun /bsd: c_bcount: 2048
Oct 8 11:41:18 bampeikun /bsd: c_skip: 0
Oct 8 11:41:18 bampeikun /bsd: wd0a: device timeout reading fsbn 146076 of
146076-146079 (wd0 bn 146139; cn 36 tn 15 sn 42), retrying
Oct 8 11:41:18 bampeikun /bsd: wd0: soft error (corrected)
Oct 8 11:41:18 bampeikun /bsd: pciide0:0:1: timeout waiting for DRQ,
st=0x51<DRDY,DSC,ERR>, err=0x00
Oct 8 11:41:18 bampeikun /bsd: wd0a: device timeout writing fsbn 330752 of
330752-330783 (wd0 bn 330815; cn 82 tn 3 sn 2), retrying
Oct 8 11:41:18 bampeikun /bsd: wd0(pciide0:0:1): timeout
Oct 8 11:41:18 bampeikun /bsd: type: ata
Oct 8 11:41:18 bampeikun /bsd: c_bcount: 16384
Oct 8 11:41:18 bampeikun /bsd: c_skip: 0
Oct 8 11:41:18 bampeikun /bsd: pciide0 channel 0: reset failed for drive 1
Oct 8 11:41:18 bampeikun /bsd: wd0a: device timeout writing fsbn 330752 of
330752-330783 (wd0 bn 330815; cn 82 tn 3 sn 2), retrying
Oct 8 11:41:19 bampeikun /bsd: wd0(pciide0:0:1): timeout
Oct 8 11:41:19 bampeikun /bsd: type: ata
Oct 8 11:41:19 bampeikun /bsd: c_bcount: 16384
Oct 8 11:41:19 bampeikun /bsd: c_skip: 0
Oct 8 11:41:19 bampeikun /bsd: pciide0 channel 0: reset failed for drive 1
Oct 8 11:41:19 bampeikun /bsd: wd0a: device timeout writing fsbn 330752 of
330752-330783 (wd0 bn 330815; cn 82 tn 3 sn 2), retrying
Oct 8 11:41:19 bampeikun /bsd: pciide0:0:1: not ready,
st=0xfe<BSY,DRDY,DWF,DSC,DRQ,CORR,IDX>, err=0x00
Oct 8 11:41:19 bampeikun /bsd: pciide0 channel 0: reset failed for drive 1
Oct 8 11:41:19 bampeikun /bsd: wd0a: device timeout writing fsbn 330752 of
330752-330783 (wd0 bn 330815; cn 82 tn 3 sn 2), retrying
Oct 8 11:41:19 bampeikun /bsd: pciide0:0:1: not ready,
st=0xfe<BSY,DRDY,DWF,DSC,DRQ,CORR,IDX>, err=0x00
Oct 8 11:41:19 bampeikun /bsd: pciide0 channel 0: reset failed for drive 1
Oct 8 11:41:19 bampeikun /bsd: wd0a: device timeout writing fsbn 330752 of
330752-330783 (wd0 bn 330815; cn 82 tn 3 sn 2), retrying
Oct 8 11:41:19 bampeikun /bsd: pciide0:0:1: not ready,
st=0xfe<BSY,DRDY,DWF,DSC,DRQ,CORR,IDX>, err=0x00
Oct 8 11:41:19 bampeikun /bsd: pciide0 channel 0: reset failed for drive 1
Oct 8 11:41:19 bampeikun /bsd: wd0a: device timeout writing fsbn 330752 of
330752-330783 (wd0 bn 330815; cn 82 tn 3 sn 2)
Oct 8 11:41:19 bampeikun /bsd: pciide0:0:1: not ready,
st=0xfe<BSY,DRDY,DWF,DSC,DRQ,CORR,IDX>, err=0x00
Oct 8 11:41:19 bampeikun /bsd: pciide0 channel 0: reset failed for drive 1
Oct 8 11:41:20 bampeikun /bsd: wd0a: device timeout writing fsbn 330976 of
330976-331007 (wd0 bn 331039; cn 82 tn 6 sn 37), retrying
Oct 8 11:41:20 bampeikun /bsd: pciide0:0:1: not ready,
st=0xff<BSY,DRDY,DWF,DSC,DRQ,CORR,IDX,ERR>, err=0x00
Oct 8 11:41:20 bampeikun /bsd: wd0a: device timeout writing fsbn 330976 of
330976-331007 (wd0 bn 331039; cn 82 tn 6 sn 37), retrying
Oct 8 11:41:20 bampeikun /bsd: wd0: soft error (corrected)
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
Miod Vallat
J'ai donc changé de disque dur (un je sais plus quoi, repris d'un vieux G3 beige, 8 Go, UDMA33). Lors de l'install d'OpenBSD, j'avais les messages de timeout et de downgradage de UDMA2 vers UDMA1.
J'ai donc déplacé le disque sur un autre connecteur de la carte mère, et l'install s'est déroulée sans erreur. En revanche, lors de
Jusqu'ici, c'est normal : selon la présence d'autres périphériques sur la nappe, il est possible qu'il ne soit pas possible de faire de l'UDMA2, et au premier accès, le noyau s'adapte correctement en UDMA1.
l'installation de cvsup via les ports, j'ai de nouveau eu les messages timeout / downgrade
Bon, là bien sûr, c'est moins drôle.
Parmi les possibilités : - la géométrie du disque est incorrecte dans le disklabel (ah, les joies de l'ide), du coup le noyau essaie d'accéder à des zones physiquement inexistantes. - la nappe est mal enfichée ou a un faux contact, du coup certaines opérations provoquent des timeout. - le disque est en train de décéder, au moins localement, du coup certains accès échouent et finissent assez souvent, dans un premier temps, en «soft error».
Dois-je en déduire que la carte mère est au bord du décès ? Ou bien forcer le BIOS en PIO et non UDMA (chose que je n'ai pas encore essayé) pourrait changer la donne ?
Le noyau se réadapte déjà en PIO 4 de son propre chef. Essayer de forcer un mode plus lent n'engage à rien et peut s'avérer une bonne solution.
Après, il pourrait aussi s'agir d'un contrôleur ide malheureux ; pciide(4) en mentionne quelques-uns pour lesquels il est nécessaire de prendre des précautions.
J'ai donc changé de disque dur (un je sais plus quoi, repris d'un vieux
G3 beige, 8 Go, UDMA33). Lors de l'install d'OpenBSD, j'avais les
messages de timeout et de downgradage de UDMA2 vers UDMA1.
J'ai donc déplacé le disque sur un autre connecteur de la carte mère, et
l'install s'est déroulée sans erreur. En revanche, lors de
Jusqu'ici, c'est normal : selon la présence d'autres périphériques sur
la nappe, il est possible qu'il ne soit pas possible de faire de
l'UDMA2, et au premier accès, le noyau s'adapte correctement en UDMA1.
l'installation de cvsup via les ports, j'ai de nouveau eu les messages
timeout / downgrade
Bon, là bien sûr, c'est moins drôle.
Parmi les possibilités :
- la géométrie du disque est incorrecte dans le disklabel (ah, les joies
de l'ide), du coup le noyau essaie d'accéder à des zones physiquement
inexistantes.
- la nappe est mal enfichée ou a un faux contact, du coup certaines
opérations provoquent des timeout.
- le disque est en train de décéder, au moins localement, du coup
certains accès échouent et finissent assez souvent, dans un premier
temps, en «soft error».
Dois-je en déduire que la carte mère est au bord du décès ? Ou bien
forcer le BIOS en PIO et non UDMA (chose que je n'ai pas encore essayé)
pourrait changer la donne ?
Le noyau se réadapte déjà en PIO 4 de son propre chef. Essayer de forcer
un mode plus lent n'engage à rien et peut s'avérer une bonne solution.
Après, il pourrait aussi s'agir d'un contrôleur ide malheureux ;
pciide(4) en mentionne quelques-uns pour lesquels il est nécessaire de
prendre des précautions.
J'ai donc changé de disque dur (un je sais plus quoi, repris d'un vieux G3 beige, 8 Go, UDMA33). Lors de l'install d'OpenBSD, j'avais les messages de timeout et de downgradage de UDMA2 vers UDMA1.
J'ai donc déplacé le disque sur un autre connecteur de la carte mère, et l'install s'est déroulée sans erreur. En revanche, lors de
Jusqu'ici, c'est normal : selon la présence d'autres périphériques sur la nappe, il est possible qu'il ne soit pas possible de faire de l'UDMA2, et au premier accès, le noyau s'adapte correctement en UDMA1.
l'installation de cvsup via les ports, j'ai de nouveau eu les messages timeout / downgrade
Bon, là bien sûr, c'est moins drôle.
Parmi les possibilités : - la géométrie du disque est incorrecte dans le disklabel (ah, les joies de l'ide), du coup le noyau essaie d'accéder à des zones physiquement inexistantes. - la nappe est mal enfichée ou a un faux contact, du coup certaines opérations provoquent des timeout. - le disque est en train de décéder, au moins localement, du coup certains accès échouent et finissent assez souvent, dans un premier temps, en «soft error».
Dois-je en déduire que la carte mère est au bord du décès ? Ou bien forcer le BIOS en PIO et non UDMA (chose que je n'ai pas encore essayé) pourrait changer la donne ?
Le noyau se réadapte déjà en PIO 4 de son propre chef. Essayer de forcer un mode plus lent n'engage à rien et peut s'avérer une bonne solution.
Après, il pourrait aussi s'agir d'un contrôleur ide malheureux ; pciide(4) en mentionne quelques-uns pour lesquels il est nécessaire de prendre des précautions.