OVH Cloud OVH Cloud

SCSI en détresse !

6 réponses
Avatar
Wilfried BARNAVON
Salut tout le monde !
J'ai besoin d'un coup de main:
sur une machine équipée de 2 disques IDE + un rack IDE,
carte mère au chipset de type i443 BX j'ai installé une carte SCSI
AHA 2940U + un disque Compaq UW2 de type BB00921B91.

Système d'exploitation original: RedHat 7.2 multiplement mis à jour et
tournant tres bien en IDE
(les mises à jour proviennent pour la plupart de recherches sur rpmfind.net
plus quelques autres)
Puis j'ai compilé mon noyau 2.4.21 + patch-o-matic (iptables) + patch mppe
necessaire pour pptpd
avec les options suivantes:
Adaptec AIC7xxx support = Y
Maximum number of TCQ commands per device = 253
Initial bus reset delay in milli-seconds ) = 15000

Avant d'exposer le problème completement quelques précisions pour eviter les
banalités ;) :
La carte et le disque sont bien détectés par le noyau au démarrage.
Le disque a été testé avec l'utilitaire de la carte et pas de soucis , pas
de secteurs défectueux.
Le disque ne présente pas de PB avec la carte sous Windaube.
La nappe présente un terminateur. Pour être sûr elle a été changée. Il
s'agit d'une nappe SCSI 2 avec un convertisseur
mis sur la carte pour passer de la connectique SCSI 40 pin de la carte à
la connectique SCSI 2 de la nappe.
Bref voila le problème:
quand Linux démarre tout va bien. Puis au bout de 30 à 300s lors d'accès sur
le disque Le noyau lance des alertes
et le disque devient inaccessible. Pas moyen d'adresser un secteur . Voici
les alertes (attention il faut les lire de bas en haut
car elles sont issues d'un tac /var/log/messages):

Aug 7 15:38:39 fire kernel: rity error detected in Status phase.
SEQADDR(0x1ac)
Aug 7 15:39:19 fire kernel: scsi0:0:0:0: Attempting to queue an ABORT
message
Aug 7 15:39:10 fire kernel: aic7xxx_abort returns 0x2002
Aug 7 15:39:10 fire kernel: scsi0:0:0:0: Cmd aborted from QINFIFO
Aug 7 15:39:10 fire kernel: DevQ(0:0:0): 0 waiting
Aug 7 15:39:10 fire kernel: Untagged Q(0): 2
Aug 7 15:39:10 fire kernel: Kernel Free SCB list: 1 0
Aug 7 15:39:10 fire kernel: Pending list: 2(c 0x10, s 0x7, l 0)
Aug 7 15:39:10 fire kernel: Sequencer SCB Info: 0(c 0x10, s 0x7, l 0, t
0x2) 1(
c 0x0, s 0xff, l 255, t 0xff) 2(c 0x0, s 0xff, l 255, t 0xff) 3(c 0x0, s
0xff, l
255, t 0xff) 4(c 0x0, s 0xff, l 255, t 0xff) 5(c 0x0, s 0xff, l 255, t
0xff) 6(
c 0x0, s 0xff, l 255, t 0xff) 7(c 0x0, s 0xff, l 255, t 0xff) 8(c 0x0, s
0xff, l
255, t 0xff) 9(c 0x0, s 0xff, l 255, t 0xff) 10(c 0x0, s 0xff, l 255, t
0xff) 1
1(c 0x0, s 0xff, l 255, t 0xff) 12(c 0x0, s 0xff, l 255, t 0xff) 13(c 0x0, s
0xf
f, l 255, t 0xff) 14(c 0x0, s 0xff, l 255, t 0xff) 15(c 0x0, s 0xff, l 255,
t 0xff)
Aug 7 15:39:10 fire kernel: Sequencer Free SCB List: 1 2 3 4 5 6 7 8 9 10
11 12 13 14 15
Aug 7 15:39:10 fire kernel: QOUTFIFO entries:
Aug 7 15:39:09 fire kernel: Disconnected Queue entries:
Aug 7 15:39:09 fire kernel: Waiting Queue entries: 0:2
Aug 7 15:39:09 fire kernel: QINFIFO entries:
Aug 7 15:39:09 fire kernel: Card NEXTQSCB = 3
Aug 7 15:39:09 fire kernel: Kernel NEXTQSCB = 3
Aug 7 15:39:09 fire kernel: SCB count = 4
Aug 7 15:39:09 fire kernel: STACK == 0x17, 0x186, 0x0, 0x43
Aug 7 15:39:09 fire kernel: SSTAT0 = 0x5, SSTAT1 = 0x13
Aug 7 15:39:09 fire kernel: LASTPHASE = 0x1, SCSISIGI = 0xa6, SXFRCTL0 =
0x80
Aug 7 15:39:09 fire kernel: DFCNTRL = 0x4, DFSTATUS = 0x6d
Aug 7 15:39:09 fire kernel: SCSISEQ = 0x1a, SBLKCTL = 0x0
Aug 7 15:39:09 fire kernel: HCNT = 0x0 SCBPTR = 0x0
Aug 7 15:39:09 fire kernel: ACCUM = 0x2, SINDEX = 0x20, DINDEX = 0xc0,
ARG_2 =0x0
Aug 7 15:39:09 fire kernel: scsi0: Dumping Card State while idle, at
SEQADDR 0x18
Aug 7 15:39:09 fire kernel: scsi0:0:0:0: Attempting to queue an ABORT
message
Aug 7 15:38:40 fire kernel: scsi0:A:0: Missed busfree. Lastphase = 0xe0,
Curpha
Aug 7 15:39:09 fire kernel: scsi0: Dumping Card State while idle, at
SEQADDR 0x18
Aug 7 15:39:09 fire kernel: scsi0:0:0:0: Attempting to queue an ABORT
message
Aug 7 15:38:40 fire kernel: scsi0:A:0: Missed busfree. Lastphase = 0xe0,
Curphase = 0xb6
Aug 7 15:38:39 fire kernel: (scsi0:A:0:0): parity error detected in Status
phase. SEQADDR(0x1ac) SCSIRATE(0xf)
Aug 7 15:38:39 fire kernel: rity error detected in Status phase.
SEQADDR(0x1ac)


Parallèlement sur la console j'obtiens des I/O error sector 1346 (par
exemple) Return Code = 10000 ...
je ne sais plus quoi faire ...
Une idée ?

Merci
Willy

6 réponses

Avatar
Obelix Le Gaulois

J'ai besoin d'un coup de main:
carte mère au chipset de type i443 BX j'ai installé une carte SCSI
AHA 2940U + un disque Compaq UW2 de type BB00921B91.


Bonjour,
As-tu mis une terminaison au bout de la nappe.
Si le disque est un modèle U2W il n'a pas de terminaison intégrée.

Parallèlement sur la console j'obtiens des I/O error sector 1346 (par
exemple) Return Code = 10000 ...
je ne sais plus quoi faire ...
Une idée ?


Si c'est certains secteurs qui sont illisibles, il y a interêt à
faire un test de surface. Il y a ce qu'il faut pour ça dans le BIOS
de la AHA-2940U.

A mon avis, le couple AHA-2940U + disque U2W n'est pas très assorti
ça devrait marcher quand même, mais avec des performances pas
terribles.

Avatar
Wilfried BARNAVON
Bonjour,


Salut !


As-tu mis une terminaison au bout de la nappe.
Si le disque est un modèle U2W il n'a pas de terminaison intégrée.


le terminateur est au bout de la nappe. De plus la 2940 est capable de
remplacer
le terminateur s'il venait à manquer (option du bios). J'ai désactiver
l'option, les nappes que j'ai
utilisées étant toutes dotées d'un terminateur (terminaison).



Si c'est certains secteurs qui sont illisibles, il y a interêt à
faire un test de surface. Il y a ce qu'il faut pour ça dans le BIOS
de la AHA-2940U.
ça a été fait ... no soucy



A mon avis, le couple AHA-2940U + disque U2W n'est pas très assorti
ça devrait marcher quand même, mais avec des performances pas
terribles.
Tampis! Le tout c'est qu'il faut que ça marche !!!!



Willy

Avatar
JB
Attention avant de reformatter tu peux accéder au bios scsi? (au boot le
clavier est en qwerty si accés acec CtrlA il faut faire CtrlQ)
lancer un teste d'endurance si possible avec acces aléatoire en lecture
A+
JB

Wilfried BARNAVON wrote:

Merci pour ce début d'explication.
La carte est bien enfichée dans le slot PCI. La connectique semble OK.
La seule chose que je ne peux pas vérifier c'est la qualité de
l'adaptateur SCSI 40pin -> SCSI 2.
Le disque est en mode Flux 10MB/s (l'AHA 2940 sait pas aller plus vite)
Le disque et la carte sont en mode sync également. Je peux forcer le
passage en mode async sur le disque et sur la carte mais je crains que ça
soit pire !
Pour info le disque est de 99 et je pense qu'il provient d'un serveur
Prolian ML 330 ou 800

Par contre je vois pas le rapport entre des problèmes de transfert de
données et le reformatage
du disque !?
Wilfried


Sous réserve la parity error resemble a une donnée mal transmise à un
registre interne au disque
dans les manoeuvres diverses je reverrai parametre(S) bios SCSI,(accés
clavier en état qwerty)
ma connectique:
PCI/Ctrl scsi
nappe scsi coté ctrl puis disque pour le terminator parfois cela
fonctionne

sans
les testes périph avec la carte scsi OK au moins 1/4H
si oui le disque est-il en phase 'flux-2,5,10,20 ou 40 ou 160Mb/s et plus
avec la carte ctrl' c'est pour le SCSIRATE voir également le mode sync ou
async attention à la quantité de data transferées
Une autre question le disque a quel age?
si c'est possible sauvegarde puis reformattage depuis le bios scsi
recréation FS .....
A+
JB





Avatar
Wilfried BARNAVON
Yo !

G bien suivi tout ça mais dans le bios G pas de test d'endurance :( G qu'un
test de surface.
G désactivé la parité sur le disque et sur la carte et passé les transferts
au minimum soit 5Mb/s
... rien de mieux ! Je m'en vais tester le noyau 2.6.0.test2 histoire d'un
miracle. Faute de quoi
je repasserai en IDE en attendant de trouver une solution autres (matérielle
ou logicielle)
Merci Encore
@+

Will


"JB" a écrit dans le message de news:
bgvr2a$d41$

Attention avant de reformatter tu peux accéder au bios scsi? (au boot le
clavier est en qwerty si accés acec CtrlA il faut faire CtrlQ)
lancer un teste d'endurance si possible avec acces aléatoire en lecture
A+
JB

Wilfried BARNAVON wrote:

Merci pour ce début d'explication.
La carte est bien enfichée dans le slot PCI. La connectique semble OK.
La seule chose que je ne peux pas vérifier c'est la qualité de
l'adaptateur SCSI 40pin -> SCSI 2.
Le disque est en mode Flux 10MB/s (l'AHA 2940 sait pas aller plus vite)
Le disque et la carte sont en mode sync également. Je peux forcer le
passage en mode async sur le disque et sur la carte mais je crains que
ça


soit pire !
Pour info le disque est de 99 et je pense qu'il provient d'un serveur
Prolian ML 330 ou 800

Par contre je vois pas le rapport entre des problèmes de transfert de
données et le reformatage
du disque !?
Wilfried


Sous réserve la parity error resemble a une donnée mal transmise à un
registre interne au disque
dans les manoeuvres diverses je reverrai parametre(S) bios SCSI,(accés
clavier en état qwerty)
ma connectique:
PCI/Ctrl scsi
nappe scsi coté ctrl puis disque pour le terminator parfois cela
fonctionne

sans
les testes périph avec la carte scsi OK au moins 1/4H
si oui le disque est-il en phase 'flux-2,5,10,20 ou 40 ou 160Mb/s et
plus



avec la carte ctrl' c'est pour le SCSIRATE voir également le mode sync
ou



async attention à la quantité de data transferées
Une autre question le disque a quel age?
si c'est possible sauvegarde puis reformattage depuis le bios scsi
recréation FS .....
A+
JB








Avatar
Ray
J'ai eu un prob qui ressemble à ça, mais idem sous Windows
le dd Compaq enterprise qui est en fait un Western digital 4,5 Go (dans mon
cas) ne fonctionnait pas sur une 2940U.
Le jour ou j'ai réussi à avoir une 2940UW à prix correct = miracle. Il
fonctionne parfaitement depuis, attention il chauffe, un petit ventilo d'une
veille alim pour éviter les problèmes.
Vérifie aussi le disque alimenté par une autre alim que celle du PC (ça
bouffe ces truc la !! pas comme l'IDE)


Si ça peux t'aider ??


"Wilfried BARNAVON" a écrit dans le message de
news:bh03oo$1od$

Yo !

G bien suivi tout ça mais dans le bios G pas de test d'endurance :( G
qu'un

test de surface.
G désactivé la parité sur le disque et sur la carte et passé les
transferts

au minimum soit 5Mb/s
... rien de mieux ! Je m'en vais tester le noyau 2.6.0.test2 histoire d'un
miracle. Faute de quoi
je repasserai en IDE en attendant de trouver une solution autres
(matérielle

ou logicielle)
Merci Encore
@+

Will


"JB" a écrit dans le message de news:
bgvr2a$d41$

Attention avant de reformatter tu peux accéder au bios scsi? (au boot le
clavier est en qwerty si accés acec CtrlA il faut faire CtrlQ)
lancer un teste d'endurance si possible avec acces aléatoire en lecture
A+
JB

Wilfried BARNAVON wrote:

Merci pour ce début d'explication.
La carte est bien enfichée dans le slot PCI. La connectique semble OK.
La seule chose que je ne peux pas vérifier c'est la qualité de
l'adaptateur SCSI 40pin -> SCSI 2.
Le disque est en mode Flux 10MB/s (l'AHA 2940 sait pas aller plus
vite)



Le disque et la carte sont en mode sync également. Je peux forcer le
passage en mode async sur le disque et sur la carte mais je crains que
ça


soit pire !
Pour info le disque est de 99 et je pense qu'il provient d'un serveur
Prolian ML 330 ou 800

Par contre je vois pas le rapport entre des problèmes de transfert de
données et le reformatage
du disque !?
Wilfried


Sous réserve la parity error resemble a une donnée mal transmise à un
registre interne au disque
dans les manoeuvres diverses je reverrai parametre(S) bios
SCSI,(accés




clavier en état qwerty)
ma connectique:
PCI/Ctrl scsi
nappe scsi coté ctrl puis disque pour le terminator parfois cela
fonctionne

sans
les testes périph avec la carte scsi OK au moins 1/4H
si oui le disque est-il en phase 'flux-2,5,10,20 ou 40 ou 160Mb/s et
plus



avec la carte ctrl' c'est pour le SCSIRATE voir également le mode
sync




ou
async attention à la quantité de data transferées
Une autre question le disque a quel age?
si c'est possible sauvegarde puis reformattage depuis le bios scsi
recréation FS .....
A+
JB












Avatar
Wilfried BARNAVON
Yo !

G changé la carte et plus de problème de parité. Le disque aussi a été
remplacé et le nouveau ne s'arrete plus !

Il y avait donc 2 problèmes:
Compatibilité entre une carte SCSI ULTRA et un disque qui utilise
normalement un BUS LVD puisque ULTRA 2 WIDE.
Disque qui s'arrete tout seul quand il a trop chaud ! Je soupsconne la carte
electronique du disque de vouloir mourir bientot !Pour transferer les
données G du lui faire faire un tour au congèle ! Résultat garanti il a
jamais aussi longtemps marché !

Wilfried





"Wilfried BARNAVON" a écrit dans le message de news:
bgvkhg$rll$
Salut tout le monde !
J'ai besoin d'un coup de main:
sur une machine équipée de 2 disques IDE + un rack IDE,
carte mère au chipset de type i443 BX j'ai installé une carte SCSI
AHA 2940U + un disque Compaq UW2 de type BB00921B91.

Système d'exploitation original: RedHat 7.2 multiplement mis à jour et
tournant tres bien en IDE
(les mises à jour proviennent pour la plupart de recherches sur
rpmfind.net

plus quelques autres)
Puis j'ai compilé mon noyau 2.4.21 + patch-o-matic (iptables) + patch mppe
necessaire pour pptpd
avec les options suivantes:
Adaptec AIC7xxx support = Y
Maximum number of TCQ commands per device = 253
Initial bus reset delay in milli-seconds ) = 15000

Avant d'exposer le problème completement quelques précisions pour eviter
les

banalités ;) :
La carte et le disque sont bien détectés par le noyau au démarrage.
Le disque a été testé avec l'utilitaire de la carte et pas de soucis , pas
de secteurs défectueux.
Le disque ne présente pas de PB avec la carte sous Windaube.
La nappe présente un terminateur. Pour être sûr elle a été changée. Il
s'agit d'une nappe SCSI 2 avec un convertisseur
mis sur la carte pour passer de la connectique SCSI 40 pin de la carte à
la connectique SCSI 2 de la nappe.
Bref voila le problème:
quand Linux démarre tout va bien. Puis au bout de 30 à 300s lors d'accès
sur

le disque Le noyau lance des alertes
et le disque devient inaccessible. Pas moyen d'adresser un secteur . Voici
les alertes (attention il faut les lire de bas en haut
car elles sont issues d'un tac /var/log/messages):

Aug 7 15:38:39 fire kernel: rity error detected in Status phase.
SEQADDR(0x1ac)
Aug 7 15:39:19 fire kernel: scsi0:0:0:0: Attempting to queue an ABORT
message
Aug 7 15:39:10 fire kernel: aic7xxx_abort returns 0x2002
Aug 7 15:39:10 fire kernel: scsi0:0:0:0: Cmd aborted from QINFIFO
Aug 7 15:39:10 fire kernel: DevQ(0:0:0): 0 waiting
Aug 7 15:39:10 fire kernel: Untagged Q(0): 2
Aug 7 15:39:10 fire kernel: Kernel Free SCB list: 1 0
Aug 7 15:39:10 fire kernel: Pending list: 2(c 0x10, s 0x7, l 0)
Aug 7 15:39:10 fire kernel: Sequencer SCB Info: 0(c 0x10, s 0x7, l 0, t
0x2) 1(
c 0x0, s 0xff, l 255, t 0xff) 2(c 0x0, s 0xff, l 255, t 0xff) 3(c 0x0, s
0xff, l
255, t 0xff) 4(c 0x0, s 0xff, l 255, t 0xff) 5(c 0x0, s 0xff, l 255, t
0xff) 6(
c 0x0, s 0xff, l 255, t 0xff) 7(c 0x0, s 0xff, l 255, t 0xff) 8(c 0x0, s
0xff, l
255, t 0xff) 9(c 0x0, s 0xff, l 255, t 0xff) 10(c 0x0, s 0xff, l 255, t
0xff) 1
1(c 0x0, s 0xff, l 255, t 0xff) 12(c 0x0, s 0xff, l 255, t 0xff) 13(c 0x0,
s

0xf
f, l 255, t 0xff) 14(c 0x0, s 0xff, l 255, t 0xff) 15(c 0x0, s 0xff, l
255,

t 0xff)
Aug 7 15:39:10 fire kernel: Sequencer Free SCB List: 1 2 3 4 5 6 7 8 9 10
11 12 13 14 15
Aug 7 15:39:10 fire kernel: QOUTFIFO entries:
Aug 7 15:39:09 fire kernel: Disconnected Queue entries:
Aug 7 15:39:09 fire kernel: Waiting Queue entries: 0:2
Aug 7 15:39:09 fire kernel: QINFIFO entries:
Aug 7 15:39:09 fire kernel: Card NEXTQSCB = 3
Aug 7 15:39:09 fire kernel: Kernel NEXTQSCB = 3
Aug 7 15:39:09 fire kernel: SCB count = 4
Aug 7 15:39:09 fire kernel: STACK == 0x17, 0x186, 0x0, 0x43
Aug 7 15:39:09 fire kernel: SSTAT0 = 0x5, SSTAT1 = 0x13
Aug 7 15:39:09 fire kernel: LASTPHASE = 0x1, SCSISIGI = 0xa6, SXFRCTL0 > 0x80
Aug 7 15:39:09 fire kernel: DFCNTRL = 0x4, DFSTATUS = 0x6d
Aug 7 15:39:09 fire kernel: SCSISEQ = 0x1a, SBLKCTL = 0x0
Aug 7 15:39:09 fire kernel: HCNT = 0x0 SCBPTR = 0x0
Aug 7 15:39:09 fire kernel: ACCUM = 0x2, SINDEX = 0x20, DINDEX = 0xc0,
ARG_2 =0x0
Aug 7 15:39:09 fire kernel: scsi0: Dumping Card State while idle, at
SEQADDR 0x18
Aug 7 15:39:09 fire kernel: scsi0:0:0:0: Attempting to queue an ABORT
message
Aug 7 15:38:40 fire kernel: scsi0:A:0: Missed busfree. Lastphase = 0xe0,
Curpha
Aug 7 15:39:09 fire kernel: scsi0: Dumping Card State while idle, at
SEQADDR 0x18
Aug 7 15:39:09 fire kernel: scsi0:0:0:0: Attempting to queue an ABORT
message
Aug 7 15:38:40 fire kernel: scsi0:A:0: Missed busfree. Lastphase = 0xe0,
Curphase = 0xb6
Aug 7 15:38:39 fire kernel: (scsi0:A:0:0): parity error detected in
Status

phase. SEQADDR(0x1ac) SCSIRATE(0xf)
Aug 7 15:38:39 fire kernel: rity error detected in Status phase.
SEQADDR(0x1ac)


Parallèlement sur la console j'obtiens des I/O error sector 1346 (par
exemple) Return Code = 10000 ...
je ne sais plus quoi faire ...
Une idée ?

Merci
Willy