[C/Unix] sem

Richard Delorme

05/08/2009 à 17:56

Le 05/08/2009 17:45, JKB a écrit :

[...]

while(sem_wait((sem_t *) pthread_getspecific(
semaphore_fork_processus_courant)) == -1)

pthread_specific peut retourner NULL en cas d'erreur. Peut-être
serait-il bon de séparer cette ligne en deux et de tester la validité de
la valeur retourner par pthread_getspecific ?

--
Richard

JKB

05/08/2009 à 18:02

Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
Richard Delorme ?crivait dans fr.comp.lang.c :

Le 05/08/2009 17:45, JKB a écrit :

[...]
while(sem_wait((sem_t *) pthread_getspecific(
semaphore_fork_processus_courant)) == -1)

pthread_specific peut retourner NULL en cas d'erreur. Peut-être
serait-il bon de séparer cette ligne en deux et de tester la validité de
la valeur retourner par pthread_getspecific ?

Bien vu, je l'avais raté, celle-là. Mais ça n'explique pas pourquoi
le premier errno a une valeur différente de EINTR sur un argument
valide. Je suis en train de tester avec gcc-4.4.0 le même code.

Cordialement,

JKB

--
Le cerveau, c'est un véritable scandale écologique. Il représente 2% de notre
masse corporelle, mais disperse à lui seul 25% de l'énergie que nous
consommons tous les jours.

Richard Delorme

05/08/2009 à 19:41

Le 05/08/2009 18:02, JKB a écrit :

Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
Richard Delorme ?crivait dans fr.comp.lang.c :
Le 05/08/2009 17:45, JKB a écrit :

[...]
while(sem_wait((sem_t *) pthread_getspecific(
semaphore_fork_processus_courant)) == -1)

pthread_specific peut retourner NULL en cas d'erreur. Peut-être
serait-il bon de séparer cette ligne en deux et de tester la validité de
la valeur retourner par pthread_getspecific ?

Bien vu, je l'avais raté, celle-là. Mais ça n'explique pas pourquoi
le premier errno a une valeur différente de EINTR sur un argument
valide.

Oui, mais la valeur que tu indiques me semble bizarre. Les valeurs de
errno sont habituellement petites (chez moi EINTR == 4 et EINVAL == 22).
On dirait que la mémoire (propre au thread) qui contient errno a été
corrompue.

> Je suis en train de tester avec gcc-4.4.0 le même code.

Ce n'est pas plutôt un problème de glibc ?

--
Richard

JKB

05/08/2009 à 21:42

Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
Richard Delorme ?crivait dans fr.comp.lang.c :

Le 05/08/2009 18:02, JKB a écrit :
Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
Richard Delorme ?crivait dans fr.comp.lang.c :
Le 05/08/2009 17:45, JKB a écrit :

[...]
while(sem_wait((sem_t *) pthread_getspecific(
semaphore_fork_processus_courant)) == -1)

pthread_specific peut retourner NULL en cas d'erreur. Peut-être
serait-il bon de séparer cette ligne en deux et de tester la validité de
la valeur retourner par pthread_getspecific ?

Bien vu, je l'avais raté, celle-là. Mais ça n'explique pas pourquoi
le premier errno a une valeur différente de EINTR sur un argument
valide.

Oui, mais la valeur que tu indiques me semble bizarre. Les valeurs de
errno sont habituellement petites (chez moi EINTR == 4 et EINVAL == 22).
On dirait que la mémoire (propre au thread) qui contient errno a été
corrompue.

J'ai essayé avec un MALLOC_CHECK_=3 et avec valgrind. Ça n'a
strictement rien levé comme problème. Tout ce que je verrais encore
comme explication, c'est un problème de concurrence de threads.

> Je suis en train de tester avec gcc-4.4.0 le même code.

Ce n'est pas plutôt un problème de glibc ?

Je n'en sais rien. Tout ce dont je suis sûr, c'est qu'avec -O2, je
n'ai jamais vu le problème. Avec gcc-4.4.0 et l'option -O3, mon processus
tourne depuis 275 minutes sans observer ce comportement (alors
qu'auparavant, il plantait très rapidement, soit dans un mutex interne à
un free(), soit dans le cas rapporté dans le message initial). J'ai vu un
certain nombre de rapports de bugs sur -O3 et volatile pour gcc-4.3,
mais rien touchant spécialement mon observation.

J'ai réussi à faire un exemple minimal que je viens de tester sur
sparc/linux avec le même compilateur (gcc-4.3.1) et ça merdoie aussi. Ce
n'est donc pas spécifique à l'architecture.

Il y a autre chose qui me chagrine : dans la macro BUG(), j'effectue
un raise() du signal SIGBUS. Celui-ci n'est pas traité ! Lorsque le
processus s'arrête, un gdb -d pid me montre que le processus est bloqué
sur la macro BUG définie comme :

#define BUG(b, ...)
do { if (b) { printf("[%d] BUG! <%s()> at line #%d of %sn",
(int) getpid(), __FUNCTION__, __LINE__, __FILE__);
__VA_ARGS__; fflush(stdout);
pthread_kill(pthread_self(), SIGBUS); }} while(0)

C'est d'autant plus bizarre que rien n'est affiché. Soit le truc bloque
dans le printf(), soit il est bufferisé et le fflush() ne donne rien.

Cordialement,

JKB

--
Le cerveau, c'est un véritable scandale écologique. Il représente 2% de notre
masse corporelle, mais disperse à lui seul 25% de l'énergie que nous
consommons tous les jours.

Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
Richard Delorme ?crivait dans fr.comp.lang.c :

Le 05/08/2009 18:02, JKB a écrit :

Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
Richard Delorme ?crivait dans fr.comp.lang.c :

Le 05/08/2009 17:45, JKB a écrit :

[...]

while(sem_wait((sem_t *) pthread_getspecific(
semaphore_fork_processus_courant)) == -1)

pthread_specific peut retourner NULL en cas d'erreur. Peut-être
serait-il bon de séparer cette ligne en deux et de tester la validité de
la valeur retourner par pthread_getspecific ?

Bien vu, je l'avais raté, celle-là. Mais ça n'explique pas pourquoi
le premier errno a une valeur différente de EINTR sur un argument
valide.

Oui, mais la valeur que tu indiques me semble bizarre. Les valeurs de
errno sont habituellement petites (chez moi EINTR == 4 et EINVAL == 22).
On dirait que la mémoire (propre au thread) qui contient errno a été
corrompue.

J'ai essayé avec un MALLOC_CHECK_=3 et avec valgrind. Ça n'a
strictement rien levé comme problème. Tout ce que je verrais encore
comme explication, c'est un problème de concurrence de threads.

> Je suis en train de tester avec gcc-4.4.0 le même code.

Ce n'est pas plutôt un problème de glibc ?

Je n'en sais rien. Tout ce dont je suis sûr, c'est qu'avec -O2, je
n'ai jamais vu le problème. Avec gcc-4.4.0 et l'option -O3, mon processus
tourne depuis 275 minutes sans observer ce comportement (alors
qu'auparavant, il plantait très rapidement, soit dans un mutex interne à
un free(), soit dans le cas rapporté dans le message initial). J'ai vu un
certain nombre de rapports de bugs sur -O3 et volatile pour gcc-4.3,
mais rien touchant spécialement mon observation.

J'ai réussi à faire un exemple minimal que je viens de tester sur
sparc/linux avec le même compilateur (gcc-4.3.1) et ça merdoie aussi. Ce
n'est donc pas spécifique à l'architecture.

Il y a autre chose qui me chagrine : dans la macro BUG(), j'effectue
un raise() du signal SIGBUS. Celui-ci n'est pas traité ! Lorsque le
processus s'arrête, un gdb -d pid me montre que le processus est bloqué
sur la macro BUG définie comme :

#define BUG(b, ...)
do { if (b) { printf("[%d] BUG! <%s()> at line #%d of %sn",
(int) getpid(), __FUNCTION__, __LINE__, __FILE__);
__VA_ARGS__; fflush(stdout);
pthread_kill(pthread_self(), SIGBUS); }} while(0)

C'est d'autant plus bizarre que rien n'est affiché. Soit le truc bloque
dans le printf(), soit il est bufferisé et le fflush() ne donne rien.

Cordialement,

JKB

--
Le cerveau, c'est un véritable scandale écologique. Il représente 2% de notre
masse corporelle, mais disperse à lui seul 25% de l'énergie que nous
consommons tous les jours.

Vous avez filtré cet utilisateur ! Consultez son message

Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
Richard Delorme ?crivait dans fr.comp.lang.c :

Le 05/08/2009 18:02, JKB a écrit :
Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
Richard Delorme ?crivait dans fr.comp.lang.c :
Le 05/08/2009 17:45, JKB a écrit :

[...]
while(sem_wait((sem_t *) pthread_getspecific(
semaphore_fork_processus_courant)) == -1)

pthread_specific peut retourner NULL en cas d'erreur. Peut-être
serait-il bon de séparer cette ligne en deux et de tester la validité de
la valeur retourner par pthread_getspecific ?

Bien vu, je l'avais raté, celle-là. Mais ça n'explique pas pourquoi
le premier errno a une valeur différente de EINTR sur un argument
valide.

Oui, mais la valeur que tu indiques me semble bizarre. Les valeurs de
errno sont habituellement petites (chez moi EINTR == 4 et EINVAL == 22).
On dirait que la mémoire (propre au thread) qui contient errno a été
corrompue.

J'ai essayé avec un MALLOC_CHECK_=3 et avec valgrind. Ça n'a
strictement rien levé comme problème. Tout ce que je verrais encore
comme explication, c'est un problème de concurrence de threads.

> Je suis en train de tester avec gcc-4.4.0 le même code.

Ce n'est pas plutôt un problème de glibc ?

Je n'en sais rien. Tout ce dont je suis sûr, c'est qu'avec -O2, je
n'ai jamais vu le problème. Avec gcc-4.4.0 et l'option -O3, mon processus
tourne depuis 275 minutes sans observer ce comportement (alors
qu'auparavant, il plantait très rapidement, soit dans un mutex interne à
un free(), soit dans le cas rapporté dans le message initial). J'ai vu un
certain nombre de rapports de bugs sur -O3 et volatile pour gcc-4.3,
mais rien touchant spécialement mon observation.

J'ai réussi à faire un exemple minimal que je viens de tester sur
sparc/linux avec le même compilateur (gcc-4.3.1) et ça merdoie aussi. Ce
n'est donc pas spécifique à l'architecture.

Il y a autre chose qui me chagrine : dans la macro BUG(), j'effectue
un raise() du signal SIGBUS. Celui-ci n'est pas traité ! Lorsque le
processus s'arrête, un gdb -d pid me montre que le processus est bloqué
sur la macro BUG définie comme :

#define BUG(b, ...)
do { if (b) { printf("[%d] BUG! <%s()> at line #%d of %sn",
(int) getpid(), __FUNCTION__, __LINE__, __FILE__);
__VA_ARGS__; fflush(stdout);
pthread_kill(pthread_self(), SIGBUS); }} while(0)

C'est d'autant plus bizarre que rien n'est affiché. Soit le truc bloque
dans le printf(), soit il est bufferisé et le fflush() ne donne rien.

Cordialement,

JKB

--
Le cerveau, c'est un véritable scandale écologique. Il représente 2% de notre
masse corporelle, mais disperse à lui seul 25% de l'énergie que nous
consommons tous les jours.

JKB

06/08/2009 à 10:28

Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
JKB ?crivait dans fr.comp.lang.c :

Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
Richard Delorme ?crivait dans fr.comp.lang.c :
Ce n'est pas plutôt un problème de glibc ?

Je n'en sais rien. Tout ce dont je suis sûr, c'est qu'avec -O2, je
n'ai jamais vu le problème. Avec gcc-4.4.0 et l'option -O3, mon processus
tourne depuis 275 minutes sans observer ce comportement (alors
qu'auparavant, il plantait très rapidement, soit dans un mutex interne à
un free(), soit dans le cas rapporté dans le message initial). J'ai vu un
certain nombre de rapports de bugs sur -O3 et volatile pour gcc-4.3,
mais rien touchant spécialement mon observation.

J'ai réussi à faire un exemple minimal que je viens de tester sur
sparc/linux avec le même compilateur (gcc-4.3.1) et ça merdoie aussi. Ce
n'est donc pas spécifique à l'architecture.

Il y a autre chose qui me chagrine : dans la macro BUG(), j'effectue
un raise() du signal SIGBUS. Celui-ci n'est pas traité ! Lorsque le
processus s'arrête, un gdb -d pid me montre que le processus est bloqué
sur la macro BUG définie comme :

#define BUG(b, ...)
do { if (b) { printf("[%d] BUG! <%s()> at line #%d of %sn",
(int) getpid(), __FUNCTION__, __LINE__, __FILE__);
__VA_ARGS__; fflush(stdout);
pthread_kill(pthread_self(), SIGBUS); }} while(0)

C'est d'autant plus bizarre que rien n'est affiché. Soit le truc bloque
dans le printf(), soit il est bufferisé et le fflush() ne donne rien.

Quelques nouvelles.

Mon exemple minimal a lancé 150 000 threads sur linux/sparc hier
soir sans montrer de dysfonctionnement avec gcc-4.4.1 -O3. Avec
gcc-4.3.3 -O3, ça plantait assez vite.

Le programme complet fonctionne bien sur linux/amd64 avec gcc-4.4.0
-O3. Il plante aussi assez vite avec gcc-4.3.3 -O3. La libc étant la
même sur les deux systèmes, la seule différence est la version mineure
du compilo. Je pense donc pouvoir dire que le problème vient d'une
option d'optimisation qui fait des choses 'bizarres' dans le dos de
l'utilisateur...

Cordialement,

JKB

--
Le cerveau, c'est un véritable scandale écologique. Il représente 2% de notre
masse corporelle, mais disperse à lui seul 25% de l'énergie que nous
consommons tous les jours.

Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
JKB ?crivait dans fr.comp.lang.c :

Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
Richard Delorme ?crivait dans fr.comp.lang.c :

Ce n'est pas plutôt un problème de glibc ?

Je n'en sais rien. Tout ce dont je suis sûr, c'est qu'avec -O2, je
n'ai jamais vu le problème. Avec gcc-4.4.0 et l'option -O3, mon processus
tourne depuis 275 minutes sans observer ce comportement (alors
qu'auparavant, il plantait très rapidement, soit dans un mutex interne à
un free(), soit dans le cas rapporté dans le message initial). J'ai vu un
certain nombre de rapports de bugs sur -O3 et volatile pour gcc-4.3,
mais rien touchant spécialement mon observation.

J'ai réussi à faire un exemple minimal que je viens de tester sur
sparc/linux avec le même compilateur (gcc-4.3.1) et ça merdoie aussi. Ce
n'est donc pas spécifique à l'architecture.

Il y a autre chose qui me chagrine : dans la macro BUG(), j'effectue
un raise() du signal SIGBUS. Celui-ci n'est pas traité ! Lorsque le
processus s'arrête, un gdb -d pid me montre que le processus est bloqué
sur la macro BUG définie comme :

#define BUG(b, ...)
do { if (b) { printf("[%d] BUG! <%s()> at line #%d of %sn",
(int) getpid(), __FUNCTION__, __LINE__, __FILE__);
__VA_ARGS__; fflush(stdout);
pthread_kill(pthread_self(), SIGBUS); }} while(0)

C'est d'autant plus bizarre que rien n'est affiché. Soit le truc bloque
dans le printf(), soit il est bufferisé et le fflush() ne donne rien.

Quelques nouvelles.

Mon exemple minimal a lancé 150 000 threads sur linux/sparc hier
soir sans montrer de dysfonctionnement avec gcc-4.4.1 -O3. Avec
gcc-4.3.3 -O3, ça plantait assez vite.

Le programme complet fonctionne bien sur linux/amd64 avec gcc-4.4.0
-O3. Il plante aussi assez vite avec gcc-4.3.3 -O3. La libc étant la
même sur les deux systèmes, la seule différence est la version mineure
du compilo. Je pense donc pouvoir dire que le problème vient d'une
option d'optimisation qui fait des choses 'bizarres' dans le dos de
l'utilisateur...

Cordialement,

JKB

--
Le cerveau, c'est un véritable scandale écologique. Il représente 2% de notre
masse corporelle, mais disperse à lui seul 25% de l'énergie que nous
consommons tous les jours.

Vous avez filtré cet utilisateur ! Consultez son message

Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
JKB ?crivait dans fr.comp.lang.c :

Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
Richard Delorme ?crivait dans fr.comp.lang.c :
Ce n'est pas plutôt un problème de glibc ?

Je n'en sais rien. Tout ce dont je suis sûr, c'est qu'avec -O2, je
n'ai jamais vu le problème. Avec gcc-4.4.0 et l'option -O3, mon processus
tourne depuis 275 minutes sans observer ce comportement (alors
qu'auparavant, il plantait très rapidement, soit dans un mutex interne à
un free(), soit dans le cas rapporté dans le message initial). J'ai vu un
certain nombre de rapports de bugs sur -O3 et volatile pour gcc-4.3,
mais rien touchant spécialement mon observation.

J'ai réussi à faire un exemple minimal que je viens de tester sur
sparc/linux avec le même compilateur (gcc-4.3.1) et ça merdoie aussi. Ce
n'est donc pas spécifique à l'architecture.

Il y a autre chose qui me chagrine : dans la macro BUG(), j'effectue
un raise() du signal SIGBUS. Celui-ci n'est pas traité ! Lorsque le
processus s'arrête, un gdb -d pid me montre que le processus est bloqué
sur la macro BUG définie comme :

#define BUG(b, ...)
do { if (b) { printf("[%d] BUG! <%s()> at line #%d of %sn",
(int) getpid(), __FUNCTION__, __LINE__, __FILE__);
__VA_ARGS__; fflush(stdout);
pthread_kill(pthread_self(), SIGBUS); }} while(0)

C'est d'autant plus bizarre que rien n'est affiché. Soit le truc bloque
dans le printf(), soit il est bufferisé et le fflush() ne donne rien.

Quelques nouvelles.

Mon exemple minimal a lancé 150 000 threads sur linux/sparc hier
soir sans montrer de dysfonctionnement avec gcc-4.4.1 -O3. Avec
gcc-4.3.3 -O3, ça plantait assez vite.

Le programme complet fonctionne bien sur linux/amd64 avec gcc-4.4.0
-O3. Il plante aussi assez vite avec gcc-4.3.3 -O3. La libc étant la
même sur les deux systèmes, la seule différence est la version mineure
du compilo. Je pense donc pouvoir dire que le problème vient d'une
option d'optimisation qui fait des choses 'bizarres' dans le dos de
l'utilisateur...

Cordialement,

JKB

--
Le cerveau, c'est un véritable scandale écologique. Il représente 2% de notre
masse corporelle, mais disperse à lui seul 25% de l'énergie que nous
consommons tous les jours.

JKB

07/08/2009 à 14:31

Le 06-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
JKB ?crivait dans fr.comp.lang.c :

Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
JKB ?crivait dans fr.comp.lang.c :
Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
Richard Delorme ?crivait dans fr.comp.lang.c :
Ce n'est pas plutôt un problème de glibc ?

Je n'en sais rien. Tout ce dont je suis sûr, c'est qu'avec -O2, je
n'ai jamais vu le problème. Avec gcc-4.4.0 et l'option -O3, mon processus
tourne depuis 275 minutes sans observer ce comportement (alors
qu'auparavant, il plantait très rapidement, soit dans un mutex interne à
un free(), soit dans le cas rapporté dans le message initial). J'ai vu un
certain nombre de rapports de bugs sur -O3 et volatile pour gcc-4.3,
mais rien touchant spécialement mon observation.

J'ai réussi à faire un exemple minimal que je viens de tester sur
sparc/linux avec le même compilateur (gcc-4.3.1) et ça merdoie aussi. Ce
n'est donc pas spécifique à l'architecture.

Il y a autre chose qui me chagrine : dans la macro BUG(), j'effectue
un raise() du signal SIGBUS. Celui-ci n'est pas traité ! Lorsque le
processus s'arrête, un gdb -d pid me montre que le processus est bloqué
sur la macro BUG définie comme :

#define BUG(b, ...)
do { if (b) { printf("[%d] BUG! <%s()> at line #%d of %sn",
(int) getpid(), __FUNCTION__, __LINE__, __FILE__);
__VA_ARGS__; fflush(stdout);
pthread_kill(pthread_self(), SIGBUS); }} while(0)

C'est d'autant plus bizarre que rien n'est affiché. Soit le truc bloque
dans le printf(), soit il est bufferisé et le fflush() ne donne rien.

Quelques nouvelles.

Mon exemple minimal a lancé 150 000 threads sur linux/sparc hier
soir sans montrer de dysfonctionnement avec gcc-4.4.1 -O3. Avec
gcc-4.3.3 -O3, ça plantait assez vite.

Le programme complet fonctionne bien sur linux/amd64 avec gcc-4.4.0
-O3. Il plante aussi assez vite avec gcc-4.3.3 -O3. La libc étant la
même sur les deux systèmes, la seule différence est la version mineure
du compilo. Je pense donc pouvoir dire que le problème vient d'une
option d'optimisation qui fait des choses 'bizarres' dans le dos de
l'utilisateur...

Mauvaise nouvelle : le problème survient aussi avec gcc-4.4.1 mais
beaucoup plus rarement... Je continue d'investiguer.

JKB

--
Le cerveau, c'est un véritable scandale écologique. Il représente 2% de notre
masse corporelle, mais disperse à lui seul 25% de l'énergie que nous
consommons tous les jours.

Le 06-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
JKB ?crivait dans fr.comp.lang.c :

Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
JKB ?crivait dans fr.comp.lang.c :

Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
Richard Delorme ?crivait dans fr.comp.lang.c :

Ce n'est pas plutôt un problème de glibc ?

Je n'en sais rien. Tout ce dont je suis sûr, c'est qu'avec -O2, je
n'ai jamais vu le problème. Avec gcc-4.4.0 et l'option -O3, mon processus
tourne depuis 275 minutes sans observer ce comportement (alors
qu'auparavant, il plantait très rapidement, soit dans un mutex interne à
un free(), soit dans le cas rapporté dans le message initial). J'ai vu un
certain nombre de rapports de bugs sur -O3 et volatile pour gcc-4.3,
mais rien touchant spécialement mon observation.

J'ai réussi à faire un exemple minimal que je viens de tester sur
sparc/linux avec le même compilateur (gcc-4.3.1) et ça merdoie aussi. Ce
n'est donc pas spécifique à l'architecture.

Il y a autre chose qui me chagrine : dans la macro BUG(), j'effectue
un raise() du signal SIGBUS. Celui-ci n'est pas traité ! Lorsque le
processus s'arrête, un gdb -d pid me montre que le processus est bloqué
sur la macro BUG définie comme :

#define BUG(b, ...)
do { if (b) { printf("[%d] BUG! <%s()> at line #%d of %sn",
(int) getpid(), __FUNCTION__, __LINE__, __FILE__);
__VA_ARGS__; fflush(stdout);
pthread_kill(pthread_self(), SIGBUS); }} while(0)

C'est d'autant plus bizarre que rien n'est affiché. Soit le truc bloque
dans le printf(), soit il est bufferisé et le fflush() ne donne rien.

Quelques nouvelles.

Mon exemple minimal a lancé 150 000 threads sur linux/sparc hier
soir sans montrer de dysfonctionnement avec gcc-4.4.1 -O3. Avec
gcc-4.3.3 -O3, ça plantait assez vite.

Le programme complet fonctionne bien sur linux/amd64 avec gcc-4.4.0
-O3. Il plante aussi assez vite avec gcc-4.3.3 -O3. La libc étant la
même sur les deux systèmes, la seule différence est la version mineure
du compilo. Je pense donc pouvoir dire que le problème vient d'une
option d'optimisation qui fait des choses 'bizarres' dans le dos de
l'utilisateur...

Mauvaise nouvelle : le problème survient aussi avec gcc-4.4.1 mais
beaucoup plus rarement... Je continue d'investiguer.

JKB

--
Le cerveau, c'est un véritable scandale écologique. Il représente 2% de notre
masse corporelle, mais disperse à lui seul 25% de l'énergie que nous
consommons tous les jours.

Vous avez filtré cet utilisateur ! Consultez son message

Le 06-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
JKB ?crivait dans fr.comp.lang.c :

Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
JKB ?crivait dans fr.comp.lang.c :
Le 05-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
Richard Delorme ?crivait dans fr.comp.lang.c :
Ce n'est pas plutôt un problème de glibc ?

Je n'en sais rien. Tout ce dont je suis sûr, c'est qu'avec -O2, je
n'ai jamais vu le problème. Avec gcc-4.4.0 et l'option -O3, mon processus
tourne depuis 275 minutes sans observer ce comportement (alors
qu'auparavant, il plantait très rapidement, soit dans un mutex interne à
un free(), soit dans le cas rapporté dans le message initial). J'ai vu un
certain nombre de rapports de bugs sur -O3 et volatile pour gcc-4.3,
mais rien touchant spécialement mon observation.

J'ai réussi à faire un exemple minimal que je viens de tester sur
sparc/linux avec le même compilateur (gcc-4.3.1) et ça merdoie aussi. Ce
n'est donc pas spécifique à l'architecture.

Il y a autre chose qui me chagrine : dans la macro BUG(), j'effectue
un raise() du signal SIGBUS. Celui-ci n'est pas traité ! Lorsque le
processus s'arrête, un gdb -d pid me montre que le processus est bloqué
sur la macro BUG définie comme :

#define BUG(b, ...)
do { if (b) { printf("[%d] BUG! <%s()> at line #%d of %sn",
(int) getpid(), __FUNCTION__, __LINE__, __FILE__);
__VA_ARGS__; fflush(stdout);
pthread_kill(pthread_self(), SIGBUS); }} while(0)

C'est d'autant plus bizarre que rien n'est affiché. Soit le truc bloque
dans le printf(), soit il est bufferisé et le fflush() ne donne rien.

Quelques nouvelles.

Mon exemple minimal a lancé 150 000 threads sur linux/sparc hier
soir sans montrer de dysfonctionnement avec gcc-4.4.1 -O3. Avec
gcc-4.3.3 -O3, ça plantait assez vite.

Le programme complet fonctionne bien sur linux/amd64 avec gcc-4.4.0
-O3. Il plante aussi assez vite avec gcc-4.3.3 -O3. La libc étant la
même sur les deux systèmes, la seule différence est la version mineure
du compilo. Je pense donc pouvoir dire que le problème vient d'une
option d'optimisation qui fait des choses 'bizarres' dans le dos de
l'utilisateur...

Mauvaise nouvelle : le problème survient aussi avec gcc-4.4.1 mais
beaucoup plus rarement... Je continue d'investiguer.

JKB

--
Le cerveau, c'est un véritable scandale écologique. Il représente 2% de notre
masse corporelle, mais disperse à lui seul 25% de l'énergie que nous
consommons tous les jours.

Mickaël Wolff

07/08/2009 à 16:57

JKB wrote:

Le programme complet fonctionne bien sur linux/amd64 avec gcc-4.4.0
-O3. Il plante aussi assez vite avec gcc-4.3.3 -O3. La libc étant la
même sur les deux systèmes, la seule différence est la version mineure
du compilo. Je pense donc pouvoir dire que le problème vient d'une
option d'optimisation qui fait des choses 'bizarres' dans le dos de
l'utilisateur...

Pour printf, je parie sur ça :
http://www.gnu.org/software/libc/manual/html_node/Streams-and-Threads.html#Streams-and-Threads

--
Mickaël Wolff aka Lupus Michaelis
http://lupusmic.org

JKB

07/08/2009 à 18:19

Le 07-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
Mickaël Wolff ?crivait dans fr.comp.lang.c :

JKB wrote:

Le programme complet fonctionne bien sur linux/amd64 avec gcc-4.4.0
-O3. Il plante aussi assez vite avec gcc-4.3.3 -O3. La libc étant la
même sur les deux systèmes, la seule différence est la version mineure
du compilo. Je pense donc pouvoir dire que le problème vient d'une
option d'optimisation qui fait des choses 'bizarres' dans le dos de
l'utilisateur...

Pour printf, je parie sur ça :
http://www.gnu.org/software/libc/manual/html_node/Streams-and-Threads.html#Streams-and-Threads

Raté ;-) Les printf() sont dans le code originel protégés par des
sémaphores. Pour faire simple, le programme crée un sémaphore nommé
utilisé par tous les processus et threads de mon programme de calcul. Ça
me permet de gérer de façon transparente les problèmes d'écriture et de
lecture sur les terminaux.

Cordialement,

JKB

--
Le cerveau, c'est un véritable scandale écologique. Il représente 2% de notre
masse corporelle, mais disperse à lui seul 25% de l'énergie que nous
consommons tous les jours.

Mickaël Wolff

07/08/2009 à 20:50

JKB wrote:

Raté ;-) Les printf() sont dans le code originel protégés par des
sémaphores. Pour faire simple, le programme crée un sémaphore nommé
utilisé par tous les processus et threads de mon programme de calcul. Ça
me permet de gérer de façon transparente les problèmes d'écriture et de
lecture sur les terminaux.

Essayes quand meme d'utiliser les semaphores fournis par la
bibliothèque pour vérifier que ce ne sont pas les tiens qui déconnent.

Au fait, est-ce que tu link avec pthread ?
--
Mickaël Wolff aka Lupus Michaelis
http://lupusmic.org

JKB

07/08/2009 à 21:06

Le 07-08-2009, ? propos de
Re: [C/Unix] sem_wait(),
Mickaël Wolff ?crivait dans fr.comp.lang.c :

JKB wrote:

Raté ;-) Les printf() sont dans le code originel protégés par des
sémaphores. Pour faire simple, le programme crée un sémaphore nommé
utilisé par tous les processus et threads de mon programme de calcul. Ça
me permet de gérer de façon transparente les problèmes d'écriture et de
lecture sur les terminaux.

Essayes quand meme d'utiliser les semaphores fournis par la
bibliothèque pour vérifier que ce ne sont pas les tiens qui déconnent.

Au fait, est-ce que tu link avec pthread ?

Naturellement.

JKB

--
Le cerveau, c'est un véritable scandale écologique. Il représente 2% de notre
masse corporelle, mais disperse à lui seul 25% de l'énergie que nous
consommons tous les jours.

[C/Unix] sem_wait()

10 réponses

Veuillez sélectionner un problème