assert() et génération de code

Charlie Gordon

18/06/2007 à 23:13

"Marc Espie" a écrit dans le message de news:
f542kl$bkt$

In article <467581ae$0$5083$,
Harpo wrote:
On Sun, 17 Jun 2007 10:08:45 +0000, Marc Espie wrote:

Vu les conneries qu'ils ont deja fait ces dernieres annees (la plus
belle
etant sans doute de virer les memcpy a 0 "inutiles"...

Qu'est-ce que c'est ?

J'ai ecrit memcpy en pensant memset, en fait.
memset fait partie de la norme, c'est donc une fonction magique.
Dans les versions recentes, gcc remplace systematiquement memset par
des boucles (ce qui occasionne son lot de problemes dans des cas
d'alignement
un peu bizarres... ca encore c'est pas trop grave).

La ou ca pose vraiment probleme, c'est sur un cas d'utilisation assez
courant, style:

void
f()
{
char passwd[250];
// code qui demande un mot de passe a l'utilisateur.
// code qui s'en sert
memset(passwd, 0, sizeof passwd);
}

comme passwd est une variable locale, non utilisee ailleurs, gcc decrete
que le memset ne sert a rien... et hop, un passwd dans la nature.

Voilà un bon exemple de contexte où utiliser memshred(), qui réécrit la
mémoire plusieurs fois avec des valeurs aléatoires pour s'assurer que la NSA
ne pourra pas récupérer le mot de passe par analyse moléculaire des chips de
RAM ;-)

Le mot de passe lu de cette façon est present plus d'une fois en mémoire :
dans le buffer où il est reçu et dont on essaye désormais vainement de
l'effacer avec ce memset (on devrait d'ailleurs utiliser plutôt strset() ;-)
mais aussi dans le buffer d'entrées / sorties si on a utilisé stdio, et dans
les buffers du driver de clavier, de la console, ou ceux de l'interface
réseau selon le cas, sans parler du fichier de swap... ce n'est pas trivial
de se débarrasser d'un mot de passe ou d'éviter qu'il ne soit intercepté
(gdb, wireshark, strace, libpreload, redefinition des fonctions d'E/S...)
Si le petit curieux est root ou même simplement peut exécuter du code dans
le même process, la méthode simpliste qui ne marche plus a pu rendre la
tâche un peu moins facile, mais nullement impossible.

Chqrlie.

"Marc Espie" <espie@lain.home> a écrit dans le message de news:
f542kl$bkt$1@biggoron.nerim.net...

In article <467581ae$0$5083$ba4acef3@news.orange.fr>,
Harpo <invalid@invalid.invalid> wrote:

On Sun, 17 Jun 2007 10:08:45 +0000, Marc Espie wrote:

Vu les conneries qu'ils ont deja fait ces dernieres annees (la plus
belle
etant sans doute de virer les memcpy a 0 "inutiles"...

Qu'est-ce que c'est ?

J'ai ecrit memcpy en pensant memset, en fait.
memset fait partie de la norme, c'est donc une fonction magique.
Dans les versions recentes, gcc remplace systematiquement memset par
des boucles (ce qui occasionne son lot de problemes dans des cas
d'alignement
un peu bizarres... ca encore c'est pas trop grave).

La ou ca pose vraiment probleme, c'est sur un cas d'utilisation assez
courant, style:

void
f()
{
char passwd[250];
// code qui demande un mot de passe a l'utilisateur.
// code qui s'en sert
memset(passwd, 0, sizeof passwd);
}

comme passwd est une variable locale, non utilisee ailleurs, gcc decrete
que le memset ne sert a rien... et hop, un passwd dans la nature.

Voilà un bon exemple de contexte où utiliser memshred(), qui réécrit la
mémoire plusieurs fois avec des valeurs aléatoires pour s'assurer que la NSA
ne pourra pas récupérer le mot de passe par analyse moléculaire des chips de
RAM ;-)

Le mot de passe lu de cette façon est present plus d'une fois en mémoire :
dans le buffer où il est reçu et dont on essaye désormais vainement de
l'effacer avec ce memset (on devrait d'ailleurs utiliser plutôt strset() ;-)
mais aussi dans le buffer d'entrées / sorties si on a utilisé stdio, et dans
les buffers du driver de clavier, de la console, ou ceux de l'interface
réseau selon le cas, sans parler du fichier de swap... ce n'est pas trivial
de se débarrasser d'un mot de passe ou d'éviter qu'il ne soit intercepté
(gdb, wireshark, strace, libpreload, redefinition des fonctions d'E/S...)
Si le petit curieux est root ou même simplement peut exécuter du code dans
le même process, la méthode simpliste qui ne marche plus a pu rendre la
tâche un peu moins facile, mais nullement impossible.

Chqrlie.

Vous avez filtré cet utilisateur ! Consultez son message

"Marc Espie" a écrit dans le message de news:
f542kl$bkt$

In article <467581ae$0$5083$,
Harpo wrote:
On Sun, 17 Jun 2007 10:08:45 +0000, Marc Espie wrote:

Vu les conneries qu'ils ont deja fait ces dernieres annees (la plus
belle
etant sans doute de virer les memcpy a 0 "inutiles"...

Qu'est-ce que c'est ?

J'ai ecrit memcpy en pensant memset, en fait.
memset fait partie de la norme, c'est donc une fonction magique.
Dans les versions recentes, gcc remplace systematiquement memset par
des boucles (ce qui occasionne son lot de problemes dans des cas
d'alignement
un peu bizarres... ca encore c'est pas trop grave).

La ou ca pose vraiment probleme, c'est sur un cas d'utilisation assez
courant, style:

void
f()
{
char passwd[250];
// code qui demande un mot de passe a l'utilisateur.
// code qui s'en sert
memset(passwd, 0, sizeof passwd);
}

comme passwd est une variable locale, non utilisee ailleurs, gcc decrete
que le memset ne sert a rien... et hop, un passwd dans la nature.

Voilà un bon exemple de contexte où utiliser memshred(), qui réécrit la
mémoire plusieurs fois avec des valeurs aléatoires pour s'assurer que la NSA
ne pourra pas récupérer le mot de passe par analyse moléculaire des chips de
RAM ;-)

Le mot de passe lu de cette façon est present plus d'une fois en mémoire :
dans le buffer où il est reçu et dont on essaye désormais vainement de
l'effacer avec ce memset (on devrait d'ailleurs utiliser plutôt strset() ;-)
mais aussi dans le buffer d'entrées / sorties si on a utilisé stdio, et dans
les buffers du driver de clavier, de la console, ou ceux de l'interface
réseau selon le cas, sans parler du fichier de swap... ce n'est pas trivial
de se débarrasser d'un mot de passe ou d'éviter qu'il ne soit intercepté
(gdb, wireshark, strace, libpreload, redefinition des fonctions d'E/S...)
Si le petit curieux est root ou même simplement peut exécuter du code dans
le même process, la méthode simpliste qui ne marche plus a pu rendre la
tâche un peu moins facile, mais nullement impossible.

Chqrlie.

espie

18/06/2007 à 23:35

In article <4676f57d$0$23627$,
Charlie Gordon wrote:

Le mot de passe lu de cette façon est present plus d'une fois en mémoire :
dans le buffer où il est reçu et dont on essaye désormais vainement de
l'effacer avec ce memset (on devrait d'ailleurs utiliser plutôt strset() ;-)
mais aussi dans le buffer d'entrées / sorties si on a utilisé stdio, et dans
les buffers du driver de clavier, de la console, ou ceux de l'interface
réseau selon le cas, sans parler du fichier de swap... ce n'est pas trivial
de se débarrasser d'un mot de passe ou d'éviter qu'il ne soit intercepté
(gdb, wireshark, strace, libpreload, redefinition des fonctions d'E/S...)
Si le petit curieux est root ou même simplement peut exécuter du code dans
le même process, la méthode simpliste qui ne marche plus a pu rendre la
tâche un peu moins facile, mais nullement impossible.

Je ne suis pas d'accord avec ton approche nihiliste: meme si le mot
de passe existe en d'autres endroits, ce qui nous interesse, ici
et maintenant, c'est cette copie specifique en particulier. C'est
celle-la qui sera vulnerable, si par exemple il y a un bug dans le
reste du programme. Et si le programmeur a pense se proteger avec le
memset, histoire de s'assurer qu'un bug ailleurs dans le meme code
ne rendra pas le mot de passe accessible, eh bien il l'a dans l'os.

Et ce, independamment de tous les scenarios que tu peux imaginer... ce
genre de truc, ca se protege petit a petit (deja, si l'executable est
setuid, normalement, tu peux courir avec gdb, strace ou libpreload sur
un systeme correct, et comme je l'ai deja dit, j'utilise un systeme qui
chiffre son swap, precisement pour eviter ce genre d'espionnage).

C'est pas en laissant tomber des le debut sous pretexte qu'il va y avoir
d'autres problemes qu'on ira bien loin...

Charlie Gordon

19/06/2007 à 00:01

"Marc Espie" a écrit dans le message de news:
f56trp$1ddu$

In article <4676f57d$0$23627$,
Charlie Gordon wrote:
Le mot de passe lu de cette façon est present plus d'une fois en mémoire :
dans le buffer où il est reçu et dont on essaye désormais vainement de
l'effacer avec ce memset (on devrait d'ailleurs utiliser plutôt strset()
;-)
mais aussi dans le buffer d'entrées / sorties si on a utilisé stdio, et
dans
les buffers du driver de clavier, de la console, ou ceux de l'interface
réseau selon le cas, sans parler du fichier de swap... ce n'est pas
trivial
de se débarrasser d'un mot de passe ou d'éviter qu'il ne soit intercepté
(gdb, wireshark, strace, libpreload, redefinition des fonctions d'E/S...)
Si le petit curieux est root ou même simplement peut exécuter du code dans
le même process, la méthode simpliste qui ne marche plus a pu rendre la
tâche un peu moins facile, mais nullement impossible.

Je ne suis pas d'accord avec ton approche nihiliste: meme si le mot
de passe existe en d'autres endroits, ce qui nous interesse, ici
et maintenant, c'est cette copie specifique en particulier. C'est
celle-la qui sera vulnerable, si par exemple il y a un bug dans le
reste du programme. Et si le programmeur a pense se proteger avec le
memset, histoire de s'assurer qu'un bug ailleurs dans le meme code
ne rendra pas le mot de passe accessible, eh bien il l'a dans l'os.

Et ce, independamment de tous les scenarios que tu peux imaginer... ce
genre de truc, ca se protege petit a petit (deja, si l'executable est
setuid, normalement, tu peux courir avec gdb, strace ou libpreload sur
un systeme correct, et comme je l'ai deja dit, j'utilise un systeme qui
chiffre son swap, precisement pour eviter ce genre d'espionnage).

C'est pas en laissant tomber des le debut sous pretexte qu'il va y avoir
d'autres problemes qu'on ira bien loin...

Certes,

Mais le mot de passe sera quand même plus facile à extraire du buffer de
stdin que de la pile où il aura pu être écrasé maintes fois avant que le
code malveillant ne prenne la main.

Le cas que tu décris est problématique, et je suis d'accord que le
programmeur moyen écrit souvent des lourdeurs dont même une analyse sérieuse
par le compilateur ne peut supprimer l'inefficacité sémantique, exemples:

int f() {
char filename[PATH_MAX] = "";
...
}

On veut simplement initialiser filename[0] à '' et c'est tout le buffer
qui est mis à 0, avec un code pas toujours optimal.

Que memset soit enfin optimisé intrinsèquement par gcc ne me choque pas,
cela permet de simplifier les headers de la libc tout en généralisant la
génération en ligne à toutes les architectures où cela a un sens.

Que les memset inutiles soient supprimés, encore d'accord, ils sont trop
souvent le fait de codes idiomatiques douteux, voire de codes générés par
programme.

Que certtains d'entre eux aient une utilité particulière, c'est
effectivement un problème, mais pas plus que les "boucles de temporisation"
qui soudain ne produisent plus de code.

Je ferais bien une proposition pour C2029 : le qualifier volatile appriqué à
un bloc aurait pour effet que toute opération faite dans ce bloc devrait
produire le code escompté, sans optimisation aucune (suppression de
lectures, écritures...). Bon, il faudrait traduire cela dans la
terminologie de la norme et la sémantique de la machine abstraite, donc 2029
c'est peut-etre encore trop optimiste.

Où en est cette discussion ?
Quels autres problèmes se posent avec ces optimisations ?

Chqrlie

"Marc Espie" <espie@lain.home> a écrit dans le message de news:
f56trp$1ddu$1@biggoron.nerim.net...

In article <4676f57d$0$23627$426a74cc@news.free.fr>,
Charlie Gordon <news@chqrlie.org> wrote:

Le mot de passe lu de cette façon est present plus d'une fois en mémoire :
dans le buffer où il est reçu et dont on essaye désormais vainement de
l'effacer avec ce memset (on devrait d'ailleurs utiliser plutôt strset()
;-)
mais aussi dans le buffer d'entrées / sorties si on a utilisé stdio, et
dans
les buffers du driver de clavier, de la console, ou ceux de l'interface
réseau selon le cas, sans parler du fichier de swap... ce n'est pas
trivial
de se débarrasser d'un mot de passe ou d'éviter qu'il ne soit intercepté
(gdb, wireshark, strace, libpreload, redefinition des fonctions d'E/S...)
Si le petit curieux est root ou même simplement peut exécuter du code dans
le même process, la méthode simpliste qui ne marche plus a pu rendre la
tâche un peu moins facile, mais nullement impossible.

Je ne suis pas d'accord avec ton approche nihiliste: meme si le mot
de passe existe en d'autres endroits, ce qui nous interesse, ici
et maintenant, c'est cette copie specifique en particulier. C'est
celle-la qui sera vulnerable, si par exemple il y a un bug dans le
reste du programme. Et si le programmeur a pense se proteger avec le
memset, histoire de s'assurer qu'un bug ailleurs dans le meme code
ne rendra pas le mot de passe accessible, eh bien il l'a dans l'os.

Et ce, independamment de tous les scenarios que tu peux imaginer... ce
genre de truc, ca se protege petit a petit (deja, si l'executable est
setuid, normalement, tu peux courir avec gdb, strace ou libpreload sur
un systeme correct, et comme je l'ai deja dit, j'utilise un systeme qui
chiffre son swap, precisement pour eviter ce genre d'espionnage).

C'est pas en laissant tomber des le debut sous pretexte qu'il va y avoir
d'autres problemes qu'on ira bien loin...

Certes,

Mais le mot de passe sera quand même plus facile à extraire du buffer de
stdin que de la pile où il aura pu être écrasé maintes fois avant que le
code malveillant ne prenne la main.

Le cas que tu décris est problématique, et je suis d'accord que le
programmeur moyen écrit souvent des lourdeurs dont même une analyse sérieuse
par le compilateur ne peut supprimer l'inefficacité sémantique, exemples:

int f() {
char filename[PATH_MAX] = "";
...
}

On veut simplement initialiser filename[0] à '' et c'est tout le buffer
qui est mis à 0, avec un code pas toujours optimal.

Que memset soit enfin optimisé intrinsèquement par gcc ne me choque pas,
cela permet de simplifier les headers de la libc tout en généralisant la
génération en ligne à toutes les architectures où cela a un sens.

Que les memset inutiles soient supprimés, encore d'accord, ils sont trop
souvent le fait de codes idiomatiques douteux, voire de codes générés par
programme.

Que certtains d'entre eux aient une utilité particulière, c'est
effectivement un problème, mais pas plus que les "boucles de temporisation"
qui soudain ne produisent plus de code.

Je ferais bien une proposition pour C2029 : le qualifier volatile appriqué à
un bloc aurait pour effet que toute opération faite dans ce bloc devrait
produire le code escompté, sans optimisation aucune (suppression de
lectures, écritures...). Bon, il faudrait traduire cela dans la
terminologie de la norme et la sémantique de la machine abstraite, donc 2029
c'est peut-etre encore trop optimiste.

Où en est cette discussion ?
Quels autres problèmes se posent avec ces optimisations ?

Chqrlie

Vous avez filtré cet utilisateur ! Consultez son message

"Marc Espie" a écrit dans le message de news:
f56trp$1ddu$

In article <4676f57d$0$23627$,
Charlie Gordon wrote:
Le mot de passe lu de cette façon est present plus d'une fois en mémoire :
dans le buffer où il est reçu et dont on essaye désormais vainement de
l'effacer avec ce memset (on devrait d'ailleurs utiliser plutôt strset()
;-)
mais aussi dans le buffer d'entrées / sorties si on a utilisé stdio, et
dans
les buffers du driver de clavier, de la console, ou ceux de l'interface
réseau selon le cas, sans parler du fichier de swap... ce n'est pas
trivial
de se débarrasser d'un mot de passe ou d'éviter qu'il ne soit intercepté
(gdb, wireshark, strace, libpreload, redefinition des fonctions d'E/S...)
Si le petit curieux est root ou même simplement peut exécuter du code dans
le même process, la méthode simpliste qui ne marche plus a pu rendre la
tâche un peu moins facile, mais nullement impossible.

Je ne suis pas d'accord avec ton approche nihiliste: meme si le mot
de passe existe en d'autres endroits, ce qui nous interesse, ici
et maintenant, c'est cette copie specifique en particulier. C'est
celle-la qui sera vulnerable, si par exemple il y a un bug dans le
reste du programme. Et si le programmeur a pense se proteger avec le
memset, histoire de s'assurer qu'un bug ailleurs dans le meme code
ne rendra pas le mot de passe accessible, eh bien il l'a dans l'os.

Et ce, independamment de tous les scenarios que tu peux imaginer... ce
genre de truc, ca se protege petit a petit (deja, si l'executable est
setuid, normalement, tu peux courir avec gdb, strace ou libpreload sur
un systeme correct, et comme je l'ai deja dit, j'utilise un systeme qui
chiffre son swap, precisement pour eviter ce genre d'espionnage).

C'est pas en laissant tomber des le debut sous pretexte qu'il va y avoir
d'autres problemes qu'on ira bien loin...

Certes,

Mais le mot de passe sera quand même plus facile à extraire du buffer de
stdin que de la pile où il aura pu être écrasé maintes fois avant que le
code malveillant ne prenne la main.

Le cas que tu décris est problématique, et je suis d'accord que le
programmeur moyen écrit souvent des lourdeurs dont même une analyse sérieuse
par le compilateur ne peut supprimer l'inefficacité sémantique, exemples:

int f() {
char filename[PATH_MAX] = "";
...
}

On veut simplement initialiser filename[0] à '' et c'est tout le buffer
qui est mis à 0, avec un code pas toujours optimal.

Que memset soit enfin optimisé intrinsèquement par gcc ne me choque pas,
cela permet de simplifier les headers de la libc tout en généralisant la
génération en ligne à toutes les architectures où cela a un sens.

Que les memset inutiles soient supprimés, encore d'accord, ils sont trop
souvent le fait de codes idiomatiques douteux, voire de codes générés par
programme.

Que certtains d'entre eux aient une utilité particulière, c'est
effectivement un problème, mais pas plus que les "boucles de temporisation"
qui soudain ne produisent plus de code.

Je ferais bien une proposition pour C2029 : le qualifier volatile appriqué à
un bloc aurait pour effet que toute opération faite dans ce bloc devrait
produire le code escompté, sans optimisation aucune (suppression de
lectures, écritures...). Bon, il faudrait traduire cela dans la
terminologie de la norme et la sémantique de la machine abstraite, donc 2029
c'est peut-etre encore trop optimiste.

Où en est cette discussion ?
Quels autres problèmes se posent avec ces optimisations ?

Chqrlie

assert() et génération de code

3 réponses

Veuillez sélectionner un problème