OVH Cloud OVH Cloud

spamassassin et le ham

3 réponses
Avatar
cavelier
Bonssoir.J'ai constitué dans kmail deux dossiers spam(800 mess) et ham(4000)
pour nourrir spamassassin. J'ai lancé sa-learn --ham et --spam.
Spammassassin a entrepris son boulôt derechef. Le dossier ham doit il être
alimenté de nv mails maintenant? De même est-il utile de garder les anciens
messages reconnus comme du spam? Bref comment gère t'on un tel logiciel?
Merci.
--
cordialement,jean-jacques.

3 réponses

Avatar
Basile Starynkevitch [news]
Bonsoir,

On 2004-09-29, cavelier wrote:
Bonssoir.J'ai constitué dans kmail deux dossiers spam(800 mess) et ham(4000)
pour nourrir spamassassin. J'ai lancé sa-learn --ham et --spam.
Spammassassin a entrepris son boulôt derechef. Le dossier ham doit il être
alimenté de nv mails maintenant? De même est-il utile de garder les anciens
messages reconnus comme du spam? Bref comment gère t'on un tel logiciel?


Je ne connais pas spamassassin, mais j'utilise spamoracle qui utilise
des algorithmes similaires (bayésiens). J'explique ici pour spamoracle
(mais j'imagine que spamassassin a des fonctionalités similaires).

spamoracle garde ses coefficients dans une base (un fichier NDBM, sauf
erreur de ma part) et met cette base à jour quand il apprend un
nouveau spam ou un nouveau ham. Il n'est pas utile de conserver les
messages utilisés par l'apprentissage (mais il faudrait sauvegarder la
base de coefficients).

Quand un message est mal classé, je l'alimente à spamoracle par:
spamoracle add -spam ou spamoracle add -good

Voir http://cristal.inria.fr/~xleroy/software/ pour spamoracle

J'utilise spamoracle avec maildrop (mais on peut aussi l'utiliser avec
procmail).

Je crois donc que spamassassin comme spamoracle n'ont pas besoin de
conserver le jeu de méls utilisés pour leur apprentissage. (Mais je ne
connais pas spamassassin)

Cordialement.
--
Basile STARYNKEVITCH http://starynkevitch.net/Basile/
email: basile<at>starynkevitch<dot>net
aliases: basile<at>tunes<dot>org = bstarynk<at>nerim<dot>net
8, rue de la Faïencerie, 92340 Bourg La Reine, France

Avatar
cavelier
Basile Starynkevitch [news] wrote:

Bonsoir,
Je crois donc que spamassassin comme spamoracle n'ont pas besoin de
conserver le jeu de méls utilisés pour leur apprentissage. (Mais je ne

connais pas spamassassin)

Cordialement.


Merci.
--
cordialement,jean-jacques.


Avatar
GERBIER Eric
cavelier wrote:
Bonssoir.J'ai constitué dans kmail deux dossiers spam(800 mess) et ham(4000)
pour nourrir spamassassin. J'ai lancé sa-learn --ham et --spam.
Spammassassin a entrepris son boulôt derechef. Le dossier ham doit il être
alimenté de nv mails maintenant? De même est-il utile de garder les anciens
messages reconnus comme du spam? Bref comment gère t'on un tel logiciel?
Merci.



il y a une tres bonne doc a ce sujet dans la manpage de sa-learn
(le paragraphe "EFFECTIVE TRAINING" en particulier, propose plusieurs methodes
de gestion)