info sur Netscape Junk Mail Control

7 réponses

cyrille

01/10/2003 à 11:47

Bonjour,

connaissez vous l'origine du nouveau filtre anitspam de Netscape : Junk
Mail Control (seulement dans la version 7.1 anglaise)

ça fait qlqs semaines que je l'utilise et ça marche d'enfer. c'est génial.

Existe il un tel outil à mettre sur les serveurs (Qmail par exemple) ?
Est-ce un projet Open source ou GPL ?

Ou trouver plus d'info sur le sujet ?

merci
cyrille

7 réponses

Laurent Wacrenier

01/10/2003 à 11:56

cyrille écrit:

connaissez vous l'origine du nouveau filtre anitspam de Netscape : Junk
Mail Control (seulement dans la version 7.1 anglaise)

ça fait qlqs semaines que je l'utilise et ça marche d'enfer. c'est génial.

Existe il un tel outil à mettre sur les serveurs (Qmail par exemple) ?
Est-ce un projet Open source ou GPL ?

Ou trouver plus d'info sur le sujet ?

Ce sont des filtres bayesiens, inspirés de l'article de Paul Graham "A
Plan for Spam" (http://www.paulgraham.com/spam.html).

En gros, il regarde les occurences des mots des courriers que tu
déclare comme des spams ou des courriers ordinaires. Après
l'apprentissage, si un nouveau courrier a beaucoup de mots typiques
des spams, il est marqué comme tel.

Il y a de nombreuses implémentations (recherche "bayesian filter" dans
un moteur de recherche). Le problème général est qu'il y a un
apprentissage et qu'un bête serveur ne peut pas le faire sans aide.
Il faut une interface avec l'utilisateur final pour celà.

cyrille

01/10/2003 à 12:18

un moteur de recherche). Le problème général est qu'il y a un
apprentissage et qu'un bête serveur ne peut pas le faire sans aide.

ah ba oui ... mince, encore besoin de l'homme ;o)

merci beaucoup pour ta lumière.

cyrille

ludovic.thebault

01/10/2003 à 13:11

Laurent Wacrenier wrote:

Ce sont des filtres bayesiens, inspirés de l'article de Paul Graham "A
Plan for Spam" (http://www.paulgraham.com/spam.html).

Le principal défaut de ce type de filtres est qu'il nécessite de
rappatrier les messages complets.

Existe-t-il un système identique qui ne fonctionne que sur les entêtes ?

Laurent Wacrenier

01/10/2003 à 15:32

Ludovic Thébault écrit:

Laurent Wacrenier wrote:

Ce sont des filtres bayesiens, inspirés de l'article de Paul Graham "A
Plan for Spam" (http://www.paulgraham.com/spam.html).

Le principal défaut de ce type de filtres est qu'il nécessite de
rappatrier les messages complets.

Existe-t-il un système identique qui ne fonctionne que sur les entêtes ?

Non, l'algorithme a besoin du message pour lire les mots qu'il y a
dedans. Ceci dit, on peut adapter un client pour qu'il traite de
messages vides de contenu. Le resultat devrait être moins pertinent.

Une meilleure solution serait de faire faire le boulot sur le serveur
avec des messages envoyé entre lui et le client. Je ne connais pas de
standard pour celà, mais il y peut-être quelques webmail qui font ça.

ludovic.thebault

01/10/2003 à 19:54

Laurent Wacrenier wrote:

Non, l'algorithme a besoin du message pour lire les mots qu'il y a
dedans. Ceci dit, on peut adapter un client pour qu'il traite de
messages vides de contenu. Le resultat devrait être moins pertinent.

Pas forcément, un spam se répère à 90% d'après son sujet, les 10 %
restant étant douteux (je parle pour nous les francophones, encore
que...).
Et hormis le sujet, les <Undelivered>, les faux-destinataires et
sûrement d'autres bizarreries dans les en-têtes devraient permettre
d'éliminer autant de spam qu'une analyse du message par filtre bayésien.

En fait je pensais à fonctionnement proche des filtres bayésiens : on
indique simplement si le message est bon ou mauvais (une fois reçu bien
sûr, c'est la phase d'apprentissage). Le logiciel adapte ses règles de
filtres en fonction et agit ensuite directement sur le serveur. Les
messages seraient soit éliminés, soit rappatrier sous forme d'en-têtes,
soit rappatrier complétement.

ho alexandre

02/10/2003 à 03:28

cyrille wrote:

Bonjour,

connaissez vous l'origine du nouveau filtre anitspam de Netscape : Junk
Mail Control (seulement dans la version 7.1 anglaise)

http://www.mozilla.org/mailnews/spam.html
c basé sur les filtres de Bayes.

Existe il un tel outil à mettre sur les serveurs (Qmail par exemple) ?
Est-ce un projet Open source ou GPL ?

en GPL il y a Bogofilter et Spamassassin qui utilisent le même type de
filtre de Bayes.

--
XandreX
/I'm that kind of people your parents warned you about/

Laurent Wacrenier

02/10/2003 à 13:05

ho alexandre écrit:

http://www.mozilla.org/mailnews/spam.html
c basé sur les filtres de Bayes.

non pas "c" mais "c'est".

non pas "de Bayes" mais "baysiens". Thomas Bayes était un
mathématicien du dix-huitième siècle et n'a pas fait de filtres
anti-spam mais des travaux sur les probabilités.

info sur Netscape Junk Mail Control

7 réponses

Veuillez sélectionner un problème