Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

info sur Netscape Junk Mail Control

7 réponses
Avatar
cyrille
Bonjour,

connaissez vous l'origine du nouveau filtre anitspam de Netscape : Junk
Mail Control (seulement dans la version 7.1 anglaise)

ça fait qlqs semaines que je l'utilise et ça marche d'enfer. c'est génial.

Existe il un tel outil à mettre sur les serveurs (Qmail par exemple) ?
Est-ce un projet Open source ou GPL ?

Ou trouver plus d'info sur le sujet ?

merci
cyrille

7 réponses

Avatar
Laurent Wacrenier
cyrille écrit:
connaissez vous l'origine du nouveau filtre anitspam de Netscape : Junk
Mail Control (seulement dans la version 7.1 anglaise)

ça fait qlqs semaines que je l'utilise et ça marche d'enfer. c'est génial.

Existe il un tel outil à mettre sur les serveurs (Qmail par exemple) ?
Est-ce un projet Open source ou GPL ?

Ou trouver plus d'info sur le sujet ?


Ce sont des filtres bayesiens, inspirés de l'article de Paul Graham "A
Plan for Spam" (http://www.paulgraham.com/spam.html).

En gros, il regarde les occurences des mots des courriers que tu
déclare comme des spams ou des courriers ordinaires. Après
l'apprentissage, si un nouveau courrier a beaucoup de mots typiques
des spams, il est marqué comme tel.

Il y a de nombreuses implémentations (recherche "bayesian filter" dans
un moteur de recherche). Le problème général est qu'il y a un
apprentissage et qu'un bête serveur ne peut pas le faire sans aide.
Il faut une interface avec l'utilisateur final pour celà.

Avatar
cyrille
un moteur de recherche). Le problème général est qu'il y a un
apprentissage et qu'un bête serveur ne peut pas le faire sans aide.


ah ba oui ... mince, encore besoin de l'homme ;o)

merci beaucoup pour ta lumière.

cyrille

Avatar
ludovic.thebault
Laurent Wacrenier wrote:

Ce sont des filtres bayesiens, inspirés de l'article de Paul Graham "A
Plan for Spam" (http://www.paulgraham.com/spam.html).


Le principal défaut de ce type de filtres est qu'il nécessite de
rappatrier les messages complets.

Existe-t-il un système identique qui ne fonctionne que sur les entêtes ?

Avatar
Laurent Wacrenier
Ludovic Thébault écrit:
Laurent Wacrenier wrote:

Ce sont des filtres bayesiens, inspirés de l'article de Paul Graham "A
Plan for Spam" (http://www.paulgraham.com/spam.html).


Le principal défaut de ce type de filtres est qu'il nécessite de
rappatrier les messages complets.

Existe-t-il un système identique qui ne fonctionne que sur les entêtes ?


Non, l'algorithme a besoin du message pour lire les mots qu'il y a
dedans. Ceci dit, on peut adapter un client pour qu'il traite de
messages vides de contenu. Le resultat devrait être moins pertinent.

Une meilleure solution serait de faire faire le boulot sur le serveur
avec des messages envoyé entre lui et le client. Je ne connais pas de
standard pour celà, mais il y peut-être quelques webmail qui font ça.


Avatar
ludovic.thebault
Laurent Wacrenier wrote:

Non, l'algorithme a besoin du message pour lire les mots qu'il y a
dedans. Ceci dit, on peut adapter un client pour qu'il traite de
messages vides de contenu. Le resultat devrait être moins pertinent.


Pas forcément, un spam se répère à 90% d'après son sujet, les 10 %
restant étant douteux (je parle pour nous les francophones, encore
que...).
Et hormis le sujet, les <Undelivered>, les faux-destinataires et
sûrement d'autres bizarreries dans les en-têtes devraient permettre
d'éliminer autant de spam qu'une analyse du message par filtre bayésien.

En fait je pensais à fonctionnement proche des filtres bayésiens : on
indique simplement si le message est bon ou mauvais (une fois reçu bien
sûr, c'est la phase d'apprentissage). Le logiciel adapte ses règles de
filtres en fonction et agit ensuite directement sur le serveur. Les
messages seraient soit éliminés, soit rappatrier sous forme d'en-têtes,
soit rappatrier complétement.

Avatar
ho alexandre
cyrille wrote:

Bonjour,

connaissez vous l'origine du nouveau filtre anitspam de Netscape : Junk
Mail Control (seulement dans la version 7.1 anglaise)


http://www.mozilla.org/mailnews/spam.html
c basé sur les filtres de Bayes.



Existe il un tel outil à mettre sur les serveurs (Qmail par exemple) ?
Est-ce un projet Open source ou GPL ?


en GPL il y a Bogofilter et Spamassassin qui utilisent le même type de
filtre de Bayes.



--
XandreX
/I'm that kind of people your parents warned you about/

Avatar
Laurent Wacrenier
ho alexandre écrit:
http://www.mozilla.org/mailnews/spam.html
c basé sur les filtres de Bayes.


non pas "c" mais "c'est".

non pas "de Bayes" mais "baysiens". Thomas Bayes était un
mathématicien du dix-huitième siècle et n'a pas fait de filtres
anti-spam mais des travaux sur les probabilités.