Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
Laurent Wacrenier
cyrille écrit:
connaissez vous l'origine du nouveau filtre anitspam de Netscape : Junk Mail Control (seulement dans la version 7.1 anglaise)
ça fait qlqs semaines que je l'utilise et ça marche d'enfer. c'est génial.
Existe il un tel outil à mettre sur les serveurs (Qmail par exemple) ? Est-ce un projet Open source ou GPL ?
Ou trouver plus d'info sur le sujet ?
Ce sont des filtres bayesiens, inspirés de l'article de Paul Graham "A Plan for Spam" (http://www.paulgraham.com/spam.html).
En gros, il regarde les occurences des mots des courriers que tu déclare comme des spams ou des courriers ordinaires. Après l'apprentissage, si un nouveau courrier a beaucoup de mots typiques des spams, il est marqué comme tel.
Il y a de nombreuses implémentations (recherche "bayesian filter" dans un moteur de recherche). Le problème général est qu'il y a un apprentissage et qu'un bête serveur ne peut pas le faire sans aide. Il faut une interface avec l'utilisateur final pour celà.
cyrille <cyrilleml@kbuilder.net> écrit:
connaissez vous l'origine du nouveau filtre anitspam de Netscape : Junk
Mail Control (seulement dans la version 7.1 anglaise)
ça fait qlqs semaines que je l'utilise et ça marche d'enfer. c'est génial.
Existe il un tel outil à mettre sur les serveurs (Qmail par exemple) ?
Est-ce un projet Open source ou GPL ?
Ou trouver plus d'info sur le sujet ?
Ce sont des filtres bayesiens, inspirés de l'article de Paul Graham "A
Plan for Spam" (http://www.paulgraham.com/spam.html).
En gros, il regarde les occurences des mots des courriers que tu
déclare comme des spams ou des courriers ordinaires. Après
l'apprentissage, si un nouveau courrier a beaucoup de mots typiques
des spams, il est marqué comme tel.
Il y a de nombreuses implémentations (recherche "bayesian filter" dans
un moteur de recherche). Le problème général est qu'il y a un
apprentissage et qu'un bête serveur ne peut pas le faire sans aide.
Il faut une interface avec l'utilisateur final pour celà.
connaissez vous l'origine du nouveau filtre anitspam de Netscape : Junk Mail Control (seulement dans la version 7.1 anglaise)
ça fait qlqs semaines que je l'utilise et ça marche d'enfer. c'est génial.
Existe il un tel outil à mettre sur les serveurs (Qmail par exemple) ? Est-ce un projet Open source ou GPL ?
Ou trouver plus d'info sur le sujet ?
Ce sont des filtres bayesiens, inspirés de l'article de Paul Graham "A Plan for Spam" (http://www.paulgraham.com/spam.html).
En gros, il regarde les occurences des mots des courriers que tu déclare comme des spams ou des courriers ordinaires. Après l'apprentissage, si un nouveau courrier a beaucoup de mots typiques des spams, il est marqué comme tel.
Il y a de nombreuses implémentations (recherche "bayesian filter" dans un moteur de recherche). Le problème général est qu'il y a un apprentissage et qu'un bête serveur ne peut pas le faire sans aide. Il faut une interface avec l'utilisateur final pour celà.
cyrille
un moteur de recherche). Le problème général est qu'il y a un apprentissage et qu'un bête serveur ne peut pas le faire sans aide.
ah ba oui ... mince, encore besoin de l'homme ;o)
merci beaucoup pour ta lumière.
cyrille
un moteur de recherche). Le problème général est qu'il y a un
apprentissage et qu'un bête serveur ne peut pas le faire sans aide.
Ce sont des filtres bayesiens, inspirés de l'article de Paul Graham "A Plan for Spam" (http://www.paulgraham.com/spam.html).
Le principal défaut de ce type de filtres est qu'il nécessite de rappatrier les messages complets.
Existe-t-il un système identique qui ne fonctionne que sur les entêtes ?
Laurent Wacrenier
Ludovic Thébault écrit:
Laurent Wacrenier wrote:
Ce sont des filtres bayesiens, inspirés de l'article de Paul Graham "A Plan for Spam" (http://www.paulgraham.com/spam.html).
Le principal défaut de ce type de filtres est qu'il nécessite de rappatrier les messages complets.
Existe-t-il un système identique qui ne fonctionne que sur les entêtes ?
Non, l'algorithme a besoin du message pour lire les mots qu'il y a dedans. Ceci dit, on peut adapter un client pour qu'il traite de messages vides de contenu. Le resultat devrait être moins pertinent.
Une meilleure solution serait de faire faire le boulot sur le serveur avec des messages envoyé entre lui et le client. Je ne connais pas de standard pour celà, mais il y peut-être quelques webmail qui font ça.
Ce sont des filtres bayesiens, inspirés de l'article de Paul Graham "A
Plan for Spam" (http://www.paulgraham.com/spam.html).
Le principal défaut de ce type de filtres est qu'il nécessite de
rappatrier les messages complets.
Existe-t-il un système identique qui ne fonctionne que sur les entêtes ?
Non, l'algorithme a besoin du message pour lire les mots qu'il y a
dedans. Ceci dit, on peut adapter un client pour qu'il traite de
messages vides de contenu. Le resultat devrait être moins pertinent.
Une meilleure solution serait de faire faire le boulot sur le serveur
avec des messages envoyé entre lui et le client. Je ne connais pas de
standard pour celà, mais il y peut-être quelques webmail qui font ça.
Ce sont des filtres bayesiens, inspirés de l'article de Paul Graham "A Plan for Spam" (http://www.paulgraham.com/spam.html).
Le principal défaut de ce type de filtres est qu'il nécessite de rappatrier les messages complets.
Existe-t-il un système identique qui ne fonctionne que sur les entêtes ?
Non, l'algorithme a besoin du message pour lire les mots qu'il y a dedans. Ceci dit, on peut adapter un client pour qu'il traite de messages vides de contenu. Le resultat devrait être moins pertinent.
Une meilleure solution serait de faire faire le boulot sur le serveur avec des messages envoyé entre lui et le client. Je ne connais pas de standard pour celà, mais il y peut-être quelques webmail qui font ça.
ludovic.thebault
Laurent Wacrenier wrote:
Non, l'algorithme a besoin du message pour lire les mots qu'il y a dedans. Ceci dit, on peut adapter un client pour qu'il traite de messages vides de contenu. Le resultat devrait être moins pertinent.
Pas forcément, un spam se répère à 90% d'après son sujet, les 10 % restant étant douteux (je parle pour nous les francophones, encore que...). Et hormis le sujet, les <Undelivered>, les faux-destinataires et sûrement d'autres bizarreries dans les en-têtes devraient permettre d'éliminer autant de spam qu'une analyse du message par filtre bayésien.
En fait je pensais à fonctionnement proche des filtres bayésiens : on indique simplement si le message est bon ou mauvais (une fois reçu bien sûr, c'est la phase d'apprentissage). Le logiciel adapte ses règles de filtres en fonction et agit ensuite directement sur le serveur. Les messages seraient soit éliminés, soit rappatrier sous forme d'en-têtes, soit rappatrier complétement.
Laurent Wacrenier <lwa@teaser.fr> wrote:
Non, l'algorithme a besoin du message pour lire les mots qu'il y a
dedans. Ceci dit, on peut adapter un client pour qu'il traite de
messages vides de contenu. Le resultat devrait être moins pertinent.
Pas forcément, un spam se répère à 90% d'après son sujet, les 10 %
restant étant douteux (je parle pour nous les francophones, encore
que...).
Et hormis le sujet, les <Undelivered>, les faux-destinataires et
sûrement d'autres bizarreries dans les en-têtes devraient permettre
d'éliminer autant de spam qu'une analyse du message par filtre bayésien.
En fait je pensais à fonctionnement proche des filtres bayésiens : on
indique simplement si le message est bon ou mauvais (une fois reçu bien
sûr, c'est la phase d'apprentissage). Le logiciel adapte ses règles de
filtres en fonction et agit ensuite directement sur le serveur. Les
messages seraient soit éliminés, soit rappatrier sous forme d'en-têtes,
soit rappatrier complétement.
Non, l'algorithme a besoin du message pour lire les mots qu'il y a dedans. Ceci dit, on peut adapter un client pour qu'il traite de messages vides de contenu. Le resultat devrait être moins pertinent.
Pas forcément, un spam se répère à 90% d'après son sujet, les 10 % restant étant douteux (je parle pour nous les francophones, encore que...). Et hormis le sujet, les <Undelivered>, les faux-destinataires et sûrement d'autres bizarreries dans les en-têtes devraient permettre d'éliminer autant de spam qu'une analyse du message par filtre bayésien.
En fait je pensais à fonctionnement proche des filtres bayésiens : on indique simplement si le message est bon ou mauvais (une fois reçu bien sûr, c'est la phase d'apprentissage). Le logiciel adapte ses règles de filtres en fonction et agit ensuite directement sur le serveur. Les messages seraient soit éliminés, soit rappatrier sous forme d'en-têtes, soit rappatrier complétement.
ho alexandre
cyrille wrote:
Bonjour,
connaissez vous l'origine du nouveau filtre anitspam de Netscape : Junk Mail Control (seulement dans la version 7.1 anglaise)
http://www.mozilla.org/mailnews/spam.html c basé sur les filtres de Bayes.
Existe il un tel outil à mettre sur les serveurs (Qmail par exemple) ? Est-ce un projet Open source ou GPL ?
en GPL il y a Bogofilter et Spamassassin qui utilisent le même type de filtre de Bayes.
-- XandreX /I'm that kind of people your parents warned you about/
cyrille wrote:
Bonjour,
connaissez vous l'origine du nouveau filtre anitspam de Netscape : Junk
Mail Control (seulement dans la version 7.1 anglaise)
http://www.mozilla.org/mailnews/spam.html
c basé sur les filtres de Bayes.
Existe il un tel outil à mettre sur les serveurs (Qmail par exemple) ?
Est-ce un projet Open source ou GPL ?
en GPL il y a Bogofilter et Spamassassin qui utilisent le même type de
filtre de Bayes.
--
XandreX
/I'm that kind of people your parents warned you about/
connaissez vous l'origine du nouveau filtre anitspam de Netscape : Junk Mail Control (seulement dans la version 7.1 anglaise)
http://www.mozilla.org/mailnews/spam.html c basé sur les filtres de Bayes.
Existe il un tel outil à mettre sur les serveurs (Qmail par exemple) ? Est-ce un projet Open source ou GPL ?
en GPL il y a Bogofilter et Spamassassin qui utilisent le même type de filtre de Bayes.
-- XandreX /I'm that kind of people your parents warned you about/
Laurent Wacrenier
ho alexandre écrit:
http://www.mozilla.org/mailnews/spam.html c basé sur les filtres de Bayes.
non pas "c" mais "c'est".
non pas "de Bayes" mais "baysiens". Thomas Bayes était un mathématicien du dix-huitième siècle et n'a pas fait de filtres anti-spam mais des travaux sur les probabilités.
ho alexandre <xandrex_usenet@m4x.org> écrit:
http://www.mozilla.org/mailnews/spam.html
c basé sur les filtres de Bayes.
non pas "c" mais "c'est".
non pas "de Bayes" mais "baysiens". Thomas Bayes était un
mathématicien du dix-huitième siècle et n'a pas fait de filtres
anti-spam mais des travaux sur les probabilités.
http://www.mozilla.org/mailnews/spam.html c basé sur les filtres de Bayes.
non pas "c" mais "c'est".
non pas "de Bayes" mais "baysiens". Thomas Bayes était un mathématicien du dix-huitième siècle et n'a pas fait de filtres anti-spam mais des travaux sur les probabilités.