OVH Cloud OVH Cloud

Comment marche les antispams?

6 réponses
Avatar
TTT
Salut

C'est juste ma culture personelle : comment fonctionnent les services
antispam?
Notamment le filtre "Courrier indésirable" de mon célèbre mailer ?

Basé sur les IP polleuses ? mots clés dans le titre, le corps du mail ? une
combinaison des 2 ?

C'est pour savoir comment ils font (à moins que ce soit un secret de
fabrication) et savoir s'il faut faire une confiance aveugle dans ces
filtres ...

Merci.

6 réponses

Avatar
Jean-François Moyen
C'est juste ma culture personelle : comment fonctionnent les services
antispam?
Notamment le filtre "Courrier indésirable" de mon célèbre mailer ?

Basé sur les IP polleuses ? mots clés dans le titre, le corps du mail ? une
combinaison des 2 ?


Ca dépend lesquels.
Pas mal de FAI utilisent des trucs très rustiques (par exemple, une
bête liste de mots clefs ou d'adresses "bannies"). Autant dire que ca,
ca marche assez mal (il suffit de changer d'adresse, et de remplacer
viagra par , pour échapper au filtre -- c'est pour ca que les
spams contemporains viennent tous d'adresses différentes, avec des
graphies farfelues des mots clefs).

D'autres utilisent des systèmes un peu plus élaborés, par exemple
filtrer sur les IP suspectes; ca repose sur des bases de données d'IP
génératrices de spam. Le problème, c'est qu'une IP spammogène peut
aussi être utilisée par un utilisateur légitime (par exemple une
adresse dynamique dans la plage d'un FAI qui aurait un client
véreux...). Variante du même, filtrer sur les domaines suspects. En
gros, ca revient à jeter tout ce qui vient de chez yahoo.com :-) ; le
problème est évidemment le même, on peut avoir des correspondants
légitimes chez yahoo ! Pendant une époque, wanadoo.fr a été dans
certaines listes noires (parce que, je suppose, ils n'ont pas du réagit
assez vite lorsqu'un spammeur a spammé depuis chez eux). C'était chiant
...

Il y a aussi des techniques genre "greylisting" : quand une machine
recoit un mail d'un expéditeur inconnu, elle lui écrit pour demander
confirmation ("t'es qui toi, t'existe vraiment ?"). Si c'est une
adresse jetable de spam, en général il n'y a pas de réponse. On jette
le mail. Sinon, le serveur (ou le client) d'origine répond, et on
transmet le mail. Ca marche pas mal, par exemple pour protéger des
listes de diffusion.

En fait, les filtres qui semblent les plus efficaces maintenant sont
des filtres basés sur l'analyse des mails. Soit des choses comme
spamassassin, qui affectent des "scores" à différents items (mail tout
en majuscules : +5; mail en rouge vif : +2; mail venant d'une adresse
improbable/d'un domaine fantôme : +5; si le score total est de plus de
XX, boum). Soit des filtres "bayésiens" (j'ai eu écrit sur ce forum des
commentaires sur comment que ca marche, au mois de décembre dernier,
sinon googler pour les détails ou lire l'article de Paul Graham "A plan
for spam" www.paulgraham.com/spam.html).
En gros, l'idée est de construire une base de donnée de tout les mots
de tout les emails recus, spams ou bons. Pour chaque mot, on calcule la
proba qu'il se trouve dans un spam. Quand on recoit un nouveau mail, on
regarde tout les mots du mail et pour chaque mot, on extrait de la BD
une "probabilité de spam". En combinant ces probas, on obtient une
proba globale que le mail soit un spam.
Après une période d'apprentissage initial, ca marche très bien
(précision > 99.8 % chez moi...), et ca permet en plus de configurer à
son goût et de décider individuellement ce qu'on considère comme du
spam, et ce qu'on considère comme bon. Et c'est une technique très
adaptable, et qui plus est "auto-adaptable" (alors qu'un spamassassin,
il faut à chaque nouvelle évolution de la technique des spammeurs lui
donner le nouveau critère; avec un bayésien il suffit de lui dire "ca
c'est un spam").

Evidemment, ce sont des combinaisons de toutes ces stratégies qui
servent dans la vraie vie -d'autant que certaines sont au niveau du
serveur de mail, certaines au niveau du client de l'utilisateur.

Pour plus de détails sur les méthodes au niveau des serveurs et/ou des
relais, d'autres intervenants du forum seront sûrement plus compétents
que moi.

Quant à savoir ce que votre FAI utilise... Si il vous propose de
"signaler iun mail come indésirable", ca suggère qu'il utilise un
système qui peut s'éduquer. Donc une composante bayésienne ? Ou bien se
contente t il de blacklister les adresses indésirables ?


C'est pour savoir comment ils font (à moins que ce soit un secret de
fabrication) et savoir s'il faut faire une confiance aveugle dans ces filtres


Le détail de ce qu'il font se trouve peut être dans leurs pages
techniques (chercher les liens "aide" ou "comment ca marche" sur leur
site web); ou alors, il a pu être discuté sur des forums ou des listes
de diffusion, googler un truc du genre "antispam mon_fai" peut donner
des réponses.

Il ne faut évidemment pas faire une confiance aveugle, ni dans un sens
ni dans l'autre : il y aiura des spals qui echapperont au filtre, et il
y aura des messages légitimes abusivement filtrés. Le tout est de
savoir en quelle proportion, et à partir de quand ca devient gênant
pour l'utilisateur (plus gênant que de recevoir X spams par jour, en
fait).

JF

--
J.-F. Moyen
http://moyen.free.fr
Attention adresse anti-spam

Avatar
TTT
Ceci est un complément à mon post précédent.
D'abord toutes mes excuses pour la grosse faute d'orthographe dans le titre
!

Bon, j'essaie de mener une réflexion sur le problème des spams. Car ça va
vraiment devenir un problème de société. Ca peut tuer l'email à terme.
Comment puis-je ouvrir une boite email à mes enfants mineurs? et s'ils
reçoivent des cochonneries?

Prenons le problème à sa source. On est spammé car envoyer un mail je coûte
rien. En effet, personne n'est spammé par SMS ! (sauf peut-être par son
propre provider...).

Alors y a-t-il un moyen de facturer les envoyeurs de mails ?
- Une taxe "envoi de mail". Si vous envoyez à plus de 100 personnes / mois
vous serez facturé à l'email à partir du 101e email. Attention je parle du
nombre de destinataires, pas du nombre d'emails émis.
- Un système de dénonciation : si mon destinataire signale que tel ou tel
proxy le spamme alors le proxy devra payer une taxe. Donc le propriétaire du
proxy va reporter ce coût sur l'utilisateur du proxy.
Cela revient en gros à décreter que posséder un serveur mail est une
activité réglementée. Après tout ça existe pour le téléphone, la radio et la
télévision (je me trompe pas?) alors pourquoi pas pour le mail ?
Bref, il faut trouver un moyen de rendre l'envoi de mail payant...

Je dis certainement des bétises car je ne suis pas très fort en réseau ni en
droit. Que pensez-vous de tout ça ?
Avatar
Ludovic LEMOAL
TTT nous a schtroumphé :

Salut


Bonjour,

C'est juste ma culture personelle : comment fonctionnent les services
antispam?
Notamment le filtre "Courrier indésirable" de mon célèbre mailer ?


Il y a deux grandes catégories d'anti-pourriels :
- Ceux qui se basent sur des filtres bayésiens. Dans ce cas-là, tu joues un
rôle actif puisque tu apprends au logiciel à distinguer les pourriels des
non-pourriels. Le logiciel repère les mot-clés et les repère par la suite
assez facilement.
- Ceux qui se basent sur le serveur d'envoi. Grosso-modo, des bases de
données de spammeurs ou de relais ouverts sont maintenues et lorsqu'un
courrier arrive, on compare le serveur d'où il a été envoyé à une ou
plusieurs de ces bases et l'application décide si c'est un spam ou pas.
C'est très très moyen comme moyen de détection.
--
Ludovic LE MOAL

Avatar
Bertrand B


Il y a aussi des techniques genre "greylisting" : quand une machine
recoit un mail d'un expéditeur inconnu, elle lui écrit pour demande r
confirmation ("t'es qui toi, t'existe vraiment ?"). Si c'est une adress e
jetable de spam, en général il n'y a pas de réponse. On jette le mail.
Sinon, le serveur (ou le client) d'origine répond, et on transmet le
mail. Ca marche pas mal, par exemple pour protéger des listes de diff usion.

Ce que vous décrivez est le fonctionnement de ask

(http://sourceforge.net/projects/a-s-k/) ou de projet similaire mais
pas celui qui est décrit comme étant le greylisting dans
http://projects.puremagic.com/greylisting/whitepaper.html

Avatar
Bertrand B
Ceci est un complément à mon post précédent.
D'abord toutes mes excuses pour la grosse faute d'orthographe dans le t itre
!

Bon, j'essaie de mener une réflexion sur le problème des spams. Car ça va
vraiment devenir un problème de société. Ca peut tuer l'email à terme.
Comment puis-je ouvrir une boite email à mes enfants mineurs? et s'il s
reçoivent des cochonneries?

Prenons le problème à sa source. On est spammé car envoyer un mai l je coûte
rien. En effet, personne n'est spammé par SMS ! (sauf peut-être par son
propre provider...).

Alors y a-t-il un moyen de facturer les envoyeurs de mails ?
- Une taxe "envoi de mail". Si vous envoyez à plus de 100 personnes / mois
vous serez facturé à l'email à partir du 101e email. Attention je parle du
nombre de destinataires, pas du nombre d'emails émis.
- Un système de dénonciation : si mon destinataire signale que tel ou tel
proxy le spamme alors le proxy devra payer une taxe. Donc le propriét aire du
proxy va reporter ce coût sur l'utilisateur du proxy.
Cela revient en gros à décreter que posséder un serveur mail est une
activité réglementée. Après tout ça existe pour le téléph one, la radio et la
télévision (je me trompe pas?) alors pourquoi pas pour le mail ?
Bref, il faut trouver un moyen de rendre l'envoi de mail payant...

Je dis certainement des bétises car je ne suis pas très fort en ré seau ni en
droit. Que pensez-vous de tout ça ?




J'ai aussi vu la proposition de ne pas accepter de mail non signés avec
une signature valide.

Avatar
Fabien LE LEZ
On Thu, 1 Sep 2005 17:16:50 +0200, "TTT" :

Notamment le filtre "Courrier indésirable" de mon célèbre mailer ?


Dossier très intéressant, par l'auteur de l'idée d'employer un filtre
bayésien contre le spam :
http://www.paulgraham.com/spam.html