Bon, depuis le temps où je recevais jusqu'à dix messages débiles
microsoftés avec des pièces jointes tout aussi débiles, ça s'est un peu
calmé (deux à trois co...es par jour).
Mais ça ne s'est pas arrêté; n'y a-t-il pas moyen de savoir d'où ça
vient,
Bon, depuis le temps où je recevais jusqu'à dix messages débiles
microsoftés avec des pièces jointes tout aussi débiles, ça s'est un peu
calmé (deux à trois co...es par jour).
Mais ça ne s'est pas arrêté; n'y a-t-il pas moyen de savoir d'où ça
vient,
Bon, depuis le temps où je recevais jusqu'à dix messages débiles
microsoftés avec des pièces jointes tout aussi débiles, ça s'est un peu
calmé (deux à trois co...es par jour).
Mais ça ne s'est pas arrêté; n'y a-t-il pas moyen de savoir d'où ça
vient,
Dominique Lang wrote:Bon, depuis le temps où je recevais jusqu'à dix messages débiles
microsoftés avec des pièces jointes tout aussi débiles, ça s'est un peu
calmé (deux à trois co...es par jour).
Mais ça ne s'est pas arrêté; n'y a-t-il pas moyen de savoir d'où ça
vient,
Non, les en-têtes des messages sont trafiqués. Il faudrait demandé au
FAI de trouver la véritable IP d'où provient le message, et il n'en a ni
le temps, ni le droit.
Dominique Lang <dominiquelang@wanadoo.fr> wrote:
Bon, depuis le temps où je recevais jusqu'à dix messages débiles
microsoftés avec des pièces jointes tout aussi débiles, ça s'est un peu
calmé (deux à trois co...es par jour).
Mais ça ne s'est pas arrêté; n'y a-t-il pas moyen de savoir d'où ça
vient,
Non, les en-têtes des messages sont trafiqués. Il faudrait demandé au
FAI de trouver la véritable IP d'où provient le message, et il n'en a ni
le temps, ni le droit.
Dominique Lang wrote:Bon, depuis le temps où je recevais jusqu'à dix messages débiles
microsoftés avec des pièces jointes tout aussi débiles, ça s'est un peu
calmé (deux à trois co...es par jour).
Mais ça ne s'est pas arrêté; n'y a-t-il pas moyen de savoir d'où ça
vient,
Non, les en-têtes des messages sont trafiqués. Il faudrait demandé au
FAI de trouver la véritable IP d'où provient le message, et il n'en a ni
le temps, ni le droit.
Bon, depuis le temps où je recevais jusqu'à dix messages débiles
microsoftés avec des pièces jointes tout aussi débiles, ça s'est un peu
calmé (deux à trois co...es par jour).
Mais ça ne s'est pas arrêté; n'y a-t-il pas moyen de savoir d'où ça
vient, histoire de prévenir ces pauvres utilisateurs de Fenêtres sur
Prehistoric Computer qu'ils contribuent à la pollution globale de la
planète?
Merci si quelqu'un a une idée (et si ma question est incongrue, mille
pardons).
Swen est sans doute le plus insidieux des vers de ces derniers temps. Le but
Bon, depuis le temps où je recevais jusqu'à dix messages débiles
microsoftés avec des pièces jointes tout aussi débiles, ça s'est un peu
calmé (deux à trois co...es par jour).
Mais ça ne s'est pas arrêté; n'y a-t-il pas moyen de savoir d'où ça
vient, histoire de prévenir ces pauvres utilisateurs de Fenêtres sur
Prehistoric Computer qu'ils contribuent à la pollution globale de la
planète?
Merci si quelqu'un a une idée (et si ma question est incongrue, mille
pardons).
Swen est sans doute le plus insidieux des vers de ces derniers temps. Le but
Bon, depuis le temps où je recevais jusqu'à dix messages débiles
microsoftés avec des pièces jointes tout aussi débiles, ça s'est un peu
calmé (deux à trois co...es par jour).
Mais ça ne s'est pas arrêté; n'y a-t-il pas moyen de savoir d'où ça
vient, histoire de prévenir ces pauvres utilisateurs de Fenêtres sur
Prehistoric Computer qu'ils contribuent à la pollution globale de la
planète?
Merci si quelqu'un a une idée (et si ma question est incongrue, mille
pardons).
Swen est sans doute le plus insidieux des vers de ces derniers temps. Le but
Bon, depuis le temps où je recevais jusqu'à dix messages débiles
microsoftés avec des pièces jointes tout aussi débiles, ça s'est un peu
calmé (deux à trois co...es par jour).
Mais ça ne s'est pas arrêté; n'y a-t-il pas moyen de savoir d'où ça
vient, histoire de prévenir ces pauvres utilisateurs de Fenêtres sur
Prehistoric Computer qu'ils contribuent à la pollution globale de la
planète?
Merci si quelqu'un a une idée (et si ma question est incongrue, mille
pardons).
Bon, depuis le temps où je recevais jusqu'à dix messages débiles
microsoftés avec des pièces jointes tout aussi débiles, ça s'est un peu
calmé (deux à trois co...es par jour).
Mais ça ne s'est pas arrêté; n'y a-t-il pas moyen de savoir d'où ça
vient, histoire de prévenir ces pauvres utilisateurs de Fenêtres sur
Prehistoric Computer qu'ils contribuent à la pollution globale de la
planète?
Merci si quelqu'un a une idée (et si ma question est incongrue, mille
pardons).
Bon, depuis le temps où je recevais jusqu'à dix messages débiles
microsoftés avec des pièces jointes tout aussi débiles, ça s'est un peu
calmé (deux à trois co...es par jour).
Mais ça ne s'est pas arrêté; n'y a-t-il pas moyen de savoir d'où ça
vient, histoire de prévenir ces pauvres utilisateurs de Fenêtres sur
Prehistoric Computer qu'ils contribuent à la pollution globale de la
planète?
Merci si quelqu'un a une idée (et si ma question est incongrue, mille
pardons).
la seule chose (compliquée) que j'ai trouvée c'est de prendre un compte
gratuit et filtré chez Tmicha, et d'y router dessus mon mail actuel.
Ensuite tu relèves chez Tmicha. Comme tous les autres services basés sur
des filtres non bayésien tu n'évites que 80% des spams, mais c'est déjà
ça. En local tu rajoutes un bayésien (style SpamSieve) et là ça commence
à aller.
H.
la seule chose (compliquée) que j'ai trouvée c'est de prendre un compte
gratuit et filtré chez Tmicha, et d'y router dessus mon mail actuel.
Ensuite tu relèves chez Tmicha. Comme tous les autres services basés sur
des filtres non bayésien tu n'évites que 80% des spams, mais c'est déjà
ça. En local tu rajoutes un bayésien (style SpamSieve) et là ça commence
à aller.
H.
la seule chose (compliquée) que j'ai trouvée c'est de prendre un compte
gratuit et filtré chez Tmicha, et d'y router dessus mon mail actuel.
Ensuite tu relèves chez Tmicha. Comme tous les autres services basés sur
des filtres non bayésien tu n'évites que 80% des spams, mais c'est déjà
ça. En local tu rajoutes un bayésien (style SpamSieve) et là ça commence
à aller.
H.
C'est koi un filtre bayésien ? je connais les réseaux bayésiens et la
formule de Bayes...
d'avance merci
C'est koi un filtre bayésien ? je connais les réseaux bayésiens et la
formule de Bayes...
d'avance merci
C'est koi un filtre bayésien ? je connais les réseaux bayésiens et la
formule de Bayes...
d'avance merci
Un filtre bayésien est donc un filtre qu'on éduque. Tu dois au départ
lui désigner quelques dizaines de "bons" mails et autant de spams. A
partir de là il va affecter des probabilités à chaque mot: par exemple
on se doute que le mot "SEX" va recevoir une proba de 99% spam, et que
si tu corresponds souvent avec un collègue nommé Georges le mot Georges
sera 99% bon. A chaque nouveau mail que tu reçois le filtre fait la
somme des % et en déduit un score, qui lui permet de décider s'il est
bon ou non.
J'ai donné ci-dessus en exemple deux mots qui ont du sens pour toi et
moi, mais il faut voir qu'un filtre bayésien va aussi travailler sur les
en-têtes et le code html des mails: par exemple, la balise html qui fait
passer du texte en rouge clignotant... là encore on se doute que sa
proba sera vite identifiée à 99% spam.
Enfin et surtout, à partir de là deux caractéristiques rendent les
filtres bayésiens incomparables:
- ils sont basés sur *tes* mails. Ta base de probabilités sera
différente de la mienne, et te sera plus particulièrement adaptée. Elle
ne dépend en outre d'aucun serveur externe de mauvaises adresses, ni
d'aucun abonnement
- ils sont capables d'auto-apprentissage. C'est là vraiment le summum de
l'élégance pour moi. Considère que les spams évoluent: chaque spammeur
s'évertue à changer l'apparence et le contenu de ses textes pour
échapper aux robots filtreurs, et le vocabulaire des spams change donc
sans cesse. Mais il change doucement. Ton filtre va être capable
d'identifier dans les spams de demain quelques nouveaux mots non encore
évalués. Eh bien, un nouveau mot dans un spam se voit attribuer 99% de
proba "spam". Et ta capacité de détection se développe. Sans que tu
n'aies *jamais* un filtre ou une règle à écrire.
Le filtre bayésien le plus connu dans le monde mac est celui fourni en
standard dans l'application Mail d'Apple. D'autres existent, je me sers
par exemple avec Powermail de SpamSieve (qui est compatible de la
plupart des "courielleurs" et même de Mail). Son efficacité est
redoutable, il "efface" sans erreur 99% des spams pour moi.
En fait les seuls spams qu'un bayésien bien éduqué laisse passer sont
ces messages ultra-courts, composés d'un titre anodin et d'une seule
ligne de texte qui est une adresse html (c'est-à-dire un "mot" inconnu
pour le filtre: trop peu d'info pour décider). Mais dans ce cas un
filtre "classique" peut liquider facilement ce spam-là ("si l'émetteur
n'est pas dans mon carnet d'adresse et le corps du message est une
simple adresse html alors spam"). En outre, ces spams courts semblent
passés de mode en ce moment :-)
Finalement, le seul défaut des filtres bayésiens est qu'on n'en trouve
pas encore qui puissent filtrer *sur ton serveur*, sans que tu aies
besoin de télécharger tous les spams. A ma connaissance un seul service
(payant) existe sur internet qui permette un tel filtrage bayésien à
distance, il est tout récent et je ne l'ai jamais testé (en plus il
exige internet explorer!). Mais ça devrait se développer dans l'avenir.
Aujourd'hui SpamSieve permet de filtrer "presque à distance" en ne
téléchargeant qu'un K ou deux dans un premier temps (ça lui suffit
largement pour filtrer), il permet aussi de filtrer sur les seuls
en-têtes des messages lors d'une connexion IMAP.
Un filtre bayésien est donc un filtre qu'on éduque. Tu dois au départ
lui désigner quelques dizaines de "bons" mails et autant de spams. A
partir de là il va affecter des probabilités à chaque mot: par exemple
on se doute que le mot "SEX" va recevoir une proba de 99% spam, et que
si tu corresponds souvent avec un collègue nommé Georges le mot Georges
sera 99% bon. A chaque nouveau mail que tu reçois le filtre fait la
somme des % et en déduit un score, qui lui permet de décider s'il est
bon ou non.
J'ai donné ci-dessus en exemple deux mots qui ont du sens pour toi et
moi, mais il faut voir qu'un filtre bayésien va aussi travailler sur les
en-têtes et le code html des mails: par exemple, la balise html qui fait
passer du texte en rouge clignotant... là encore on se doute que sa
proba sera vite identifiée à 99% spam.
Enfin et surtout, à partir de là deux caractéristiques rendent les
filtres bayésiens incomparables:
- ils sont basés sur *tes* mails. Ta base de probabilités sera
différente de la mienne, et te sera plus particulièrement adaptée. Elle
ne dépend en outre d'aucun serveur externe de mauvaises adresses, ni
d'aucun abonnement
- ils sont capables d'auto-apprentissage. C'est là vraiment le summum de
l'élégance pour moi. Considère que les spams évoluent: chaque spammeur
s'évertue à changer l'apparence et le contenu de ses textes pour
échapper aux robots filtreurs, et le vocabulaire des spams change donc
sans cesse. Mais il change doucement. Ton filtre va être capable
d'identifier dans les spams de demain quelques nouveaux mots non encore
évalués. Eh bien, un nouveau mot dans un spam se voit attribuer 99% de
proba "spam". Et ta capacité de détection se développe. Sans que tu
n'aies *jamais* un filtre ou une règle à écrire.
Le filtre bayésien le plus connu dans le monde mac est celui fourni en
standard dans l'application Mail d'Apple. D'autres existent, je me sers
par exemple avec Powermail de SpamSieve (qui est compatible de la
plupart des "courielleurs" et même de Mail). Son efficacité est
redoutable, il "efface" sans erreur 99% des spams pour moi.
En fait les seuls spams qu'un bayésien bien éduqué laisse passer sont
ces messages ultra-courts, composés d'un titre anodin et d'une seule
ligne de texte qui est une adresse html (c'est-à-dire un "mot" inconnu
pour le filtre: trop peu d'info pour décider). Mais dans ce cas un
filtre "classique" peut liquider facilement ce spam-là ("si l'émetteur
n'est pas dans mon carnet d'adresse et le corps du message est une
simple adresse html alors spam"). En outre, ces spams courts semblent
passés de mode en ce moment :-)
Finalement, le seul défaut des filtres bayésiens est qu'on n'en trouve
pas encore qui puissent filtrer *sur ton serveur*, sans que tu aies
besoin de télécharger tous les spams. A ma connaissance un seul service
(payant) existe sur internet qui permette un tel filtrage bayésien à
distance, il est tout récent et je ne l'ai jamais testé (en plus il
exige internet explorer!). Mais ça devrait se développer dans l'avenir.
Aujourd'hui SpamSieve permet de filtrer "presque à distance" en ne
téléchargeant qu'un K ou deux dans un premier temps (ça lui suffit
largement pour filtrer), il permet aussi de filtrer sur les seuls
en-têtes des messages lors d'une connexion IMAP.
Un filtre bayésien est donc un filtre qu'on éduque. Tu dois au départ
lui désigner quelques dizaines de "bons" mails et autant de spams. A
partir de là il va affecter des probabilités à chaque mot: par exemple
on se doute que le mot "SEX" va recevoir une proba de 99% spam, et que
si tu corresponds souvent avec un collègue nommé Georges le mot Georges
sera 99% bon. A chaque nouveau mail que tu reçois le filtre fait la
somme des % et en déduit un score, qui lui permet de décider s'il est
bon ou non.
J'ai donné ci-dessus en exemple deux mots qui ont du sens pour toi et
moi, mais il faut voir qu'un filtre bayésien va aussi travailler sur les
en-têtes et le code html des mails: par exemple, la balise html qui fait
passer du texte en rouge clignotant... là encore on se doute que sa
proba sera vite identifiée à 99% spam.
Enfin et surtout, à partir de là deux caractéristiques rendent les
filtres bayésiens incomparables:
- ils sont basés sur *tes* mails. Ta base de probabilités sera
différente de la mienne, et te sera plus particulièrement adaptée. Elle
ne dépend en outre d'aucun serveur externe de mauvaises adresses, ni
d'aucun abonnement
- ils sont capables d'auto-apprentissage. C'est là vraiment le summum de
l'élégance pour moi. Considère que les spams évoluent: chaque spammeur
s'évertue à changer l'apparence et le contenu de ses textes pour
échapper aux robots filtreurs, et le vocabulaire des spams change donc
sans cesse. Mais il change doucement. Ton filtre va être capable
d'identifier dans les spams de demain quelques nouveaux mots non encore
évalués. Eh bien, un nouveau mot dans un spam se voit attribuer 99% de
proba "spam". Et ta capacité de détection se développe. Sans que tu
n'aies *jamais* un filtre ou une règle à écrire.
Le filtre bayésien le plus connu dans le monde mac est celui fourni en
standard dans l'application Mail d'Apple. D'autres existent, je me sers
par exemple avec Powermail de SpamSieve (qui est compatible de la
plupart des "courielleurs" et même de Mail). Son efficacité est
redoutable, il "efface" sans erreur 99% des spams pour moi.
En fait les seuls spams qu'un bayésien bien éduqué laisse passer sont
ces messages ultra-courts, composés d'un titre anodin et d'une seule
ligne de texte qui est une adresse html (c'est-à-dire un "mot" inconnu
pour le filtre: trop peu d'info pour décider). Mais dans ce cas un
filtre "classique" peut liquider facilement ce spam-là ("si l'émetteur
n'est pas dans mon carnet d'adresse et le corps du message est une
simple adresse html alors spam"). En outre, ces spams courts semblent
passés de mode en ce moment :-)
Finalement, le seul défaut des filtres bayésiens est qu'on n'en trouve
pas encore qui puissent filtrer *sur ton serveur*, sans que tu aies
besoin de télécharger tous les spams. A ma connaissance un seul service
(payant) existe sur internet qui permette un tel filtrage bayésien à
distance, il est tout récent et je ne l'ai jamais testé (en plus il
exige internet explorer!). Mais ça devrait se développer dans l'avenir.
Aujourd'hui SpamSieve permet de filtrer "presque à distance" en ne
téléchargeant qu'un K ou deux dans un premier temps (ça lui suffit
largement pour filtrer), il permet aussi de filtrer sur les seuls
en-têtes des messages lors d'une connexion IMAP.
Merci beaucoup pour cette réponse qui me comble !
Barth
Frédérique & Hervé Sainct wrote:Un filtre bayésien est donc un filtre qu'on
Merci beaucoup pour cette réponse qui me comble !
Barth
Frédérique & Hervé Sainct <h.sainct@laposte.net> wrote:
Un filtre bayésien est donc un filtre qu'on
Merci beaucoup pour cette réponse qui me comble !
Barth
Frédérique & Hervé Sainct wrote:Un filtre bayésien est donc un filtre qu'on