Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

[The Bat] Bayes-it pète un plomb!

7 réponses
Avatar
Alaain
bonjour,

Bayes-it se met à balancer des non-pourriels dans la poubelle
(Pourriel).
Je n'ai pas ajouté une regle en particulier, mais les messages
concernés sont surtout ceux qui ont une pièce jointe.

Quelqu'un a t'il connu cela ?

7 réponses

Avatar
Jean-François Moyen
Alaain avait écrit le 13/12/2004 :
bonjour,

Bayes-it se met à balancer des non-pourriels dans la poubelle (Pourriel).
Je n'ai pas ajouté une regle en particulier, mais les messages concernés sont
surtout ceux qui ont une pièce jointe.

Quelqu'un a t'il connu cela ?


Je connais pas The Bat en particulier, mais de ce que je sais des
filtres bayesiens en général, ce sont des filtres qui "apprennent" au
fur et à mesure qu'ils traitent des messages, oui ?

Si Bayes-it a "appris" sur votre système que tout ce qui a une pièce
jointe est nocif (parce que ce sont des swen ou assimilé) [ou, plus
précisément, si Bayes-it affecte un score très fort au fait d'avoir une
pièce jointe, i.e. pour lui, le simple fait d'avoir une pièce jointe
est une très forte présomption que le mail en question soit
indésirable], il ne fait que son boulot...

Par exemple, je ne sais pas quelle règle ajouter pour améliorer la
situation....

JF

--
J.-F. Moyen
http://moyen.free.fr
Attention adresse anti-spam

Avatar
Allain
Jean-François Moyen a exposé le 13/12/2004 :


Je connais pas The Bat en particulier, mais de ce que je sais des filtres
bayesiens en général, ce sont des filtres qui "apprennent" au fur et à mesure
qu'ils traitent des messages, oui ?

Si Bayes-it a "appris" sur votre système que tout ce qui a une pièce jointe
est nocif (parce que ce sont des swen ou assimilé) [ou, plus précisément, si
Bayes-it affecte un score très fort au fait d'avoir une pièce jointe, i.e.
pour lui, le simple fait d'avoir une pièce jointe est une très forte
présomption que le mail en question soit indésirable], il ne fait que son
boulot...



Il y a de 60 ou maxi 70% des PJ qui sont vérolés, n'empêche je pensais
que Bayes-it allait plus loin dans l'analyse, comme l'identification du
serveur d'origine ou d'autres paramètres que la PJ seule. Surtout que
je m'aperçois qu'il jette aussi des mails sans PJ.

Par contre je suis abonné à une liste de discutions et cette même liste
génère beaucoup de pourriel.
Le destinataire (To:) est le nom du groupe (groupe Yahoo), du coup je
crains fort que Bayes-it vire le mail dès que le destinataire
correspond à ce qu'il a appris. C'est leger comme analyse :(

Avatar
Kenny
Jean-François Moyen a exposé le 13/12/2004 :



Il y a de 60 ou maxi 70% des PJ qui sont vérolés, n'empêche je pensais
que Bayes-it allait plus loin dans l'analyse, comme l'identification du
serveur d'origine ou d'autres paramètres que la PJ seule. Surtout que je
m'aperçois qu'il jette aussi des mails sans PJ.

Par contre je suis abonné à une liste de discutions et cette même liste
génère beaucoup de pourriel.
Le destinataire (To:) est le nom du groupe (groupe Yahoo), du coup je
crains fort que Bayes-it vire le mail dès que le destinataire correspond
à ce qu'il a appris. C'est leger comme analyse :(


C'est le pb des analyses statistiques, il faut imputer un coeficiant

d'importance a chaque critère, il semblerai que The Bat accorde une
importance particulière aux PJ, si ça ne te conviens pas essaie d'autre
logiciels antispam (pour mon compte thunderbird fait 0 boulettes depuis
plus d'un an) car si ils sont souvent fondés sur Bayes les données a
l'entrée sont differentes et la tolerence reglée differament...

Faut trouver le logiciel qui te ressemble le plus...

Avatar
Jean-François Moyen
Allain avait prétendu :
Jean-François Moyen a exposé le 13/12/2004 :


Je connais pas The Bat en particulier, mais de ce que je sais des filtres
bayesiens en général, ce sont des filtres qui "apprennent" au fur et à
mesure qu'ils traitent des messages, oui ?

Si Bayes-it a "appris" sur votre système que tout ce qui a une pièce jointe
est nocif (parce que ce sont des swen ou assimilé) [ou, plus précisément,
si Bayes-it affecte un score très fort au fait d'avoir une pièce jointe,
i.e. pour lui, le simple fait d'avoir une pièce jointe est une très forte
présomption que le mail en question soit indésirable], il ne fait que son
boulot...



Il y a de 60 ou maxi 70% des PJ qui sont vérolés, n'empêche je pensais que
Bayes-it allait plus loin dans l'analyse, comme l'identification du serveur
d'origine ou d'autres paramètres que la PJ seule.


Ce n'est pas vraiment la PJ seule; c'est une combinaison de plein de
critères. Le principe, c'est de donner un score (positif ou négatif) à
chaque, disons, objet lu dans le mail. Par exemple, présence ou pas
d'une PJ, IP d'origine, et bien sût chaque "mot' présent dans le texte.
Ensuite, on combine les scores des objets les plus signifiants
(positifs ou négatifs) et on regarde le résultat.

C'est très instructif de regarder les logs de ton filtre : tu dois
pouvoir voir à quel item il donne des scores très négatifs, ou très
positifs. Chez moi, par exemple, les choses scorées très positivement
(forte proba d'être un mail indésirable), c'est le fait d'être tout en
majuscule, le html dans le mail, les liens dans le mail ( A HREF =
....). Les "gros mots" (sex, viagra...) sont bien sûr lourdement
chargés, mais pas tant qu'on pourrait le croire, parce qu'il m'arrive
de blaguer avec des copains sur le fait que "j'ai encore recu 150
propositions de viagra", etc., donc c'est un mot qui est parfois
légitime (, par contre, n'est *jamais* légitime et est très
fortement scoré...).

Pour peu que tes mails "faux positifs" remplissent donc trop de
critères d'indésirabilité (par exemple, ils ont une PJ, ils sont en
majuscule, ils ne contiennent qu'une seule phrase du genre "voila le
document demandé", ils viennent d'une adresse en yahoo.com... ), et
hop, voila. A priori, le seul fait d'avoir une PJ ne suffit pas.


Surtout que je m'aperçois
qu'il jette aussi des mails sans PJ.


Je me suis fait dernièrement jeter par mon antispam (K9) un mail
parfaitement légitime d'un collègue. Simplement, il m'avait répondu en
majuscules entre les lignes de mon mail (ce que c'est de pas quoter
proprement... ;-) ) et du coup il était question de "COLLABORATION" et
de "MILLIONS" (of years en l'occurence....) et de "SURPRISE" (parce
qu'un résultat n'était pas ce qu'on attendait). Et de "APPLICATIONS" (à
un poste universitaire). Et tout ces mots, surtout en capitale, ce sont
typiquement ce qu'on trouve dans un "scam nigérien"...

Par contre je suis abonné à une liste de discutions et cette même liste
génère beaucoup de pourriel.
Le destinataire (To:) est le nom du groupe (groupe Yahoo), du coup je crains
fort que Bayes-it vire le mail dès que le destinataire correspond à ce qu'il
a appris. C'est leger comme analyse :(


En fait c'est pas tout à fait ca; il se contentera de noter dans ses
tablettes qu'un mail en provenance de cette liste a une proba XXX (avec
X assez fort, sans doute) d'être du spam. Si tu recois un spam pour 3
mails légitimes, il dira "un mail en provenance de yahoogroups a 25 %
de chance d'être du spam", (mais donc 75 % d'être légitime !); et il
combinera ca avec les autres infos ("une PJ = 70 % d'être du spam";
"viagra dans le sujet = 99.9 %"; "here is your document" = 70 %). Et te
dira donc un truc du genre : "mail depuis yahoogroups, avec une PJ et
here is your document dans le texte = 93.2 % [sauf erreur de calcul] de
chances d'être du spam".
Ensuite, en réalité celui qui lui a dit "mets à la corbeille tout les
messages qui ont une proba de spam > 50 %", c'est toi ! Même si tu n'as
pas fait exprès...

Je pense qu'il faut que tu regardes un peu les détails de comment ton
filtre se comporte, pour éventuellement modifier l'item qui semble le
plus délirant. Mais je suis surpris de ton expérience, parce que chez
moi, mon bayesien me donne très, très peu de faux positifs. Il faut
dire que je prends grand soin de l'éduquer, et de lui dire quand il se
trompe de reclassifier le mail fautif comme "bon" ou "mauvais" : le
fais-tu ?

JF

--
J.-F. Moyen
http://moyen.free.fr
Attention adresse anti-spam


Avatar
Ludovic LE MOAL
Alaain nous a schtroumpfé :

bonjour,


Bonjour,

Bayes-it se met à balancer des non-pourriels dans la poubelle
(Pourriel).
Je n'ai pas ajouté une regle en particulier, mais les messages
concernés sont surtout ceux qui ont une pièce jointe.

Quelqu'un a t'il connu cela ?


Il faut « apprendre » au logiciel quels sont les pourriels et quels sont
les non-pourriels. Pour cela, on fait « Specials > Marquer comme Pourriel »
ou « Specials > Marquer comme Non-pourriel ».

ceci dit, bon, BayesIt est en version 0.7.5 c'est-à-dire une version bêta
et je recommande plutôt BayesFilter http://www.lkcc.org:8500/index.php qui
fonctionne très bien chez moi.
--
Ludovic LE MOAL

Avatar
Alaain
Ludovic LE MOAL avait soumis l'idée :

Il faut « apprendre » au logiciel quels sont les pourriels et quels sont
les non-pourriels. Pour cela, on fait « Specials > Marquer comme Pourriel »
ou « Specials > Marquer comme Non-pourriel ».

ceci dit, bon, BayesIt est en version 0.7.5 c'est-à-dire une version bêta
et je recommande plutôt BayesFilter http://www.lkcc.org:8500/index.php qui
fonctionne très bien chez moi.


Merci, j'ai enlevé Bayes-it et je vais essayer BayesFilter.

Pour répondre aux autres contributeurs, je bien l'impression que
Bayes-it a été victime d'un grain de sable, au final pratiquement tous
les émails finissaient dans la poubelle, quel que soit le compte. Sauf
erreur, en activant via un raccourci clavier une option destructrice,
j'ai pas l'impression d'avoir mal nourri cet anti-spam.

BayesFilter herite d'un dossier pourriel bien garni :)

Bye.

Avatar
Ludovic LE MOAL
Alaain nous a schtroumpfé :

Pour répondre aux autres contributeurs, je bien l'impression que
Bayes-it a été victime d'un grain de sable, au final pratiquement tous
les émails finissaient dans la poubelle, quel que soit le compte.


En complément de ma réponse, j'avais remarqué que BayesIt avait du mal à «
revenir en arrière » : j'avais marqué par erreur certains messages d'une
liste comme pourriels et après, j'avais beau les marquer comme non-
pourriels, ils allaient presque systématiquement dans la boîte à pourriels.

Enfin bon, BayesIt, moi, j'ai laissé tombé.
--
Ludovic LE MOAL