Dans le cadre de ma th=E8se, je m'interesse au probl=E8me du filtrage
anti-spam au niveau de la boite aux lettres utilisateur. Plus
pr=E9cis=E9ment, je recherche des informations sur :
- les diff=E9rentes formes de strat=E9gie de r=E9colte d'adresses
- les strat=E9gies de contournement de filtres employ=E9es par les
spammeurs
- tout point d'entr=E9e vers les m=E9thodes et =E9tudes d=E9j=E0 r=E9alis=
=E9es
sur le probl=E8me, aussi bien d'un point de vue technique, sociologique,
l=E9gal et linguistique (tout =E7a !)
Cette adresse a de surcroit =E9t=E9 cr=E9=E9e dans le but de r=E9aliser un
test "grandeur nature" sur la r=E9ception de spam selon le comportement
de l'utilisateur. Le but =E9tant d'accumuler assez de spams pour
r=E9aliser un corpus "r=E9aliste", et complet. On trouve des corpus
standards sur internet, mais aucun ne contient ni les en-t=EAtes, ni
l'ordre d'arriv=E9e des messages, de surcroit, la plupart sont
monolingues, d'o=F9 les raisons d'=EAtre de cette boite. Tout conseil sur
la mani=E8re de l'alimenter serait donc grandement appr=E9ci=E9.
- les différentes formes de stratégie de récolte d'adresses
Les spammeurs sont cons, et feignants. Les stratégies employées sont assez simples: - scan de pages html crawlées pour récupérer tout ce qui peut matcher une expression rationnelle s'approchant d'une adresse email - récupération de listes (illégalement) constituées, par exemple sur CDrom ou par des entreprises peu scrupuleuses - ou achats de logiciels "clé en main" pour spammer avec adresses incluses dedans - scan des newsgroups etc.
Certaines sociétés ont pignon sur rue en france, sans vouloir les dénoncer (il suffit de lire fuad durant quelques mois pour connaitre les noms) - cette activité, bien qu'illégale, demeure peu risquée (la CNIL est une bouffonerie qui n'impressionne plus personne aujourd'hui malheuresement - quand on voit certains partis politiques pratiquer le spam à grande échelle..)
- les stratégies de contournement de filtres employées par les spammeurs
Je me suis laissé dire que certains spammeurs un peu moins cons faisaient transiter leur spam dans des filtres existants (spamassassin, par exemple) en les modifiant jusqu'à ce qu'ils arrivent à ressortir avec un score minimum.
- les différentes formes de stratégie de récolte d'adresses
Les spammeurs sont cons, et feignants. Les stratégies employées sont
assez simples:
- scan de pages html crawlées pour récupérer tout ce qui peut matcher
une expression rationnelle s'approchant d'une adresse email
- récupération de listes (illégalement) constituées, par exemple sur
CDrom ou par des entreprises peu scrupuleuses
- ou achats de logiciels "clé en main" pour spammer avec adresses
incluses dedans
- scan des newsgroups
etc.
Certaines sociétés ont pignon sur rue en france, sans vouloir les
dénoncer (il suffit de lire fuad durant quelques mois pour connaitre les
noms) - cette activité, bien qu'illégale, demeure peu risquée (la CNIL
est une bouffonerie qui n'impressionne plus personne aujourd'hui
malheuresement - quand on voit certains partis politiques pratiquer le
spam à grande échelle..)
- les stratégies de contournement de filtres employées par les
spammeurs
Je me suis laissé dire que certains spammeurs un peu moins cons
faisaient transiter leur spam dans des filtres existants (spamassassin,
par exemple) en les modifiant jusqu'à ce qu'ils arrivent à ressortir
avec un score minimum.
- les différentes formes de stratégie de récolte d'adresses
Les spammeurs sont cons, et feignants. Les stratégies employées sont assez simples: - scan de pages html crawlées pour récupérer tout ce qui peut matcher une expression rationnelle s'approchant d'une adresse email - récupération de listes (illégalement) constituées, par exemple sur CDrom ou par des entreprises peu scrupuleuses - ou achats de logiciels "clé en main" pour spammer avec adresses incluses dedans - scan des newsgroups etc.
Certaines sociétés ont pignon sur rue en france, sans vouloir les dénoncer (il suffit de lire fuad durant quelques mois pour connaitre les noms) - cette activité, bien qu'illégale, demeure peu risquée (la CNIL est une bouffonerie qui n'impressionne plus personne aujourd'hui malheuresement - quand on voit certains partis politiques pratiquer le spam à grande échelle..)
- les stratégies de contournement de filtres employées par les spammeurs
Je me suis laissé dire que certains spammeurs un peu moins cons faisaient transiter leur spam dans des filtres existants (spamassassin, par exemple) en les modifiant jusqu'à ce qu'ils arrivent à ressortir avec un score minimum.
Alain Chappuis
Bonjour,
Dans le cadre de ma thèse, je m'interesse au problème du filtrage anti-spam au niveau de la boite aux lettres utilisateur. Plus précisément, je recherche des informations sur :
Voici un lien qui l'explique, et qui donne certaines parades:
Alain. -- Alain Chappuis (Remove: pouriel to answer me in my address!) (Enlevez: pouriel de mon adresse pour me répondre!)
Bonjour,
Dans le cadre de ma thèse, je m'interesse au problème du filtrage
anti-spam au niveau de la boite aux lettres utilisateur. Plus
précisément, je recherche des informations sur :
Voici un lien qui l'explique, et qui donne certaines parades:
Dans le cadre de ma thèse, je m'interesse au problème du filtrage anti-spam au niveau de la boite aux lettres utilisateur. Plus précisément, je recherche des informations sur :
Voici un lien qui l'explique, et qui donne certaines parades:
Alain. -- Alain Chappuis (Remove: pouriel to answer me in my address!) (Enlevez: pouriel de mon adresse pour me répondre!)
Rakotomandimby (R12y)
dcolin.prism:
Cette adresse a de surcroit été créée dans le but de réaliser un test "grandeur nature" sur la réception de spam selon le comportement de l'utilisateur.
En lisant mon dernier post de ce groupe (avant celui-ci), tu as approximativement une date ou j'ai mis une adresse publique. C'est en ce moment que je peux dire que je reçois "beaucoup" de spam. Je n'en suis pas encore aux thèses, mais je ne sais pas si tu pourras attendre aussi longtemps ;-)
dcolin.prism:
Cette adresse a de surcroit été créée dans le but de réaliser un
test "grandeur nature" sur la réception de spam selon le comportement
de l'utilisateur.
En lisant mon dernier post de ce groupe (avant celui-ci), tu as
approximativement une date ou j'ai mis une adresse publique. C'est en ce
moment que je peux dire que je reçois "beaucoup" de spam. Je n'en suis
pas encore aux thèses, mais je ne sais pas si tu pourras attendre aussi
longtemps ;-)
Cette adresse a de surcroit été créée dans le but de réaliser un test "grandeur nature" sur la réception de spam selon le comportement de l'utilisateur.
En lisant mon dernier post de ce groupe (avant celui-ci), tu as approximativement une date ou j'ai mis une adresse publique. C'est en ce moment que je peux dire que je reçois "beaucoup" de spam. Je n'en suis pas encore aux thèses, mais je ne sais pas si tu pourras attendre aussi longtemps ;-)
Rakotomandimby (R12y)
dcolin.prism:
Cette adresse a de surcroit été créée dans le but de réaliser un test "grandeur nature" sur la réception de spam selon le comportement de l'utilisateur.
Je pense à un truc: est-ce que tu es certain que ton prestataire de service (gmail?) ne filtre rien du spam qui vient à toi? Je pense que "si". Si tu veux une adresse email non filtrée, contacte-moi, je peux t'en fournir. Ca sera une adresse ou le spam arrive et est totalement "encaissé", sans aucun passage par aucun outil d'analyse ni de filtre...
dcolin.prism:
Cette adresse a de surcroit été créée dans le but de réaliser un
test "grandeur nature" sur la réception de spam selon le comportement
de l'utilisateur.
Je pense à un truc: est-ce que tu es certain que ton prestataire de
service (gmail?) ne filtre rien du spam qui vient à toi? Je pense que "si".
Si tu veux une adresse email non filtrée, contacte-moi, je peux t'en
fournir. Ca sera une adresse ou le spam arrive et est totalement
"encaissé", sans aucun passage par aucun outil d'analyse ni de filtre...
Cette adresse a de surcroit été créée dans le but de réaliser un test "grandeur nature" sur la réception de spam selon le comportement de l'utilisateur.
Je pense à un truc: est-ce que tu es certain que ton prestataire de service (gmail?) ne filtre rien du spam qui vient à toi? Je pense que "si". Si tu veux une adresse email non filtrée, contacte-moi, je peux t'en fournir. Ca sera une adresse ou le spam arrive et est totalement "encaissé", sans aucun passage par aucun outil d'analyse ni de filtre...
Eric PETIT
Dans le message :ek2o6n$uch$, Xavier Roche a écrit: ....
Certaines sociétés ont pignon sur rue en france, sans vouloir les dénoncer (il suffit de lire fuad durant quelques mois pour connaitre les noms) - cette activité, bien qu'illégale, demeure peu risquée (la CNIL est une bouffonerie qui n'impressionne plus personne aujourd'hui malheuresement - quand on voit certains partis politiques pratiquer le spam à grande échelle..)
Si je suis d'accord avec la première partie et avec l'idée de la fin je dois quand même corriger en indiquant que la "fameux" mail de l'UMP ne rentre pas dans la catégorie pourriel selon la législation. Ces gens là, pas qu'idiots donc, ont bien pris garde de spécifier qu'un pourriel était un message à caractère *commercial*, ce que n'est pas le dit mail. Alors que le commun des internautes s'arrête à une définition de type "courrier non sollicité" ... subtile différence ;-))
Cela n'empèche pas bien sûr de protester sur la façon de faire et vu le tolé (?) suscité je doute qu'un responsable de comm fasse à nouveau une erreur aussi grossière, mouarf ;-)
Quand aux sociétés de spam, je me contente de déclarer indésirable tout message transitant par leur serveur avec parfois un message explicite genre "nid a spam" ^_^ -- Eric Reply-to valide, laissez tel quel ! Texte brut vivement conseillé !!
Dans le message :ek2o6n$uch$2@news.httrack.net,
Xavier Roche a écrit:
....
Certaines sociétés ont pignon sur rue en france, sans vouloir les
dénoncer (il suffit de lire fuad durant quelques mois pour connaitre
les noms) - cette activité, bien qu'illégale, demeure peu risquée (la
CNIL est une bouffonerie qui n'impressionne plus personne aujourd'hui
malheuresement - quand on voit certains partis politiques pratiquer le
spam à grande échelle..)
Si je suis d'accord avec la première partie et avec l'idée de la fin je dois
quand même corriger en indiquant que la "fameux" mail de l'UMP ne rentre pas
dans la catégorie pourriel selon la législation. Ces gens là, pas qu'idiots
donc, ont bien pris garde de spécifier qu'un pourriel était un message à
caractère *commercial*, ce que n'est pas le dit mail. Alors que le commun
des internautes s'arrête à une définition de type "courrier non sollicité"
... subtile différence ;-))
Cela n'empèche pas bien sûr de protester sur la façon de faire et vu le tolé
(?) suscité je doute qu'un responsable de comm fasse à nouveau une erreur
aussi grossière, mouarf ;-)
Quand aux sociétés de spam, je me contente de déclarer indésirable tout
message transitant par leur serveur avec parfois un message explicite genre
"nid a spam" ^_^
--
Eric
Reply-to valide, laissez tel quel !
Texte brut vivement conseillé !!
Dans le message :ek2o6n$uch$, Xavier Roche a écrit: ....
Certaines sociétés ont pignon sur rue en france, sans vouloir les dénoncer (il suffit de lire fuad durant quelques mois pour connaitre les noms) - cette activité, bien qu'illégale, demeure peu risquée (la CNIL est une bouffonerie qui n'impressionne plus personne aujourd'hui malheuresement - quand on voit certains partis politiques pratiquer le spam à grande échelle..)
Si je suis d'accord avec la première partie et avec l'idée de la fin je dois quand même corriger en indiquant que la "fameux" mail de l'UMP ne rentre pas dans la catégorie pourriel selon la législation. Ces gens là, pas qu'idiots donc, ont bien pris garde de spécifier qu'un pourriel était un message à caractère *commercial*, ce que n'est pas le dit mail. Alors que le commun des internautes s'arrête à une définition de type "courrier non sollicité" ... subtile différence ;-))
Cela n'empèche pas bien sûr de protester sur la façon de faire et vu le tolé (?) suscité je doute qu'un responsable de comm fasse à nouveau une erreur aussi grossière, mouarf ;-)
Quand aux sociétés de spam, je me contente de déclarer indésirable tout message transitant par leur serveur avec parfois un message explicite genre "nid a spam" ^_^ -- Eric Reply-to valide, laissez tel quel ! Texte brut vivement conseillé !!
Eric PETIT
Dans le message :, Rakotomandimby (R12y) a écrit: ....
Je pense à un truc: est-ce que tu es certain que ton prestataire de service (gmail?) ne filtre rien du spam qui vient à toi?
C'est filtré mais simplement orienté dans un dossier donc tout à fait récupérable.
Le truc est plutôt performant: quasi pas de faux-positif (pas certain d'en avoir vu, d'où le quasi) et très peu de faux négatif (genre un par semaine au plus). Par contre même sans diffuser explicitement une adresse on reçoit du spam dessus.... -- Eric Reply-to valide, laissez tel quel ! Texte brut vivement conseillé !!
Dans le message
:pan.2006.11.23.08.08.28.70722@infogerance-serveur.asso-polyvalente.fr,
Rakotomandimby (R12y) a écrit:
....
Je pense à un truc: est-ce que tu es certain que ton prestataire de
service (gmail?) ne filtre rien du spam qui vient à toi?
C'est filtré mais simplement orienté dans un dossier donc tout à fait
récupérable.
Le truc est plutôt performant: quasi pas de faux-positif (pas certain d'en
avoir vu, d'où le quasi) et très peu de faux négatif (genre un par semaine
au plus).
Par contre même sans diffuser explicitement une adresse on reçoit du spam
dessus....
--
Eric
Reply-to valide, laissez tel quel !
Texte brut vivement conseillé !!
Dans le message :, Rakotomandimby (R12y) a écrit: ....
Je pense à un truc: est-ce que tu es certain que ton prestataire de service (gmail?) ne filtre rien du spam qui vient à toi?
C'est filtré mais simplement orienté dans un dossier donc tout à fait récupérable.
Le truc est plutôt performant: quasi pas de faux-positif (pas certain d'en avoir vu, d'où le quasi) et très peu de faux négatif (genre un par semaine au plus). Par contre même sans diffuser explicitement une adresse on reçoit du spam dessus.... -- Eric Reply-to valide, laissez tel quel ! Texte brut vivement conseillé !!
ts
"E" == Eric PETIT writes:
E> Quand aux sociétés de spam, je me contente de déclarer indésirable tout E> message transitant par leur serveur avec parfois un message explicite genre E> "nid a spam" ^_^
C'est un tort : il faut les forcer à re-essayer et toujours en étant poli :-)
Ce qu'ils veulent c'est envoyer le plus de messages et le plus rapidement possible. En leur donnant un code 5xx vous leur facilitez le travail, avec un code 4xx ce sont ceux qui abandonnent :-)
Forcez les à gérer des queues, ils auront fatalement besoin, un jour ou l'autre, de changer leur serveurs pour de plus puissants.
Nov 23 10:39:39 moulon sm-mta[5174]: kAN9bdAP005174: ruleset=check_rcpt, arg1=, relay=smtp1.lettra.fr [213.56.203.226], rejectE1 4.7.1 Please try again later
"E" == Eric PETIT <bidon-news@petit-ecran.net.invalid> writes:
E> Quand aux sociétés de spam, je me contente de déclarer indésirable tout
E> message transitant par leur serveur avec parfois un message explicite genre
E> "nid a spam" ^_^
C'est un tort : il faut les forcer à re-essayer et toujours en étant
poli :-)
Ce qu'ils veulent c'est envoyer le plus de messages et le plus rapidement
possible. En leur donnant un code 5xx vous leur facilitez le travail, avec
un code 4xx ce sont ceux qui abandonnent :-)
Forcez les à gérer des queues, ils auront fatalement besoin, un
jour ou l'autre, de changer leur serveurs pour de plus puissants.
Nov 23 10:39:39 moulon sm-mta[5174]: kAN9bdAP005174: ruleset=check_rcpt,
arg1=<xxxxxxxxxxxx@moulon.inra.fr>, relay=smtp1.lettra.fr [213.56.203.226],
rejectE1 4.7.1 Please try again later
E> Quand aux sociétés de spam, je me contente de déclarer indésirable tout E> message transitant par leur serveur avec parfois un message explicite genre E> "nid a spam" ^_^
C'est un tort : il faut les forcer à re-essayer et toujours en étant poli :-)
Ce qu'ils veulent c'est envoyer le plus de messages et le plus rapidement possible. En leur donnant un code 5xx vous leur facilitez le travail, avec un code 4xx ce sont ceux qui abandonnent :-)
Forcez les à gérer des queues, ils auront fatalement besoin, un jour ou l'autre, de changer leur serveurs pour de plus puissants.
Nov 23 10:39:39 moulon sm-mta[5174]: kAN9bdAP005174: ruleset=check_rcpt, arg1=, relay=smtp1.lettra.fr [213.56.203.226], rejectE1 4.7.1 Please try again later
Alors que le commun des internautes s'arrête à une définition de type "courrier non sollicité" ... subtile différence ;-))
Les messages d'un Ex petit-ami qui supplie la remise en couple, dans ce cas, est considérée comme SPAM. J'ai du mal... :-)
Jacques Belin
Le jeudi 23 novembre 2006 10:37:38, "Eric PETIT" a écrit:
Si je suis d'accord avec la première partie et avec l'idée de la fin je dois quand même corriger en indiquant que la "fameux" mail de l'UMP ne rentre pas dans la catégorie pourriel selon la législation.
Ah bon ? Malgré le fait qui a été envoyé en utilisant (pour certaines des vagues d'envoi en tout cas) en utilisant les fichiers et les serveurs de spammeurs reconnus (email-vision, satellite d'Impact-Net, notamment..) ?
La preuve qu'il s'agit des mêmes fichiers, c'est que quelque jours après que j'ai reçu le spam UMP, j'ai reçu un spam "vistaprint" qui contenait le même numéro identifant [de mon adresse e-mail] dans l'entête X-EMV-MemberId...
Mais enfin, c'est vrai qu'en détournant la question vers un débat spam vs "communication politique", ça a permis à un certain sénateur apparenté UMP d'éviter de forcer l'institution qu'il présidait à creuser plus la question en ce qui concerne les multiples violations des lois sur les traitement de données (utilisation d'adresses collectée illégalement et/ou non validées en fonction de la LCEN, utilisation stockage des opinions politiques - données sensibles au regard de la loi de 78 - par un prestataire exterieur, etc...) qui auraient pu mettre dans une situation inconfortable le donneur d'ordre, dont les activités de ministre de l'intérieur mettaient en position idéale pour connaitre les méfaits précédents de son fournisseur d'adresses et de services...
A+ Jacques. -- Le dernier Homme connecté sur le Net regardait d'anciens sites Webs. "Vous avez du courrier" apparut sur l'écran... --------------------------- adapté d'une courte histoire de Fredric Brown
Le jeudi 23 novembre 2006 10:37:38,
"Eric PETIT" <bidon-news@petit-ecran.net.invalid> a écrit:
Si je suis d'accord avec la première partie et avec l'idée de la fin je dois
quand même corriger en indiquant que la "fameux" mail de l'UMP ne rentre pas
dans la catégorie pourriel selon la législation.
Ah bon ? Malgré le fait qui a été envoyé en utilisant (pour certaines
des vagues d'envoi en tout cas) en utilisant les fichiers et les
serveurs de spammeurs reconnus (email-vision, satellite d'Impact-Net,
notamment..) ?
La preuve qu'il s'agit des mêmes fichiers, c'est que quelque jours après
que j'ai reçu le spam UMP, j'ai reçu un spam "vistaprint" qui contenait
le même numéro identifant [de mon adresse e-mail] dans l'entête
X-EMV-MemberId...
Mais enfin, c'est vrai qu'en détournant la question vers un débat spam
vs "communication politique", ça a permis à un certain sénateur
apparenté UMP d'éviter de forcer l'institution qu'il présidait à creuser
plus la question en ce qui concerne les multiples violations des lois
sur les traitement de données (utilisation d'adresses collectée
illégalement et/ou non validées en fonction de la LCEN, utilisation
stockage des opinions politiques - données sensibles au regard de la loi
de 78 - par un prestataire exterieur, etc...) qui auraient pu mettre
dans une situation inconfortable le donneur d'ordre, dont les activités
de ministre de l'intérieur mettaient en position idéale pour connaitre
les méfaits précédents de son fournisseur d'adresses et de services...
A+ Jacques.
--
Le dernier Homme connecté sur le Net regardait d'anciens sites Webs.
"Vous avez du courrier" apparut sur l'écran...
--------------------------- adapté d'une courte histoire de Fredric Brown
Le jeudi 23 novembre 2006 10:37:38, "Eric PETIT" a écrit:
Si je suis d'accord avec la première partie et avec l'idée de la fin je dois quand même corriger en indiquant que la "fameux" mail de l'UMP ne rentre pas dans la catégorie pourriel selon la législation.
Ah bon ? Malgré le fait qui a été envoyé en utilisant (pour certaines des vagues d'envoi en tout cas) en utilisant les fichiers et les serveurs de spammeurs reconnus (email-vision, satellite d'Impact-Net, notamment..) ?
La preuve qu'il s'agit des mêmes fichiers, c'est que quelque jours après que j'ai reçu le spam UMP, j'ai reçu un spam "vistaprint" qui contenait le même numéro identifant [de mon adresse e-mail] dans l'entête X-EMV-MemberId...
Mais enfin, c'est vrai qu'en détournant la question vers un débat spam vs "communication politique", ça a permis à un certain sénateur apparenté UMP d'éviter de forcer l'institution qu'il présidait à creuser plus la question en ce qui concerne les multiples violations des lois sur les traitement de données (utilisation d'adresses collectée illégalement et/ou non validées en fonction de la LCEN, utilisation stockage des opinions politiques - données sensibles au regard de la loi de 78 - par un prestataire exterieur, etc...) qui auraient pu mettre dans une situation inconfortable le donneur d'ordre, dont les activités de ministre de l'intérieur mettaient en position idéale pour connaitre les méfaits précédents de son fournisseur d'adresses et de services...
A+ Jacques. -- Le dernier Homme connecté sur le Net regardait d'anciens sites Webs. "Vous avez du courrier" apparut sur l'écran... --------------------------- adapté d'une courte histoire de Fredric Brown