Autor: Claudio Data: Para: hackmeeting Asunto: Re: [Hackmeeting] Re: Re: perche' il 90% del traffico mail e' spam)
magius ha scritto: > Mi togliete una curiosità?
>
> Io uso solo la webmail e continuo ad usare l'account di Gmail, sebbene
> sappia che il grande fratello raccoglie dati su di me, perchè ha un
> sistema di antispam eccezionale. Funziona al 98%, sono pochissimi i
> messaggi non spam che vanno in spam e viceversa. Purtroppo invece ho
> dovuto abbandonare l'account su Autistici perchè è irrimediabilmente
> tartassato dallo spam. Che tipo di antispam usa Google Mail, lo
> sapete? Sarebbe bello se Autistici si dotasse di un antispam più
> efficiente cosi potrei mollare il grande fratello ;-)
Se ti dicessi che gmail non usa un antispam !?
starei scherzando, ma senza andarci molto lontano.
per come funziona lo spam, quello che e' difficile e' predefinire regole
euristiche o fisse, che possano discriminarlo. perche' poi lo spam si
aggiorna, perche' poi sarcazzo.
pero' gmail ha un vantaggio che non ha nessun'altro: tantissime email.
supponi gmail non abbia un sistema di antispam. lo spammer manda 10M di
mail, differente come contenuto ma con pattern ricorrenti. gmail ne
riceve 50.000. un utente in brasile apre la sua email e la trova, dice
:"oh fucked spam!" e la clicca come "mark as spam". e' la sua prima
email di spam questo mese, poco male.
un utente in finlandia dopo 20 millisecondi apre la sua mailbox e vede
una delle 50.000, dice "oh fuckah spam!!" (senti l'accendo diverso ?) e
clicca sulla casellina magica: "mark as spam".
google vede che 2 utenti hanno detto la stessa cosa. si fida ? no, ma ti
pare che non ci sono 2 che cliccano "mark as spam" a caso ?
e dopo 20 pure, vuoi che non ci sano 20 fatti di LSD ?
e dopo 200, pero'... i pattern noti possono essere collegati, e le
restanti 49.800 automaticamente mark as spam. e niente piu' "oh, f*kinn
spem!"
collaborative filtering si chiama, e' la tecnologia che consentirebbe di
rendere l'informazione totalmente paritetica, ma per ora eccetto pochi
casi non viene usata.
ciao :P
vecna
ah, per non lasciare tutto sospeso: la potenza di un antispam e' di
potersi aggiornare, di mandarti un digest quotidiano con le cose
bloccate in modo che tu possa vedere se ci sono falsi positivi e di
poter segnare le email di spam che sono giunte a te. piu' utenti lo
fanno e piu' e' aggiornato, piu' utenti hai e piu' lo faranno.