Filtro Bayesian: Tecnologia e vantaggi
| by Julia Gulevich | November 22, 2006
Non un molto tempo fa, la maggior parte dei prodotti anti-Spam hanno usato semplicemente una lista delle parole chiavi per identificare lo Spam. Un buon insieme delle parole chiavi ha potuto interferire molto Spam. Tuttavia, la a parola-ha basato il filtro anti-Spam richiede il manuale che aggiorna e può essere imbrogliata facilmente tweaking il messaggio poco. Gli Spammers esaminano semplicemente le ultime tecniche anti-Spam e trovano i sensi escluderli. Al risultato siete lasciati con un alto numero di positives falsi.
La necessità in una nuova tecnica efficace di combattere contro lo Spam si è levata in piedi in su. L'esperienza ha indicato che questo nuovo metodo potrebbe adattarsi alle tattiche degli spammers che cambierebbero con tempo.
La filtrazione Bayesian è basata per principio che la maggior parte dei eventi sono dipendenti e che la probabilità di un evento che accade in avvenire può essere arguita dai casi di questo evento nel passato. Questo metodo è usato per identificare lo Spam. Se una certa parte di testo si presentasse principalmente nei email dello Spam ma non nella posta legittima, allora sarebbe ragionevole supporre che questo email è probabilmente Spam.
Per filtrare la posta usando la tecnologia Bayesian, dovete generare una base di dati delle parole raccolte dallo Spam e dalla posta legittima. Allora un valore di probabilità è assegnato ad ogni parola; la probabilità è basata sui calcoli che considerano ogni quanto tempo quella parola si presenta in Spam in contrasto con posta legittima.
Dopo che le basi di dati dello Spam e legittime siano generate durante il periodo di addestramento iniziale, le probabilità di parola possono essere calcolate ed il filtro Bayesian è pronto per usare. Quando una nuova posta arriva, è rotta nelle parole e le parole più significative sono scelte. Da queste parole, il filtro Bayesian calcola la probabilità di nuovo messaggio che è Spam oppure no. Se la probabilità è più grande di una soglia dello Spam, l'ad esempio 0.9, il messaggio è classificata come Spam.
Punta! La G-Serratura SpamCombat li permette assegna le chiavi calde ai funzionamenti comuni. Per esempio, potete assegnare F8 al messaggio del contrassegno come funzione dello Spam e F9 al messaggio del contrassegno come pulito. La volta prossima quando addestrate il filtro Bayesian voi può usare semplicemente due chiavi sulla vostra tastiera F8 e F9.
È importante notare che l'analisi dello Spam e della posta legittima è effettuata sulla posta che l'utente particolare (organizzazione, azienda, ecc.) riceve e quindi il filtro Bayesian è registrato a questa persona, azienda, o organizzazione particolare. Per esempio, un'istituzione finanziaria può ricevere i email molto con la parola “di ipoteca„ ed otterrebbe i positives falsi molto se per mezzo di un filtro antiquato anti-Spam. Il filtro Bayesian analizza l'intero messaggio con la parola “ipoteca„ e conclude se questo email è Spam o basare legittimo non solo su una singola parola chiave “ipoteca„. Il metodo Bayesian allo Spam del filtro è altamente efficace - i tassi di rilevazione dello Spam oltre di 99.7% possono essere realizzati con un numero molto basso di positives falsi!
Ricapitoliamo che benefici otteniamo per mezzo del filtro Bayesian per interferire lo Spam:
1) Metodo molto più intelligente perché esamina tutte le funzioni di un messaggio, in contrasto con il controllo di parola chiave che classifica una posta come Spam in base ad una parola singola.
2) Autoadattante - costantemente imparando dal nuovo Spam e dalle nuove poste inbound valide, il filtro Bayesian si evolve e si adatta alle nuove tecniche dello Spam.
3) Sensibile all'utente - impara le abitudini del email dell'azienda e capisce che, per esempio, i email con la parola “di ipoteca„ non sono sempre Spam.
4) Multilingue ed internazionale - essere adattabile esso può essere utilizzato per tutta la lingua. Il filtro Bayesian inoltre considera determinate deviazioni di lingue o l'uso vario di determinate parole nelle zone differenti, anche se la stessa lingua fosse parlata.
5) Difficile imbrogliare, in contrasto con un filtro di parola chiave - uno spammer avanzato che desidera ingannare il filtro Bayesian può il uno o il altro uso poche parole che indicano solitamente lo Spam, o più parole che indicano generalmente la posta valida (quali un nome del contatto, ecc validi). Fare il posteriore è impossibile perché lo spammer dovrebbe conoscere il profilo del email di ogni destinatario - e uno spammer può non sperare mai di riunire questo genere di informazioni da ogni destinatario progettato.
Article Source: http://www.articleset.com

You are welcome to publish or reprint this article free of charge, provided:
- you include the entire article, unchanged, including the "About The Author" box
- all hyperlinks remain active, including the bottom ArticleSet.com link (does not apply to print publications)
- you agree not to hold the authors nor ArticleSet.com liable for any loss profits, expenses, or any other damages resulting from the use or misuse of articles published on this website