Denne sa odošle 28 miliárd SPAM e-mailov. To je veľká časť všetkej e-mailovej prevádzky a takmer žiadne e-mailové konto nie je ušetrené nechcenej nevyžiadanej pošty. Zatiaľ jediným spôsobom, ako pred nimi ochrániť svoju poštovú schránku, je mať dobrý a funkčný spamový filter. SpamAssassin je tiež takýmto filtrom spamu, ale to, čo z neho robí veľmi výnimočný softvér, je jeho doslova ručne vybraný algoritmus a jeho vysoká flexibilita.
Stručný prehľad
Hoci na softvéri dnes pracuje celý tím, základný kameň SpamAssassinu položil Justin Mason, ktorý bol predtým zodpovedný za podobný program s názvom filter.plx. V roku 2001 boli časti programu upravené, prepísané a premenované na nový projekt "Spamassassin". Od roku 2004 patrí do nadácie Apache Software Foundation a je open source. Okrem otvoreného zdroja existuje aj licencia, ktorá z programu robí slobodný softvér, ktorého súkromné aj komerčné použitie, napríklad ako modul iného plateného softvéru, je úplne bezplatné.
Hlavnou výhodou tohto softvéru je jeho vysoká flexibilita, pokiaľ ide o úroveň použitia, pretože SpamAssassin možno používať buď ako vlastnú aplikáciu, ako podprogram (modul) iného softvéru, ako klientský program poštového démona alebo ako volanie MDA (Mail Delivery Agent), napríklad Procmail. Dôležité: Aj keď sú v distribučnom reťazci zahrnuté rôzne inštancie softvéru, príznak neznamená, že sa softvér nebude používať. E-mail analyzované dvakrát, čo zabraňuje redundancii procesov a znižuje využitie zdrojov.
Takto funguje triedenie
SpamAssassin funguje podľa bodového systému. Každý prichádzajúci e-mail sa analyzuje podľa určitých kritérií a prideľujú sa mu body, ktoré určujú, s akou pravdepodobnosťou ide o Spam úkony. Prahová hodnota nastaviteľná používateľom definuje bod, od ktorého sa e-mail považuje za spam a triedi sa. Na dosiahnutie čo najpresnejšieho skóre má program k dispozícii celý rad rôznych metód, ako napr:
- Biela a čierna listina založená na systéme DNS
- Kontrolné filtre od dodávateľov s otvoreným zdrojovým kódom a komerčných dodávateľov, ako je DCC alebo Vipul's Razor
- Výrazový filter založený na Kľúčové slová alebo kľúčové frázy
- Systém Hashcash (Proof-of-Work)
- DIM a SPF
- Zoznamy adries URL ako výstupy sledovacích zariadení, napríklad uribl.com
Bayesov filter
Okrem viac-menej statických systémov filtrovania má SpamAssassin bayesovský algoritmus filtrovania, ktorý sa dokáže "naučiť" určité heuristiky, t. j. opakujúce sa charakteristické prvky, z už odoslaných spamových e-mailov a prispôsobiť sa tak správaniu používateľa. Tento systém je založený na Byssianovom pojme pravdepodobnosti, ale často bol kritizovaný, pretože nenaučený systém filtrovania často vyvoláva falošné pozitívne výsledky.
Aby ste tomu predišli, odporúča sa najprv podrobnejšie skontrolovať e-maily klasifikované ako spam. Bayesov filter obsahuje nástroj, ktorý možno vyvolať prostredníctvom príkazového riadka sa-learn, pomocou ktorého možno vyhľadávať heuristické prvky buď v jednotlivých e-mailoch, alebo v celých poštových schránkach. Ak sa tento proces vykoná niekoľkokrát, výskyt falošne pozitívnych výsledkov výrazne klesne.
Súčasný vývoj
V rámci najnovších aktualizácií na verzie 3.3 a 3.4 dostal SpamAssassin novú významnú funkciu, ktorá by mala mať vplyv na využitie zdrojov. Hoci už predtým došlo k určitým optimalizáciám výkonu, nové je, že program sa teraz správa ako deterministický konečný automat. Hardvér sa v podstate dokáže lepšie prispôsobiť DEA, pretože možné stavy prebiehajú vždy deterministicky, t. j. sú vopred určené. Vhodne naprogramovaný systém - ako je napríklad dnešný serverový hardvér - tak môže rezervovať a uvoľniť zdroje v časovo kritickom režime.
Podpora programu
Ako už bolo spomenuté, jedinečnou výhodou je vysoká flexibilita programového kódu, ale SpamAssassin má aj úspešné API, ktoré umožňuje výmenu údajov s mnohými inými programami. V prípade projektov s otvoreným zdrojovým kódom ide o často používané e-mailové klienty Mozilla Thunderbird, KMail, ako aj Novell Evolution alebo exotické produkty, ako sú Citadel alebo Claws Mail. V komerčných produktoch je SpamAssassin už integrovaný do kódu programu. To je napríklad prípad servera Icewarp, McAfee SpamKiller, servera Mac OS X alebo Sophos PureMessage.