Angleški samostalnik "spam" v filtru za nezaželeno pošto lahko prevedemo z nemško besedo Abfall. Izvorno pomeni meso v pločevinki. Na področju IT se nanaša na neželena elektronska sporočila, ki so dostavljena, ne da bi bila v skladu z željami prejemnika. Večinoma vsebujejo oglaševanje. Po podatkih raziskave hamburškega statističnega portala Statista je bilo leta 2014 po vsem svetu 28 milijard neželene elektronske pošte. Gre za globalno težavo, ki se rešuje s pomočjo filtra za nezaželeno pošto; natančneje, neželena sporočila je treba razvrstiti z računalniškim programom. Ustvarjalec takšne nezaželene pošte se imenuje pošiljatelj nezaželene pošte, postopek pa se imenuje pošiljanje nezaželene pošte ali spamming.
Področja uporabe filtra za neželeno pošto
Klasično je bila uporaba filtra za nezaželeno pošto omejena na razvrščanje nezaželenih e-poštnih sporočil. V ta namen so bili s pomočjo algoritmov izdelani moduli za programe elektronske pošte in poštne strežnike. Ker pa se je pomen oglaševanja na internetu v preteklosti vse bolj povečeval, novejši programi filtrirajo tudi strani. Filtri za neželeno pošto se uporabljajo tudi za spletne brskalnike, wikije in bloge.
Delovne metode filtra za neželeno pošto
Filtri neželene pošte izberejo informacije, ki so neposredno povezane s pošto. Po eni strani je to lahko sama vsebina sporočila, v omejenem obsegu pa je mogoče preveriti tudi pošiljatelja sporočila. Uveljavile so se tri metode:
a) Metoda črnega seznama. Črna lista je "črni seznam", ki je sinonim za nezaželen stik. Vsebinsko tak seznam vsebuje določene izraze in ključne besede. Algoritem išče e-poštno sporočilo po teh ključnih besedah; če jih najde, se e-poštno sporočilo razvrsti. Enak postopek se lahko razširi tudi na pošiljatelja. Številni filtri za neželeno pošto, ki delujejo po metodi črnega seznama, že vsebujejo obsežno zbirko podatkov. Uporabniki lahko to delno razširijo glede na svoje osebne potrebe.
b) Metoda Bayesovega filtra. Metoda Bayesovega filtra temelji na teoriji verjetnosti in zahteva sodelovanje uporabnika, zlasti na začetku. Če je pravilno nastavljen, je boljši od metode črnega seznama. Pri tej metodi mora uporabnik prejeto pošto prepoznati kot Spam razvrščanje neželene ali neželene pošte. Bayesov filter se uči pravil v ozadju brez poseganja v algoritme. Po približno 1.000 samostojno razvrščenih sporočilih filter deluje samostojno. Bayesov filter se uči tudi med nadaljnjim ponovnim razvrščanjem.
c) Podatkovna zbirka rešitve, ki temeljijo na. Zlasti oglasna pošta vsebuje vrsto podatkov, ki naj bi pripeljali do konkretnega stika. To vključuje predvsem naslov URL Spletna stran in telefonsko številko. Rešitve, ki temeljijo na podatkovnih zbirkah, uporabljajo algoritme za iskanje teh informacij. Če jih najdete, pošto razvrstite. Stopnja uspešnosti teh metod je zelo dobra. Res je, da lahko oglaševalska sporočila vedno znova preoblikujete in tako v neomejenem številu, vendar nekateri podatki vedno ostanejo enaki.
Stopnje napak v filtrih za nezaželeno pošto
Neželena pošta je v preteklosti postala vse bolj izpopolnjena. Zato se mora aplikacija za filtriranje neželene pošte še naprej razvijati. To je povezano z naporom in stroški, zato nekateri ponudniki zaračunajo morebitno storitev. Poleg tega je razvrščanje s pomočjo programov povezano s stopnjo napak, ki pa jo je mogoče zmanjšati z usposabljanjem. Lažno negativno zaznavanje je takrat, ko neželena pošta pride v običajni poštni predal; lažno pozitivno zaznavanje pa je takrat, ko je običajna pošta zamenjana za neželeno pošto. Medtem ko ukrepi za optimizacijo zmanjšajo stopnjo napake lažno negativnega prepoznavanja na deset do en odstotek, se lažno pozitivna klasifikacija približuje ničli.
Znani filter za nezaželeno pošto je na primer SpamAssassinki ga uporablja večina ponudnikov e-pošte.