...

Det engelske substantiv "spam" i spamfilteret kan gengives med det tyske ord Abfall. Oprindeligt betyder det kød på dåse. I it-sektoren henviser det til uønskede elektroniske meddelelser, dvs. at de leveres uden at være i overensstemmelse med modtagerens ønsker. De indeholder for det meste reklamer. Ifølge en undersøgelse fra den Hamburg-baserede statistikportal Statista var antallet af spam-mails på verdensplan 28 milliarder i 2014. Det er et globalt problem, som løses ved hjælp af et spamfilter, dvs. at uønskede meddelelser sorteres fra af et computerprogram. Afsenderen af en sådan uønsket mail kaldes en spammer, og processen kaldes spamming eller spamming.

Anvendelsesområder for et spamfilter

Traditionelt var brugen af et spamfilter begrænset til at sortere uønskede e-mails fra. Til dette formål blev der ved hjælp af algoritmer konstrueret moduler for e-mail-programmer og mailservere. Men da reklame på internettet har fået større og større betydning, filtrerer nyere programmer også siderne. Spamfiltre anvendes også specifikt til webbrowsere, wikier og blogs.

Arbejdsmetoder for et spamfilter

Spamfiltre opfanger oplysninger, der er direkte relateret til en mail. På den ene side kan det være selve indholdet af mailen, men det kan også i begrænset omfang kontrolleres, hvem der er afsender af en meddelelse. Tre metoder er blevet etableret:
a) Den Sortliste-metode. En sortliste er en "sort liste", som er et synonym for en uønsket kontakt. Indholdsmæssigt indeholder en sådan liste visse udtryk og nøgleord. En algoritme søger i en e-mail efter disse nøgleord, og hvis den finder nogen, sorteres e-mailen fra. Den samme procedure kan også udvides til at omfatte afsenderen. Mange spamfiltre, der arbejder efter blacklist-metoden, indeholder allerede en omfattende database. Brugerne kan udvide denne delvist i overensstemmelse med deres personlige behov.

Spam-konvolut

b) Bayes-filtermetoden. Bayes-filtermetoden er baseret på sandsynlighedsteori og kræver brugerens samarbejde, især i begyndelsen. Hvis den er korrekt opsat, er den bedre end blacklist-metoden. Ved denne metode skal brugeren identificere modtagne mails som Spam klassificere spam eller ikke-spam. Det bayesianske filter lærer reglerne i baggrunden uden nogen indgriben i algoritmerne. Efter ca. 1.000 selvsorterede mails fungerer filteret selvstændigt. Det bayesianske filter fortsætter også med at lære i løbet af den efterfølgende omsortering.
c) Den Database baserede løsninger. Især reklame-e-mails indeholder en række data, der skal føre til en konkret kontakt. Dette omfatter først og fremmest URL-adressen til en Websted og telefonnummeret. Databasebaserede løsninger bruger algoritmer til at søge efter disse oplysninger. Hvis de findes, sorteres mails fra. Succesraten for disse metoder kan betegnes som meget god. Det er rigtigt, at du kan redesigne reklamemails igen og igen og dermed i et ubegrænset antal, men visse data forbliver altid de samme.

Fejlfrekvens i spamfilteret

Spam-mails er blevet mere og mere sofistikerede i de seneste år. Som følge heraf skal spamfilterapplikationen fortsat udvikles. Dette indebærer en indsats og omkostninger, og det er derfor, at nogle udbydere tager penge for en eventuel tjeneste. Desuden er sortering ved hjælp af programmer forbundet med en fejlprocent, som dog kan reduceres ved hjælp af træning. Falsk negativ registrering er, når spam-mails kommer ind i den almindelige indbakke; falsk positiv registrering er derimod, når normale mails forveksles med spam. Mens optimeringsforanstaltningerne reducerer fejlprocenten for falsk negativ genkendelse til ti til en procent, går falsk positiv klassificering mod nul.

Et velkendt spamfilter er f.eks. SpamAssassinsom anvendes af de fleste e-mail-udbydere.

 

Aktuelle artikler