Le nom anglais "spam" dans le filtre anti-spam peut être traduit par le mot allemand "Abfall". A l'origine, il s'agit de la viande en conserve. Dans le secteur informatique, il s'agit de messages électroniques non sollicités, c'est-à-dire livrés sans que le destinataire en ait fait la demande. Ils contiennent généralement de la publicité. Selon une étude du portail de statistiques de Hambourg Statista, le nombre de spams dans le monde en 2014 était de 28 milliards. Il s'agit d'un problème mondial qui est résolu à l'aide d'un filtre anti-pourriel ; plus précisément, les messages indésirables doivent être triés par un programme informatique. L'expéditeur de ce courrier indésirable est appelé "spammeur", le processus est appelé "spamming" ou "pollupostage".

Domaines d'application d'un filtre anti-spam

Classiquement, l'utilisation d'un filtre anti-spam se limitait au tri des courriers électroniques indésirables. À cette fin, des modules pour les programmes de courrier électronique et les serveurs de messagerie ont été construits à l'aide d'algorithmes. Cependant, comme l'importance de la publicité sur Internet a augmenté de plus en plus dans le passé, des programmes plus récents filtrent également les pages. Plus précisément, les filtres anti-pourriel sont également utilisés pour les navigateurs web, les wikis et les blogs.

Méthodes de travail d'un filtre anti-spam

Les filtres antispam détectent les informations qui sont directement liées à un courrier. Il peut s'agir du contenu du courrier lui-même, mais l'expéditeur d'un message peut également être vérifié dans une mesure limitée. Trois méthodes se sont imposées :
(a) Le Méthode de la liste noire. Une liste noire est une "liste noire" qui est synonyme de contact indésirable. En termes de contenu, une telle liste énumère certaines expressions et mots-clés. Un algorithme recherche ces mots clés dans un courrier ; s'il trouve ces mots clés, il fera en sorte qu'un courrier soit trié. La même procédure peut être étendue à l'expéditeur. De nombreux filtres antispam qui fonctionnent selon la méthode de la liste noire contiennent déjà une vaste base de données. Les utilisateurs peuvent étendre cette base de données en fonction de leurs besoins personnels.

Enveloppe de spam

b) La méthode du filtre bayésien. La méthode du filtre bayésien repose sur la théorie des probabilités et présuppose la collaboration de l'utilisateur, surtout au début de l'utilisation. Si elle est correctement configurée, elle est supérieure à la méthode de la liste noire. L'utilisateur doit considérer les e-mails reçus comme Spam ou ne pas classer les spams. En arrière-plan, le filtre bayésien apprend les règles sans qu'il soit nécessaire d'intervenir dans les algorithmes. Après avoir classé lui-même environ 1.000 e-mails, le filtre fonctionne de manière autonome. Le filtre bayésien continue également d'apprendre dans le cadre des tris ultérieurs.
(c) Le Base de données des solutions basées. Les courriels publicitaires, en particulier, contiennent une série de données destinées à mener à un contact spécifique. Cela comprend surtout l'URL d'un site web et le numéro de téléphone. Les solutions basées sur des bases de données utilisent des algorithmes pour rechercher ces informations. S'ils sont trouvés, les courriers sont triés. Le taux de réussite de ces procédures peut être qualifié de très bon. Bien que les courriers publicitaires puissent être redessinés à plusieurs reprises et donc en nombre illimité, certaines données restent toujours les mêmes.

Taux d'erreur des filtres anti-spam

Les spams sont devenus de plus en plus sophistiqués dans le passé. Par conséquent, l'application de filtrage du spam doit évoluer. Cela implique des efforts et des coûts, c'est pourquoi certains fournisseurs font payer des frais pour tout service. De plus, le tri par programme est associé à un taux d'erreur, mais celui-ci peut être réduit par la formation. La détection faussement négative se produit lorsque les messages de spam arrivent dans la boîte de réception normale ; la détection faussement positive se produit lorsque les messages normaux sont confondus avec du spam. Alors que les mesures d'optimisation réduisent le taux d'erreur de la détection des faux négatifs à dix à un pour cent, la détection des faux positifs tend vers zéro.

Un filtre anti-spam connu est par exemple SpamAssassinqui est utilisé par la plupart des fournisseurs de courrier électronique.

 

Derniers articles