El sustantivo inglés "spam" en el filtro de spam puede ser traducido como la palabra alemana Abfall. Originalmente, se refiere a la carne enlatada. En el sector de la tecnología de la información, esto se refiere a los mensajes electrónicos no solicitados; es decir, que se entregan sin que el destinatario lo solicite. Normalmente contienen publicidad. Según una investigación del portal de estadísticas de Hamburgo Statista, el número de correos basura en todo el mundo en 2014 fue de 28 mil millones. Este es un problema global que se resuelve con la ayuda de un filtro de spam; específicamente, los mensajes no deseados deben ser resueltos por un programa de computadora. El originador de tal correo no deseado se llama "spammer", el proceso se llama "spamming" o envío de correo basura.
Áreas de aplicación de un filtro de spam
Clásicamente, el uso de un filtro de spam se limitaba a la clasificación de los correos electrónicos no deseados. Para ello, se construyeron módulos para programas de correo electrónico y servidores de correo con la ayuda de algoritmos. Sin embargo, dado que la importancia de la publicidad en Internet ha aumentado cada vez más en el pasado, los nuevos programas también filtran las páginas. Más específicamente, los filtros de spam también se utilizan para los navegadores web, wikis y blogs.
Métodos de trabajo de un filtro de spam
Los filtros de spam recogen información que está directamente relacionada con un correo. Puede tratarse del contenido del propio correo, pero también se puede comprobar de manera limitada el origen de un mensaje. Se han establecido tres métodos:
a) El Método de la lista negra. Una lista negra es una "lista negra" que es sinónimo de un contacto no deseado. En cuanto al contenido, dicha lista enumera ciertas expresiones y palabras clave. Un algoritmo busca en un correo electrónico estas palabras clave; si encuentra tales palabras clave, hará que un correo se clasifique. El mismo procedimiento puede extenderse al remitente. Muchos filtros de spam que funcionan según el método de la lista negra ya contienen una extensa base de datos. Los usuarios pueden ampliar esta base de datos según sus necesidades personales.
b) El método del filtro de Bayes. El método del filtro de Bayes se basa en la teoría de la probabilidad y requiere la cooperación del usuario, especialmente al principio. Si se configura correctamente, es superior al método de la lista negra. En este método, el usuario debe identificar los correos recibidos como Spam clasificar el spam o el no spam. El filtro bayesiano aprende las reglas en segundo plano sin intervenir en los algoritmos. Después de unos 1.000 correos autoclasificados, el filtro funciona de forma independiente. El filtro bayesiano también sigue aprendiendo en el curso de la reordenación posterior.
c) El Base de datos soluciones basadas en la tecnología. Los correos electrónicos publicitarios, en particular, contienen una serie de datos que pretenden conducir a un contacto específico. Esto incluye, sobre todo, la URL de un sitio web y el número de teléfono. Las soluciones basadas en bases de datos utilizan algoritmos para buscar esta información. Si se encuentran, los correos se clasifican. La tasa de éxito de esos procedimientos puede describirse como muy buena. Aunque los correos publicitarios pueden ser rediseñados una y otra vez y, por lo tanto, en un número ilimitado, ciertos datos siempre permanecen iguales.
Tasas de error de los filtros de spam
Los mensajes de spam se han vuelto cada vez más sofisticados en el pasado. Como resultado, la aplicación del filtro de spam tiene que evolucionar. Esto implica esfuerzo y costos, por lo que algunos proveedores cobran honorarios por cualquier servicio. Además, la clasificación por medio de programas está asociada a una tasa de error, pero ésta puede reducirse mediante el entrenamiento. La detección de falsos negativos es cuando los correos de spam llegan a la bandeja de entrada normal; la detección de falsos positivos es cuando los correos normales se confunden con el spam. Mientras que las medidas de optimización reducen la tasa de error de la detección de falsos negativos a un diez o un uno por ciento, la detección de falsos positivos tiende a cero.
Un filtro de spam conocido es, por ejemplo SpamAssassinque es utilizado por la mayoría de los proveedores de correo electrónico.