Sé mejor administrador: reduce realmente el spam

Periódicamente asistimos a noticias (que, también es cierto, apenas salen del mundo geek) acerca del perjuicio que una de las técnicas más usadas para reducir el spam, las listas negras de correo electrónico, causan a tantos usuarios legítimos. No negaremos que se reduzca el spam. En efecto, se reduce, pero a costa de tener una alta tasa de falsos positivos, de personas que por usar un servidor de correo anotado en una lista negra, no pueden enviarnos mensajes. Ante este problema, muchos administradores optan por negarlo siguiendo el algoritmo del avestruz y acusar a los afectados de no saber lo que hacen. Sinceramente, creo que eso no debería permitirlo ningún administrador por mal que le paguen ;-)

No creo que encontremos pronto técnicas definitivas (o infalibles) contra el spam. Pero ahora mismo hay dos técnicas que funcionan realmente bien y más si se combinan: los filtros por contenido (especialmente, los bayesianos) y las listas grises (greylisting).


Los primeros ejecutan una serie de reglas sobre el correo entrante. Analizan las palabras del mismo y, si el mensaje reune alguna característica propia del spam, acumula una serie de puntos. Si el número de puntos acumulados supera un determinado umbral, el que el mensaje será clasificado como spam. Esta clasificación normalmente debe hacerse modificando el asunto del mensaje (añadiendo, por ejemplo, un prefijo similar a **spam?**) y tal vez una línea de cabecera que nos ayude, si queremos, a filtrarlo automáticamente. No debe borrarse sin más ya que los falsos positivos, aunque escasos, se producen.

Muchos de estos filtros pueden ejecutar algoritmos bayesianos, que deben ser alimentados durante un tiempo por medio de mensajes clasificados manualmente como spam y otros tantos clasificados como legítimos. Cuando esta alimentación sea suficiente, el programa habrá aprendido a distinguir automáticamente lo que es spam de lo que no lo es, con una baja tasa de fallos.

Una de los filtros de contenido más completos es Spamassassin. Se puede instalar para filtrar el correo de todos nuestros usuarios o bien se puede delegar esta responsabilidad en cada uno. En 7throot encontramos instrucciones para una configuración del primer tipo.

La otra técnica que quería comentar es el greylisting. La idea es bastante simple y, por ahora, eficaz: un alto porcentaje del spam actual es generado por programas muy sencillos (con frecuencia, corriendo como infecciones víricas en PCs de usuarios que, por supuesto, no saben nada). La sencillez de estos programas hacen que apenas implementen el protocolo SMTP, siendo capaces simplemente de hacer la conexión para enviar los mensajes, de manera que si se produce un error, saltan a otro destinatario. El problema es que hay errores del tipo “reinténtalo más tarde” pero que los programas de envío de spam no implementan, por lo que el correo no solicitado no llega a ser enviado a ese buzón.

La idea de la lista gris es, cuando recibimos en el servidor de correo un mensaje de un sitio nuevo, decirle al remitente algo similar a “reinténtalo en cinco minutos”. Un servidor remitente de correo bien implementado reintentará más tarde al ver que es un error temporal, pero un programa de envío masivo de spam normalmente no lo hará. Resultado: lo que nunca nos llegue podemos decir que siempre será spam, mientras que el correo legítimo nos llegará siempre (salvo que el servidor de correo remitente no esté bien implementado, cosa que es fácilmente corregible y apenas se da).

Hablando de implementaciones, aquellos que usen Postfix como servidor de correo, pueden implementar listas grises con postgrey. Y para los que usamos Sendmail, hace poco que encontré smf-grey. Ambos son muy fáciles de instalar y merecen realmente la pena.

Quizás algún día estas técnicas dejen de funcionar bien. Probablemente entonces sea el momento de adoptar masivamente las Domainkeys, una solución que está en pruebas desde hace meses en Gmail y supongo que en su creador, Yahoo. O inventar algo nuevo.

Pero, por favor, administradores: listas negras, NO. Hay soluciones mejores.

8 Responses to “Sé mejor administrador: reduce realmente el spam” »»

  1. Comentario by herraiz | 01/21/06 at 4:44 pm

    Amén.

    (Comentario patrocinado por vecino solidario).

  2. Comentario by Antonio | 01/22/06 at 10:08 pm

    Lo acabo de implementar en pantuflo y parece que de momento funciona.

    Muchas gracias Juanjo!!!

  3. Comentario by Juanjo | 01/22/06 at 10:54 pm

    Antonio: ¿qué has implementado? ¿filtros? ¿greylist? ¿las dos cosas? Desde luego si has instalado los dos, vas a notar cómo cae el spam en picado. Ya me contarás.

  4. Comentario by Antonio | 01/23/06 at 9:57 am

    Solamente greylisting ya que no tengo mucho tiempo para poder ver todo el correo. De momento, yo en mi cuenta de pantuflo no he recibido ningún correo de spam, y te aseguro que recibía muchísimo.

    Un saludo,

    Antonio.

  5. Comentario by Juanjo | 01/23/06 at 10:27 pm

    Estoy seguro de ello. El greylist parece un milagro, y los spammers tendrán que mejorar bastante sus troyanos para que los PCs zombies implementen un SMTP completo ;-)

    Pero de momento, el resultado es espectacular para el que lo prueba, y poco creíble para el que prefiere quedarse cruzado de brazos (o usar listas negras, que casi es lo mismo).

  6. Comentario by delacallealpuntocom | 02/24/06 at 8:18 pm

    DE SPAMER A BLOGGER EN 4 PASOS
    February 22nd, 2006
    Delacallealpuntocom estamos encontra SPAM en todas sus modalidades

    Este es el ejemplo de como los SPAMERS estan cambiando a blogger
    paso 1 contar con una pagina semillero es una pagina con paginas de palabras
    que acaparan el PR (PageRank ) con sus tres o + TLD (Top-level domain)

    paso 2 En su blog ponga en la parte de arriba todas sus paginas que tenga meta un comentario con el enlace a una o en todas sus pagina donde usted mismo en sus otras pagina se da unas palmadas en la espalda

    paso 3 En su pagina venda propaganda meta enlaces pagados $ Spam
    se toma asi por que el usuario esta buscando el seguimiento de el comentario
    no Spam escondido como estos

    paso 4 Todos los quieran meter un enlace en un comentario en cuaquiera de toda tus paginas los tienes que catalogar como SPAMER y filtrar todos los comentarios sin derecho de replica

    Es muy facil detectar este tipo de abuso por que son dos los afectados por el Spam

    el usuario que esta dandole seguimiento a el comentario como el webmaster de la pagina de donde se esta dando el robo de las palabras clave en sus contenidos

    Ver + Spam incluyen grupos de noticias usenet, motores de búsqueda, wikis y blogs. El Spam también puede tener como objetivo los teléfonos móviles (a través de mensajes de texto) y los sistemas de mensajería instantánea. podcast por rss y mas

  7. Comentario by johan | 04/05/06 at 7:35 am

    y este SPAMER quien lo regula
    registrant:
    phi:design
    Monterrey #374, Dep 304
    Colonia Roma Sur
    Mexico City, DF 06760
    MX

    Registrar: DOTSTER
    Domain Name: PHIHOSTING.COM
    Created on: 04-NOV-01
    Expires on: 04-NOV-06
    Last Updated on: 04-NOV-05

    Administrative Contact:
    Arcos, Eduardo eduardo@eduardoarcos.com
    phi:design
    Monterrey #374, Dep. 304
    Colonia Roma Sur
    Mexico City, DF 06760
    MX
    (52) 55842608

    Technical Contact:
    Arcos, Eduardo eduardo@eduardoarcos.com
    phi:design
    Monterrey #374, Dep 304
    Colonia Roma Sur
    Mexico City, DF 06760
    MX
    (52) 55842608

    Domain servers in listed order:
    NS1.PHIHOSTING.NET
    NS2.PHIHOSTING.NET
    rey de el blog vende host
    y
    #3. | hackall :

    Tu comentario está en espera de ser moderado

    2 late brother
    Alan : lame
    Paco :lame
    hackall: lame

    Don eduardo sin usted el internet no existe
    mil abrazos. IBM en tus manos en ese caso regresamos el internet a los BBS “rules” seria como regresar el tiempo a los 3 discos de DOS ver 5 > o a los blog de extranjeros en mexico… y sales con tu >no mames este si lo borras seguro jajajajaj real mente das risa ya ni tu solo tela comes ?¿?¿ quie Si ?¿?¿ arriba este tio para presiteto que ¡’¡¿¿que estas pensando cuando pones estas mamarachadas ¿¿¿

    obulo
    5 de Abril de 2006 a las 12:28 am
    comentario moderado en su tema. weblogs da libre expresion por es a todos los lectores este tema es relacionado Eduardo Arcos | 04 de Abril, 2006 - 06:23 | Ir a comentarios gracias por su lectura
    En cuanto a la mesa redonda de ayer en la U. Iberoamericana
    pero sale
    #3. | hackall :

    Tu comentario está en espera de ser moderado

    Alan : lame
    Paco :lame
    hackall: lame

    Don eduardo sin usted el internet no existe
    mil abrazos. IBM en tus manos en ese caso regresamos el internet a los BBS “rules” seria como regresar el tiempo a los 3 discos de DOS ver 5 > o a los blog de extranjeros en mexico… y sales con tu >no mames este si lo borras seguro jajajajaj real mente das risa ya ni tu solo tela comes ?¿?¿ quie Si ?¿?¿ arriba este tio para presiteto que ¡’¡¿¿que estas pensando cuando pones estas mamarachadas ¿¿¿

Trackbacks/Pingbacks »»>

  1. […] Por casualidad viendo la cabecera de un correo, he visto que al menos uno de los servidores de Gmail (el genial correo de Google) está en las listas negras de Spamcop. Dada la popularidad de este servicio, me imagino que los administradores de profesionalidad dudosa que usen estas listas estarán cortando bastante correo legítimo a sus usuarios. Pero bueno, aun están a tiempo de mejorar su servicio… […]


Leave a Reply »»