miércoles, 10 de agosto de 2022

Algoritmos demuestran alta efectividad para proteger datos privados de ciberataques

 ¡Has ganado un premio, responde a este mensaje para reclamarlo!, con mensajes como este, enviados por correo electrónico, redes sociales o mensajes de texto, algunas personas caen en las trampas informáticas de agentes maliciosos que lo único que buscan es robar sus datos personales, como contraseñas y cuentas en los bancos, entre otros.

Una investigación de la Maestría en Sistemas y Computación de la Facultad de Ingeniería de la Universidad Nacional de Colombia (UNAL) encontró que tres algoritmos tienen un 84 % de eficacia para identificar mensajes que podrían significar una estafa o un robo de datos.

A raíz de los muchos mensajes de este estilo que recibió en su celular, Juan Camilo López, autor de la tesis, se preguntó si no habría algún método o herramienta que ayudara a saber cuándo estos son mentiras y representaban algún peligro para quien los creyera.

Uno de los conceptos clave para entender su proyecto es el de la “ingeniería social”, definida como el arte o la ciencia de manipular el comportamiento de las personas generando engaños que buscan robar información confidencial para divulgarla o utilizarla; esta práctica puede ser ejecutada por cualquier persona.

Existen varios tipos de ingeniería social según el modo en que se ejecute, por ejemplo, está el phishing, que son mensajes de correo electrónico tipo “usted ganó un dinero entre a este link para reclamarlo”, o el smishing, que son mensajes de texto fraudulentos.

Al revisar el estado del arte, Juan Camilo encontró que no había muchas investigaciones al respecto, y en español no había nada, por lo que su estudio es novedoso en este campo.

“Se recolectaron datos de redes sociales como Facebook y Twitter, además de foros como Reddit y mensajes de texto que tenía en mi celular; en total se encontraron y analizaron alrededor de 300 ataques de ingeniería social”, asegura el investigador.

El trabajo consistió en extraer mensajes en estas redes y foros que contuvieran una denuncia o reclamo frente a una situación de posible estafa o engaño en mensajes de texto o correos electrónicos.

“Por ejemplo, muchas imágenes contenían denuncias a la Policía que mostraban el pantallazo de los mensajes maliciosos”, señala.

Luego de recolectar la información se procedió a clasificarla y limpiarla para que solo quedara el texto de los mensajes sin fotos, dobles espacios o caracteres especiales como símbolos de arroba o hashtags.

Esta acción se realizó gracias al lenguaje de programación Phyton, en el cual se utilizó el procesamiento del “lenguaje natural”, campo de las ciencias de la computación que estudia la relación entre la inteligencia artificial y el lenguaje para convertir el texto de los mensajes en valores numéricos.

La conversión se crea debido a que los algoritmos que se van a alimentar de esta información en Phyton no leen texto sino números, entonces se utiliza el número 1 para decir que existe un  ataque de ingeniería social, o sea de engaño, estafa o robo, mientras que el 0 quiere decir que no se presenta.

Es aquí donde aparecen los tres algoritmos que mostraron una gran efectividad para detectar las anomalías textuales que buscan robar datos y aprovecharse de las personas, estos son: una red neuronal artificial, un bosque aleatorio, y una máquina de vectores de soporte.

El candidato a magíster explica que “para estos mecanismos se extrajeron una serie de características del texto que incluían el número de emails, URLS y links, números telefónicos, ortografía, ocurrencias de palabras como ‘dinero’, ‘ganaste’ y ‘premio’, además de otras expresiones como ‘urgente’ o ‘usted debe’”.

Estos algoritmos funcionan por medio de una retroalimentación constante que permite que se aprendan y tomen mejores decisiones a medida que van analizando estos parámetros, encontrando y prediciendo cada vez de manera más precisa si un mensaje es un ataque a la seguridad de los usuarios o no.

“Estos algoritmos presentaban una eficacia de entre 82 y 84 % para detectar textos que pueden llegar a ser peligrosos y resultar en estafas, robos, y engaños; la máquina de vectores de soporte fue la que presentó el mejor desempeño”, afirma.

Esta tecnología se podría implementar en una aplicación de celular que prediga si un mensaje de texto de celular o en las redes sociales representa un riesgo, generando alertas como la originada por Gmail cuando un correo electrónico tiene una procedencia dudosa.

Cada vez es más importante implementar estrategias para que la era digital sea un potenciador del desarrollo de los seres humanos y no un daño a su integridad y seguridad, provocado por el uso y la divulgación ilegal de datos privados y personales presentes en la vida cotidiana de las personas.






No hay comentarios:

Publicar un comentario