Desmitificando deep learning: cómo Sophos construye modelos de aprendizaje automático

Corporate

Una introducción al proceso que Sophos lleva hacia el desarrollo de un modelo de aprendizaje profundo.

Cuando explico a otros que soy un científico de datos y construyo modelos de aprendizaje automático, tiendo a tener miradas en blanco.

En la industria de la ciberseguridad, el término “aprendizaje automático” se utiliza con tanta frecuencia, por muchas razones diferentes, que puede ser difícil entender lo que significa. En Sophos nos centramos específicamente en el aprendizaje profundo, que es una forma avanzada de aprendizaje automático.

Para ayudar a desmitificar el aprendizaje automático, hemos creado un artículo técnico para introducir los conceptos que hacen que esta tecnología sea tan poderosa, la ciencia que entra en la construcción de modelos de aprendizaje automático y las razones por las que no todos los modelos son iguales. Además, espero que me ayude con esas miradas en blanco cuando describo mi trabajo a la gente.

El artículo cubre una serie de temas que sirven de guía para el aprendizaje profundo. Revisamos el proceso que llevamos hacia el desarrollo de un modelo de aprendizaje profundo, incluyendo la recolección de grandes cantidades de datos, la ingeniería de características del dominio, la construcción de la arquitectura, la formación del modelo, la prueba del modelo y la evaluación del modelo.

Antes de entrar en detalle, lo primero que debemos entender es el concepto de aprendizaje profundo. Este tipo de aprendizaje de máquina es el más similar al cerebro humano porque implica muchas capas de neuronas.

Esto es exactamente donde el término “red neural artificial” vino. Artificial, en este caso, significa que es una imitación de una red neuronal del cerebro.

Tanto una red neuronal en el cerebro como una red artificial toman una entrada, manipulan la entrada de alguna manera y envían información a otras neuronas. La principal diferencia es que el cerebro humano contiene aproximadamente 100 mil millones de neuronas, mientras que una red neuronal artificial contiene ni siquiera una fracción de eso.

Al igual que otros tipos de aprendizaje automático, el aprendizaje profundo utiliza modelos matemáticos para aprender sin ser explícitamente programado en las particularidades del problema específico. Usando una gran cantidad de datos, generamos un modelo general que es capaz de describir con precisión los datos. En el caso de Sophos, esos datos podrían ser malware, URL maliciosas u otros problemas de seguridad que estamos tratando de resolver.

Puesto que estamos hablando de modelos generales que tratan de explicar fenómenos específicos, nunca sabemos si nuestro modelo de aprendizaje automático ha aprendido a predecir correctamente. Es por eso que cualquier modelo que desarrollamos está siempre acompañado de un riguroso conjunto de evaluaciones.

Para seguir aprendiendo, descargue el artículo técnico completo. Vamos a compartir muchas más ideas del equipo de ciencia de datos de Sophos. Mire este espacio para más actualizaciones.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.