Facciamo chiarezza sul deep learning: ecco come Sophos crea i suoi modelli di machine learning

Per gli utentideep learningIntelligenza Artificialemachine learning

Introduzione al processo intrapreso da Sophos verso lo sviluppo di un modello di deep learning.

Quando spiego agli altri che sono uno scienziato che si occupa di dati e creo modelli di machine learning, generalmente mi trovo di fronte sguardi vuoti.

Nell’industria della cybersecurity, il termine ” machine learning ” viene usato così spesso, per molti motivi diversi, che può essere difficile capire cosa significhi. In Sophos ci concentriamo specificatamente sul deep learning, che è una forma avanzata di machine learning.

Per aiutare a rendere più chiaro il machine learning, abbiamo redatto un articolo tecnico che presenta i concetti che rendono questa tecnologia così potente. Nello scritto inoltre si spiega cosa sia la scienza che si dedica alla creazione di modelli di machine learning e le ragioni per cui non tutti i modelli sono uguali. Oltre a tutto ciò, spero anche che mi aiuti in futuro con quegli sguardi vuoti quando descrivo il mio lavoro alla gente.

L’articolo copre una vasta gamma di argomenti che servono come manuale introduttivo sul deep learning. Prendiamo in esame il processo intrapreso verso lo sviluppo di un modello di deep learning, compresa la raccolta di grandi quantità di dati, l’ingegnerizzazione del dominio, la costruzione dell’architettura, la formazione del modello, il test del modello e la sua valutazione.

Prima di approfondire, la prima cosa da capire è il concetto stesso di deep learning. Questo tipo di machine learning è il più simile al cervello umano perché coinvolge molti strati di neuroni.

Il termine “rete artificiale neurale” proviene esattamente da qui. Artificiale, in questo caso, significa che è un’imitazione di una rete neurale del cervello.

Sia una rete neurale nel cervello sia una rete artificiale recepiscono un input, manipolano l’input in qualche modo e producono informazioni per altri neuroni. La differenza principale è che il cervello umano contiene circa 100 miliardi di neuroni, mentre una rete neurale artificiale non ne contiene neppure una frazione.

Come altri tipi di machine learning, il deep learning usa modelli matematici da imparare senza essere esplicitamente programmato nelle particolarità del problema specifico. Utilizzando una grande quantità di dati, produciamo un modello generale in grado di descrivere con precisione i dati. Nel caso di Sophos, questi dati potrebbero essere malware, URL dannosi o altri problemi di sicurezza che stiamo cercando di risolvere.

Dal momento che stiamo parlando di modelli generali che cercano di spiegare fenomeni specifici, non sappiamo mai se il nostro modello di machine learning ha imparato a predire correttamente. Ecco perché ogni modello che sviluppiamo è sempre accompagnato da un rigoroso insieme di valutazioni.

Per saperne di più scaricate l’articolo tecnico completo.

 

*articolo di Madeline Schiappa, Data Scientist di Sophos

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.