Introduzione al processo intrapreso da Sophos verso lo sviluppo di un modello di deep learning.
Quando spiego agli altri che sono uno scienziato che si occupa di dati e creo modelli di machine learning, generalmente mi trovo di fronte sguardi vuoti.
Nell’industria della cybersecurity, il termine ” machine learning ” viene usato così spesso, per molti motivi diversi, che può essere difficile capire cosa significhi. In Sophos ci concentriamo specificatamente sul deep learning, che è una forma avanzata di machine learning.
Per aiutare a rendere più chiaro il machine learning, abbiamo redatto un articolo tecnico che presenta i concetti che rendono questa tecnologia così potente. Nello scritto inoltre si spiega cosa sia la scienza che si dedica alla creazione di modelli di machine learning e le ragioni per cui non tutti i modelli sono uguali. Oltre a tutto ciò, spero anche che mi aiuti in futuro con quegli sguardi vuoti quando descrivo il mio lavoro alla gente.
L’articolo copre una vasta gamma di argomenti che servono come manuale introduttivo sul deep learning. Prendiamo in esame il processo intrapreso verso lo sviluppo di un modello di deep learning, compresa la raccolta di grandi quantità di dati, l’ingegnerizzazione del dominio, la costruzione dell’architettura, la formazione del modello, il test del modello e la sua valutazione.
Prima di approfondire, la prima cosa da capire è il concetto stesso di deep learning. Questo tipo di machine learning è il più simile al cervello umano perché coinvolge molti strati di neuroni.
Il termine “rete artificiale neurale” proviene esattamente da qui. Artificiale, in questo caso, significa che è un’imitazione di una rete neurale del cervello.
Sia una rete neurale nel cervello sia una rete artificiale recepiscono un input, manipolano l’input in qualche modo e producono informazioni per altri neuroni. La differenza principale è che il cervello umano contiene circa 100 miliardi di neuroni, mentre una rete neurale artificiale non ne contiene neppure una frazione.
Come altri tipi di machine learning, il deep learning usa modelli matematici da imparare senza essere esplicitamente programmato nelle particolarità del problema specifico. Utilizzando una grande quantità di dati, produciamo un modello generale in grado di descrivere con precisione i dati. Nel caso di Sophos, questi dati potrebbero essere malware, URL dannosi o altri problemi di sicurezza che stiamo cercando di risolvere.
Dal momento che stiamo parlando di modelli generali che cercano di spiegare fenomeni specifici, non sappiamo mai se il nostro modello di machine learning ha imparato a predire correttamente. Ecco perché ogni modello che sviluppiamo è sempre accompagnato da un rigoroso insieme di valutazioni.
Per saperne di più scaricate l’articolo tecnico completo.
*articolo di Madeline Schiappa, Data Scientist di Sophos