AI Research

Un sesto senso per la difesa informatica: l’IA multimodale

La ricerca di Sophos X-Ops, presentata al Virus Bulletin 2024, utilizza l'intelligenza artificiale “multimodale” per classificare spam, phishing e contenuti web non sicuri

In occasione della conferenza Virus Bulletin 2024, il Principal Data Scientist di Sophos Younghoo Lee ha presentato una relazione sulla ricerca di SophosAI in materia di IA “multimodale” (un sistema che integra diversi tipi di dati in un quadro analitico unificato). Nel suo intervento, Lee ha presentato i risultati di un’innovativa ricerca empirica condotta dal team sull’applicazione dell’IA multimodale al rilevamento di spam, phishing e contenuti web non sicuri.

Che cos’è l’IA multimodale?

Si tratta di un cambiamento significativo nell’ambito dell’intelligenza artificiale. Invece dell’analisi a modalità singola, i sistemi multimodali possono elaborare più flussi di dati contemporaneamente, ottenendo una sintesi dei dati provenienti da più input.

Nel contesto della cybersecurity, e in particolare quando si tratta di classificare le minacce informatiche, questa rappresenta una funzionalità potente. Invece di analizzare i contenuti testuali e visivi separatamente, un sistema multimodale è in grado di elaborarli entrambi e di “comprendere” le intricate relazioni tra loro.

Nel rilevamento del phishing, per esempio, l’intelligenza artificiale multimodale esamina i modelli linguistici e lo stile di scrittura del testo, insieme alla fedeltà visiva dei loghi e degli elementi di branding, e analizza anche la coerenza semantica tra i componenti testuali e grafici. Grazie a questo approccio olistico, il sistema è in grado di identificare attacchi sofisticati che potrebbero risultare legittimi per sistemi più tradizionali. Inoltre, l’intelligenza artificiale multimodale è in grado di apprendere e adattarsi alle correlazioni tra i diversi tipi di dati, sviluppando una percezione delle differenze tra i contenuti legittimi e quelli dannosi su più dimensioni.

Funzionalità

Nella sua ricerca, Lee descrive in dettaglio alcune delle potenzialità di rilevamento dei sistemi di intelligenza artificiale multimodale:

Analisi del testo e comprensione del linguaggio naturale;

  • analisi dei modelli linguistici, dello stile di scrittura e degli indizi contestuali per identificare i tentativi di manipolazione;
  • Rilevamento di tattiche di ingegneria sociale, come l’urgenza costruita e le richieste insolite di informazioni riservate.
  • Mantenimento di un database in continua evoluzione di contesti e narrazioni di phishing.

Intelligenza visiva e verifica del brand

  • Confronto di loghi, stili aziendali e layout grafici con modelli legittimi.
  • Individuazione di sottili differenze nei colori, nei font e nei layout del brand
  • Esame dei metadati delle immagini e delle firme digitali

Analisi avanzata di URL e sicurezza

  • Identificazione di tecniche ingannevoli come il typosquatting e gli attacchi omografici
  • Analisi delle relazioni tra il testo dell’URL visualizzato e le destinazioni effettive
  • Individuazione dei tentativi di oscurare gli URL dannosi mediante trucchi di stile e formattazione

Continua a leggere l’articolo.