Nel contesto del punteggio di attacco WAF, che è il livello di apprendimento automatico (ML) di Cloudflare costruito sopra il loro firewall delle applicazioni web (WAF), la popolarità della funzione ha creato la necessità di miglioramenti delle prestazioni. L'obiettivo della funzione è quello di integrare il WAF e rilevare i bypass degli attacchi che non sono stati incontrati prima, catturando le vulnerabilità zero-day e aumentando la protezione del cliente contro le minacce emergenti e sconosciute.
Per ottimizzare le prestazioni del modello ML WAF, sono stati intrapresi diversi passaggi. In primo luogo, la fase di pre-elaborazione è stata ottimizzata utilizzando Aho-Corasick DFA per sostituire le ricerche di hash map, riducendo la latenza del 47,84% a 1,64x. Poi, è stato utilizzato un approccio basato su corrispondenze, che ha ulteriormente ridotto la latenza del 53,45% a 2,15x. Dopo di che, è stata sviluppata una nuova implementazione di sostituzione delle lettere, che ha raddoppiato la velocità di pre-elaborazione e l'ha resa quattro o cinque volte più veloce rispetto alla versione originale.
In seguito, è stata implementata una ricerca di n-gram senza rami, che ha ridotto la latenza del 91,33% a 11,54x. Ciò è stato ottenuto precomputando le tabelle di ricerca offset e utilizzandole per sostituire le operazioni di confronto con accessi diretti alla memoria, che sono molto più veloci e non coinvolgono ramificazioni.
Infine, l'inferenza del modello è stata ottimizzata abilitando la moltiplicazione matriciale SIMD e utilizzando XNNPack, che ha ridotto la latenza del 77,17% a 4,38x. Inoltre, è stato implementato un cache LRU per saltare le esecuzioni ridondanti e ridurre ulteriormente la latenza. Complessivamente, le ottimizzazioni hanno ridotto il tempo di esecuzione del ML WAF di circa l'81,90%, da 1519 a 275 microsecondi, o 5,5x più veloce.
blog.cloudflare.com
Making WAF ML models go brrr: saving decades of processing time
Create attached notes ...