AI- ja ML-uutisia suomeksi

Tehtävä WAF ML -mallit menemään brrr: säästämässä vuosikymmeniä prosessointiaikaa

Cloudflare:n Web-sovelluspalomuurin (WAF) päälle rakennetun koneoppimiseen perustuvan kerroksen, WAF Attack Score -ominaisuuden, suosio on johtanut suorituskyvyn parantamiseen. Ominaisuuden tavoitteena on täydentää WAF:ää ja havaita hyökkäyshän sivuuttamiset, joita ei ole koettu aikaisemmin, näin ollen vangitsemalla nollapäivä-vulnerabilitetit ja parantamalla asiakkaiden suojaa vastikään ilmestyviä ja tuntemattomia uhkia vastaan. WAF ML-mallin suorituskyvyn optimoimiseksi toteutettiin useita askeleita. Ensiksi, esikäsittelyvaihe optimoitiin käyttämällä Aho-Corasick DFA:ta hash-karttojen hakuja varten, mikä vähensi viipymättä 47,84 %:iin eli 1,64-kertaiseksi. Sitten käytettiin vastineperusteista lähestymistapaa, mikä vähensi viipymättä 53,45 %:iin eli 2,15-kertaiseksi. Seuraavaksi kehitettiin uusi kirjainten korvausmenetelmä, joka kaksinkertaisti esikäsittelynopeuden ja teki sen neljästä viidesti nopeammaksi kuin alkuperäinen versio. Tämän jälkeen toteutettiin haarattoman n-gram-haun toteuttaminen, mikä vähensi viipymättä 91,33 %:iin eli 11,54-kertaiseksi. Tämä saavutettiin prekompiloidessa offset-haun taulukoita ja käyttämällä niitä vertailuoperaatioiden korvaamiseksi suorilla muistiohjauksilla, jotka ovat paljon nopeampia eivätkä vaadi haarautumista. Lopuksi mallin päättely optimoitiin käyttämällä SIMD-matriisikertolaskua ja XNNPack:ia, mikä vähensi viipymättä 77,17 %:iin eli 4,38-kertaiseksi. Lisäksi toteutettiin LRU-välimuisti, jotta voitaisiin välttää tarpeettomat suoritukset ja vähentää viipymättä vielä lisää. Kokonaisuudessaan optimoinnit vähensivät WAF ML -suorituksen ajan ~81,90 %, 1519 mikrosekunnista 275 mikrosekuntiin, eli 5,5-kertaiseksi nopeammaksi.
blog.cloudflare.com
Making WAF ML models go brrr: saving decades of processing time
Create attached notes ...