RSS Der Cloudflare Blog
Folgen
Workers AI erhält einen Geschwindigkeitsboost, Unterstützung für Stapelarbeit, mehr LoRAs, neue Modelle und ein aktualisiertes Dashboard
Wir haben Workers AI-Inferenz mit spekulativer Dekodierung und Prefix-Caching noch schneller gemacht. Nutzen Sie unsere neue Batch-Inferenz, um große Anfragevolumina nahtlos zu bearbeiten.