Apparate — это комплексная система, которая автоматически интегрирует ранние выходы в модели и управляет их работой на протяжении всего процесса вывода. Ее главная цель — оптимизировать задержки по каждому запросу, соблюдая строгие ограничения по точности и производительности. Кроме того, Apparate вводит два параметра: агрессивность и Os’, которые работают поверх существующих платформ обслуживания.
hackernoon.com
Apparate: Early-Exit Models for ML Latency and Throughput Optimization - Design
Create attached notes ...