RSS DZone.com

Построение бюджетов ошибок SRE для рабочих нагрузок AI/ML: практическая структура

Вот проблема, с которой я сталкиваюсь слишком часто: ваша рекомендательная система работает, выдает результаты за миллисекунды и соответствует всем своим инфраструктурным SLA. В мире панелей мониторинга все выглядит радужно. Но вовлеченность упала на 40%, потому что ваша модель была бесполезной в течение нескольких недель. С точки зрения вашего традиционного бюджета ошибок? Вы в шоколаде. По мнению вашей продуктовой команды? Система сломана.
favicon
dzone.com
Building SRE Error Budgets for AI/ML Workloads: A Practical Framework
Create attached notes ...