RSS Блог об облаках

Объявление о доступности более мелких типов машин для A3 High VM

Организации все чаще используют GPU для запуска вывода на своих моделях ИИ/МЛ, и им нужна более тонкая настройка количества GPU в их виртуальных машинах, чтобы поддерживать низкие затраты при масштабировании с учетом спроса пользователей. Google Cloud предлагает виртуальные машины A3 High, оснащенные GPU NVIDIA H100 80GB, в нескольких типах машин, включая 1, 2, 4 и 8 GPU. Эти типы машин доступны через Vertex AI, Google Kubernetes Engine (GKE) и Google Compute Engine. Типы машин A3 High GPU с 1, 2 и 4 GPU также доступны в виде Spot VM и через Dynamic Workload Scheduler (DWS) в режиме Flex Start. GKE предоставляет экономически эффективную, высокомасштабируемую и открытую платформу для обучения и обслуживания рабочих нагрузок ИИ, а GKE Autopilot снижает операционные затраты и предлагает SLA на уровне рабочей нагрузки. Vertex AI - это полностью управляемая, унифицированная платформа для разработки и использования прогнозной и генеративной ИИ. Новые типы машин A3 High GPU позволяют клиентам Model Garden развертывать сотни открытых моделей экономически эффективно и с высокой производительностью. Клиенты могут использовать эти типы машин для снижения задержки и улучшения пользовательского опыта. Google Cloud стремится предоставить гибкость для запуска вывода для моделей ИИ и МЛ экономически эффективно и с отличной производительностью. Доступность виртуальных машин A3 High с использованием GPU NVIDIA H100 80GB в меньших типах машин обеспечивает необходимую гранулярность для масштабирования с учетом спроса пользователей при сохранении контроля над затратами.
cloud.google.com
Announcing smaller machine types for A3 High VMs
t.me
Читайте AI и ML Новости в Телеграмм канале @ai_ml_news_ru
Create attached notes ...