Производительность Vertex AI (PT) обновлена для обеспечения стабильной работы ИИ-агентов, что критически важно для бизнес-задач. Обновления предлагают расширенное разнообразие моделей, позволяя пользователям выбирать оптимальную модель из Vertex AI Model Garden. Поддерживаются мультимодальные инновации с улучшенной PT для обработки текста, изображений и видео. Операционная гибкость улучшена за счет краткосрочных контрактов и упреждающего планирования мощностей. PT теперь поддерживает модели Anthropic посредством прямой покупки и управления из консоли Vertex AI, упрощая рабочие процессы. Модели с открытым исходным кодом, такие как Llama 4, Qwen3 и другие, получают поддержку PT в рамках единой системы управления. Gemini Live API выигрывает от PT, предлагая гарантированную пропускную способность для требовательных мультимодальных потоков. Гибкие условия и варианты упреждающего планирования делают масштабирование более динамичным и эффективным. PT интегрируется с кэшированием для экономичной обработки длинных, повторяющихся контекстов. Несколько клиентов, таких как Reve AI, Knowunity и другие, уже получают выгоду от PT.
cloud.google.com
Your guide to Provisioned Throughput (PT) on Vertex AI
t.me
AI и ML Дайджест в Телеграмм канале @ai_ml_news_ru
Create attached notes ...
