Vertex AI의 프로비저닝 처리량(PT)이 비즈니스 요구에 필수적인 AI 에이전트의 일관된 성능을 보장하도록 업데이트되었습니다. 이번 업데이트는 모델 다양성을 높여 사용자가 Vertex AI 모델 가든에서 최적의 모델을 선택할 수 있도록 합니다. 텍스트, 이미지, 비디오 처리를 위한 PT 강화로 멀티모달 혁신을 지원합니다. 단기 계약 및 사전 용량 계획을 통해 운영 유연성이 향상되었습니다. PT는 이제 Vertex AI 콘솔에서 직접 구매 및 관리를 통해 Anthropic 모델을 지원하여 워크플로우를 간소화합니다. Llama 4, Qwen3 등 오픈 소스 모델도 통합된 거버넌스 프레임워크 하에 PT 지원을 받습니다. Gemini Live API는 PT의 이점을 활용하여 까다로운 멀티모달 스트림에 대한 처리량을 보장합니다. 유연한 약정 및 사전 예약 옵션을 통해 확장이 더욱 역동적이고 효율적으로 이루어집니다. PT는 캐싱과 통합되어 길고 반복적인 컨텍스트를 비용 효율적으로 처리합니다. Reve AI, Knowunity 등 여러 고객이 이미 PT의 이점을 누리고 있습니다.
cloud.google.com
Your guide to Provisioned Throughput (PT) on Vertex AI
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
Create attached notes ...
