Vertex AI의 프로비저닝 처리량(PT) 가이드

Vertex AI의 프로비저닝 처리량(PT)이 비즈니스 요구에 필수적인 AI 에이전트의 일관된 성능을 보장하도록 업데이트되었습니다. 이번 업데이트는 모델 다양성을 높여 사용자가 Vertex AI 모델 가든에서 최적의 모델을 선택할 수 있도록 합니다. 텍스트, 이미지, 비디오 처리를 위한 PT 강화로 멀티모달 혁신을 지원합니다. 단기 계약 및 사전 용량 계획을 통해 운영 유연성이 향상되었습니다. PT는 이제 Vertex AI 콘솔에서 직접 구매 및 관리를 통해 Anthropic 모델을 지원하여 워크플로우를 간소화합니다. Llama 4, Qwen3 등 오픈 소스 모델도 통합된 거버넌스 프레임워크 하에 PT 지원을 받습니다. Gemini Live API는 PT의 이점을 활용하여 까다로운 멀티모달 스트림에 대한 처리량을 보장합니다. 유연한 약정 및 사전 예약 옵션을 통해 확장이 더욱 역동적이고 효율적으로 이루어집니다. PT는 캐싱과 통합되어 길고 반복적인 컨텍스트를 비용 효율적으로 처리합니다. Reve AI, Knowunity 등 여러 고객이 이미 PT의 이점을 누리고 있습니다.

cloud.google.com

Your guide to Provisioned Throughput (PT) on Vertex AI

bsky.app

AI and ML News on Bluesky @ai-news.at.thenote.app

RSS Hunter

2026-02-18

Create attached notes ...