RSS Google 개발자 블로그 팔로우 Gemma를 사용한 추론: Dataflow와 vLLM vLLM의 연속 배치 처리와 Dataflow의 모델 관리자는 LLM 서빙을 최적화하고 배포 과정을 단순화하여 개발자가 고성능의 LLM 추론 파이프라인을 더 효율적으로 구축할 수 있도록 강력한 조합을 제공합니다. Inference with Gemma using Dataflow and vLLM developers.googleblog.com