RSS Towards Data Science - Medium フォロー Kubernetes上の並行LLMエージェント向けGPUタイムスライシング Kubernetes GPUタイムスライシングの隠れたマイクロアーキテクチャコストのシステムレベルでの詳細な分析と、Agentic AIワークロードのコロケーションにかかる実際のコスト。 AI and ML News on Bluesky @ai-news.at.thenote.app bsky.app GPU Time-Slicing for Concurrent LLM Agents on Kubernetes towardsdatascience.com