에이전트 워크플로우는 이동(transport)을 최우선 고려 사항으로 만듭니다. 여러 단계로 이루어지고 도구를 많이 사용하는 루프는 단일 단계 LLM 사용에서는 무시할 수 있는 오버헤드를 증폭시킵니다. 상태 유지(stateful continuation)는 오버헤드를 극적으로 줄입니다. 서버 측에서 컨텍스트를 캐싱하면 클라이언트가 전송하는 데이터를 80% 이상 줄이고 실행 시간을 15~29% 향상시킬 수 있습니다. - Anirudh Mendiratta
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
infoq.com
Article: Stateful Continuation for AI Agents: Why Transport Layers Now Matter
Create attached notes ...
