RSS 해커누

대규모 언어 모델의 추론 과정 및 KV-Cache 구조

LLM 추론의 기초 개념을 탐색하여, 프리필 및 디코딩 단계, 트랜스포머 아키텍처, KV 캐시의 상세 구조 및 용어를 포함합니다.
favicon
bsky.app
Hacker & Security News on Bluesky @hacker.at.thenote.app
favicon
hackernoon.com
Large Language Models: Inference Process and KV-Cache Structure
Create attached notes ...