재귀 혼합은 추론 속도를 2배 빠르게 만듭니다 — 구현 방법을 소개합니다

Mixture-of-Recursions (MoR)는 성능 저하 없이 LLM 추론 비용과 메모리 사용량을 절감할 수 있는 새로운 AI 아키텍처입니다.