TurboSparse Mobile: PowerInfer-2에서 Mixtral 추론 속도 22배 향상

TurboSparse-Mixtral-47B를 사용하여 모바일에서 대규모 LLM(언어 모델)을 배포하세요. PowerInfer-2가 극심한 희소성을 활용하여 llama.cpp보다 22.2배 속도를 향상시키는 방법을 알아보세요.