TheNote.app
Download_on_the_App_Store_Badge_US-UK_RGB_blk_4SVG_092917
RSS 데이터 과학으로 - Medium
글로벌-MMLU를 사용하여 다국어 LLMs 평가하는 방법
파이썬에서 글로벌 대규모 다중 태스크 언어 이해 벤치마크에서 언어별 LLM 정확도 평가
towardsdatascience.com
How to Evaluate Multilingual LLMs With Global-MMLU