RSS 정보Q

허깅 페이스, 투명한 모델 벤치마킹을 위한 커뮤니티 Evals 도입

허깅 페이스가 커뮤니티 평가(Community Evals)를 출시했습니다. 이 기능은 허브(Hub)의 벤치마크 데이터셋이 자체 리더보드를 호스팅하고, 모델 저장소에서 평가 결과를 자동으로 수집할 수 있도록 합니다. - 다니엘 도밍게즈(Daniel Dominguez)
favicon
infoq.com
Hugging Face Introduces Community Evals for Transparent Model Benchmarking
favicon
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app