RSS VentureBeat 팔로우 실험실에서의 벤치마킹은 그만: LLM의 실제 성능을 보여주는 인클루전 아레나 Inclusion AI와 Ant Group의 연구원들은 실제 서비스 중인 앱에서 데이터를 가져오는 새로운 LLM 리더보드를 제안했습니다. AI and ML News on Bluesky @ai-news.at.thenote.app bsky.app Stop benchmarking in the lab: Inclusion Arena shows how LLMs perform in production venturebeat.com