VentureBeat 的 RSS 订阅 关注 停止实验室基准测试:Inclusion Arena 展示了 LLM 在生产环境中的表现 来自 Inclusion AI 和蚂蚁集团的研究人员提出了一个新的 LLM 排行榜,该榜单的数据来源于实际生产中的应用。 Stop benchmarking in the lab: Inclusion Arena shows how LLMs perform in production venturebeat.com AI and ML News on Bluesky @ai-news.at.thenote.app bsky.app