RSS VentureBeat フォロー ラボでのベンチマークはもうやめよう:Inclusion ArenaがLLMのプロダクションでのパフォーマンスを示す Inclusion AIとAnt Groupの研究者たちは、実際の運用中のアプリからデータを取得する新しいLLMリーダーボードを提案しました。 Stop benchmarking in the lab: Inclusion Arena shows how LLMs perform in production venturebeat.com AI and ML News on Bluesky @ai-news.at.thenote.app bsky.app