TheNote.app
Download_on_the_App_Store_Badge_US-UK_RGB_blk_4SVG_092917
RSS Ars Technica - 全コンテンツ
新しい研究、人気のAIベンチマークを操作したLM Arenaを非難
人気のAI・ヴァイブ・テストは、思っているほど公平ではないかもしれない。
arstechnica.com
New study accuses LM Arena of gaming its popular AI benchmark