科技博客(TechCrunch)RSS

AI基准测试的争论已经扩展到宝可梦

甚至 Pokémon 也无法幸免于 AI 基准测试争议。上周,一篇在 X 上的帖子变得病毒式传播,声称 Google 最新的 Gemini 模型在原版 Pokémon 视频游戏三部曲中超越了 Anthropic 的旗舰 Claude 模型。据报道,Gemini 已经在开发者的 Twitch 直播中到达了 Lavender Town;而 Claude 至今仍然卡在 Mount Moon […]
techcrunch.com
Debates over AI benchmarking have reached Pokémon
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
Create attached notes ...