AI基准测试的争论已经扩展到宝可梦

甚至 Pokémon 也无法幸免于 AI 基准测试争议。上周，一篇在 X 上的帖子变得病毒式传播，声称 Google 最新的 Gemini 模型在原版 Pokémon 视频游戏三部曲中超越了 Anthropic 的旗舰 Claude 模型。据报道，Gemini 已经在开发者的 Twitch 直播中到达了 Lavender Town；而 Claude 至今仍然卡在 Mount Moon […]