RSS TechCrunch

AIのベンチマークに関する論争がポケモンにまで及んだ

「ポケモン」もAIのベンチマークに関する論争から安全ではないらしい。先週、X(元ツイッター)に投稿された記事が急に人気になり、Googleの最新のGeminiモデルが、Anthropicの主力モデルであるClaudeモデルを、オリジナルのポケモンビデオゲーム三部作で上回ったと主張していた。Geminiは、開発者のTwitchストリームでラベンダータウンに到達していたというが、Claudeは最近のところムーンマウンテンで足止めされていたそうだ[…]。
favicon
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
favicon
techcrunch.com
Debates over AI benchmarking have reached Pokémon
Create attached notes ...