FrontierMathは、AIモデルの高度な数学的推理能力を評価するための新しいベンチマークで、現在のAIシステムがこの挑戦的な問題のうちわずか2%以下しか解決できないことを示しています（Michael Nuñez/VentureBeat）

マイケル・ヌニェス / VentureBeat: FrontierMathという新しいベンチマークが、AIモデルの高度な数学的推論能力を評価するために開発されました。現在のAIシステムは、その厳しい問題のうち2％以下しか解決できません。人工知能システムは、テキストを生成したり、画像を認識したり、さらには基本的な数学問題を解決することに優れていますが…