マイケル・ヌニェス / VentureBeat:
FrontierMathという新しいベンチマークが、AIモデルの高度な数学的推論能力を評価するために開発されました。現在のAIシステムは、その厳しい問題のうち2%以下しか解決できません。人工知能システムは、テキストを生成したり、画像を認識したり、さらには基本的な数学問題を解決することに優れていますが…
techmeme.com
FrontierMath, a new benchmark for evaluating AI model's advanced mathematical reasoning, shows current AI systems solve less than 2% of its challenging problems (Michael Nuñez/VentureBeat)
