RSS 技术内幕

Anthropic 推出 BioMysteryBench,以测试 Claude 的生物信息学能力,并将其与人类专家进行对比;Anthropic 表示,Mythos 解决了困扰专家的 23 个问题中的约 30%(Anthropic)

Anthropic:Anthropic 推出 BioMysteryBench,以测试 Claude 的生物信息学能力,并将其与人类专家进行对比。Anthropic 表示,Mythos 解决了困扰专家的 23 个问题中的约 30%。在此篇帖子中,发现团队的研究员 Brianna 分享了一次近期生物信息学基准测试的结果。
favicon
techmeme.com
Anthropic unveils BioMysteryBench to test Claude's bioinformatics skills against human experts, and says Mythos solved ~30% of 23 questions that stumped experts (Anthropic)
Create attached notes ...