RSS 테크메메

Anthropic, Claude의 생물정보학 기술을 인간 전문가와 비교 테스트하기 위한 BioMysteryBench를 공개하고, Mythos가 전문가들을 좌절시킨 23개 질문 중 약 30%를 해결했다고 발표했습니다 (Anthropic)

Follow
Anthropic: Anthropic, Claude의 생물정보학 기술을 인간 전문가와 비교 테스트하기 위한 BioMysteryBench를 공개하고, Mythos가 전문가들도 해결하지 못한 23개 질문 중 약 30%를 해결했다고 밝힘 — 이 게시물에서 디스커버리 팀의 연구원인 Brianna가 최근 생물정보학 벤치마킹 노력의 결과를 공유합니다.
favicon
techmeme.com
Anthropic unveils BioMysteryBench to test Claude's bioinformatics skills against human experts, and says Mythos solved ~30% of 23 questions that stumped experts (Anthropic)
Create attached notes ...