RSS Techmeme

Anthropic представляет BioMysteryBench для проверки навыков Клода в области биоинформатики в сравнении с экспертами-людьми и заявляет, что Mythos решил около 30% из 23 вопросов, которые поставили в тупик экспертов (Anthropic).

Follow
Anthropic: Anthropic представляет BioMysteryBench для проверки навыков Клода в области биоинформатики в сравнении с экспертами-людьми, и заявляет, что Mythos решил ~30% из 23 вопросов, которые поставили в тупик экспертов — В этом посте Брианна, исследователь из команды разработки, делится результатами недавнего тестирования в области биоинформатики.
favicon
techmeme.com
Anthropic unveils BioMysteryBench to test Claude's bioinformatics skills against human experts, and says Mythos solved ~30% of 23 questions that stumped experts (Anthropic)
Create attached notes ...