일반 표본에서 1,298명의 참가자를 대상으로 한 무작위 대조 연구에서, 10가지 질병 식별 및 치료 권고 시나리오를 평가했을 때, 대규모 언어 모델(LLM)의 도움을 받은 인간의 수행 능력은 LLM 단독 수행 능력에 비해 현저히 떨어지는 것으로 나타났습니다.
nature.com
Reliability of LLMs as medical assistants for the general public: a randomized preregistered study
Create attached notes ...
