일반 대중을 위한 의료 보조자로서 LLM(대규모 언어 모델)의 신뢰성: 무작위 사전 등록 연구

일반 표본에서 1,298명의 참가자를 대상으로 한 무작위 대조 연구에서, 10가지 질병 식별 및 치료 권고 시나리오를 평가했을 때, 대규모 언어 모델(LLM)의 도움을 받은 인간의 수행 능력은 LLM 단독 수행 능력에 비해 현저히 떨어지는 것으로 나타났습니다.