В рандомизированном контролируемом исследовании с участием 1298 участников из общей выборки, результаты работы людей с помощью большой языковой модели (LLM) были заметно хуже, чем у самой LLM, при оценке десяти медицинских сценариев, ведущих к выявлению заболеваний и рекомендациям по лечению.
nature.com
Reliability of LLMs as medical assistants for the general public: a randomized preregistered study
