Надежность больших языковых моделей в качестве медицинских помощников для широкой публики: рандомизированное предварительно зарегистрированное исследование

В рандомизированном контролируемом исследовании с участием 1298 участников из общей выборки, результаты работы людей с помощью большой языковой модели (LLM) были заметно хуже, чем у самой LLM, при оценке десяти медицинских сценариев, ведущих к выявлению заболеваний и рекомендациям по лечению.