清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

LLM-assisted systematic review of large language models in clinical medicine

梅德林 任务(项目管理) 临床试验 替代医学 医学 等值 循证医学 医学教育 心理学 随机对照试验 比例(比率) 样品(材料) 知识库 家庭医学 临床实习 临床研究设计 依赖关系(UML) 现实主义 精密医学 临床决策 英语 可读性 系统回顾 数据科学 个性化医疗 计算机科学 认知心理学 样本量测定 研究设计
作者
Sully F. Chen,Anton Alyakin,Andreas Seas,Eunice Yang,Jinhyuk Choi,Jin Vivian Lee,Amelia L. Chen,Pranav I Warman,Rochelle Bitolas,Robert Steele,Daniel A. Alber,Eric K. Oermann
出处
期刊:Nature Medicine [Nature Portfolio]
卷期号:32 (3): 1152-1159 被引量:20
标识
DOI:10.1038/s41591-026-04229-5
摘要

Clinical evaluations of large language models (LLMs) have rapidly expanded since 2022, yet their evidence base remains opaque. The overwhelming volume of studies creates challenges for manual curation and review. However, LLMs themselves offer the scalability and capability to evaluate the ever-growing evidence base. This LLM-assisted review identified 4,609 peer-reviewed studies in clinical medicine between January 2022 and September 2025, equating to roughly 3.2 papers per day. Only 1,048 studies used real-world patient data and of these only 19 were prospective randomized trials; most addressed simulated scenarios (n = 1,857) or exam-style tasks (n = 1,704). ChatGPT and related OpenAI models constitute 65.7% of evaluated models, with Gemini/Bard a distant second constituting 13.1% of evaluated models. Patient-facing communication and education comprised 17% of tasks, followed by knowledge retrieval, and education and assessment simulation. Across 1,046 head-to-head comparisons, LLMs outperformed humans in 33% of comparisons, with a strong dependency on task realism and level of training. At least 25% of studies had sample sizes less than 30. Despite the growth of LLMs in medicine, rigorous, patient-centered evidence remains scarce, underscoring the need for larger prospective trials before clinical adoption.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
寒冷的月亮完成签到 ,获得积分10
11秒前
Abdurrahman完成签到,获得积分10
34秒前
41秒前
phobeeee完成签到 ,获得积分10
43秒前
上官若男应助Kevin采纳,获得100
48秒前
dgjirhf完成签到 ,获得积分10
51秒前
1分钟前
哈哈发布了新的文献求助10
1分钟前
1分钟前
qq完成签到 ,获得积分0
1分钟前
2分钟前
loii完成签到,获得积分0
2分钟前
2分钟前
2分钟前
2分钟前
zhangchen123发布了新的文献求助10
2分钟前
科研通AI2S应助科研通管家采纳,获得10
2分钟前
研友_VZG7GZ应助科研通管家采纳,获得10
2分钟前
Copyright应助科研通管家采纳,获得10
2分钟前
3分钟前
笑傲完成签到,获得积分10
3分钟前
cadcae完成签到,获得积分10
3分钟前
旺旺完成签到,获得积分10
4分钟前
4分钟前
zj完成签到 ,获得积分10
4分钟前
Kevin发布了新的文献求助100
4分钟前
单身的芫完成签到,获得积分10
4分钟前
4分钟前
4分钟前
大模型应助科研通管家采纳,获得10
4分钟前
miki完成签到 ,获得积分10
5分钟前
whuhustwit完成签到,获得积分10
5分钟前
zs完成签到 ,获得积分10
5分钟前
zhangguo完成签到 ,获得积分10
6分钟前
沉默念瑶完成签到 ,获得积分10
6分钟前
充电宝应助ivan采纳,获得10
6分钟前
小超完成签到,获得积分10
6分钟前
邓洁宜完成签到,获得积分10
6分钟前
7分钟前
7分钟前
高分求助中
论现代体育科学研究的方法学特征 1000
Invited Discussant 63O and 64O 1000
Ideology and Meaning-Making under the Putin Regime 750
Safety Pharmacology 500
《KNN基无铅压电陶瓷电学性能优化与物理机理研究》 500
Petrology and Plate Tectonics 500
A Handbook of User Experience Research & Design in Libraries 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 计算机科学 化学工程 生物化学 物理 内科学 复合材料 催化作用 光电子学 物理化学 电极 细胞生物学 基因 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6911610
求助须知:如何正确求助?哪些是违规求助? 8604010
关于积分的说明 18258852
捐赠科研通 6320839
什么是DOI,文献DOI怎么找? 3066735
关于科研通互助平台的介绍 2092551
邀请新用户注册赠送积分活动 2044029