已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Large language models to identify social determinants of health in electronic health records

健康的社会决定因素 医疗保健 医学 政治学 法学
作者
Marco Guevara-Vega,Shan Chen,Spencer A. Thomas,Tafadzwa L. Chaunzwa,Idalid Franco,Benjamin H. Kann,Shalini Moningi,Jack M. Qian,Madeleine Goldstein,Susan Harper,Hugo J.W.L. Aerts,Paul J. Catalano,Guergana Savova,Raymond H. Mak,Danielle S. Bitterman
出处
期刊:npj digital medicine [Nature Portfolio]
卷期号:7 (1) 被引量:101
标识
DOI:10.1038/s41746-023-00970-0
摘要

Abstract Social determinants of health (SDoH) play a critical role in patient outcomes, yet their documentation is often missing or incomplete in the structured data of electronic health records (EHRs). Large language models (LLMs) could enable high-throughput extraction of SDoH from the EHR to support research and clinical care. However, class imbalance and data limitations present challenges for this sparsely documented yet critical information. Here, we investigated the optimal methods for using LLMs to extract six SDoH categories from narrative text in the EHR: employment, housing, transportation, parental status, relationship, and social support. The best-performing models were fine-tuned Flan-T5 XL for any SDoH mentions (macro-F1 0.71), and Flan-T5 XXL for adverse SDoH mentions (macro-F1 0.70). Adding LLM-generated synthetic data to training varied across models and architecture, but improved the performance of smaller Flan-T5 models (delta F1 + 0.12 to +0.23). Our best-fine-tuned models outperformed zero- and few-shot performance of ChatGPT-family models in the zero- and few-shot setting, except GPT4 with 10-shot prompting for adverse SDoH. Fine-tuned models were less likely than ChatGPT to change their prediction when race/ethnicity and gender descriptors were added to the text, suggesting less algorithmic bias ( p < 0.05). Our models identified 93.8% of patients with adverse SDoH, while ICD-10 codes captured 2.0%. These results demonstrate the potential of LLMs in improving real-world evidence on SDoH and assisting in identifying patients who could benefit from resource support.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
心随以动完成签到 ,获得积分10
刚刚
Diamond完成签到 ,获得积分10
2秒前
哈h发布了新的文献求助10
3秒前
zz发布了新的文献求助10
3秒前
光亮小蚂蚁完成签到 ,获得积分10
3秒前
量子星尘发布了新的文献求助10
6秒前
白子墨发布了新的文献求助10
7秒前
22完成签到 ,获得积分10
8秒前
9秒前
修辛完成签到 ,获得积分10
10秒前
zzz完成签到,获得积分10
12秒前
夜乡晨完成签到 ,获得积分10
13秒前
时生完成签到 ,获得积分10
15秒前
小高发布了新的文献求助10
15秒前
16秒前
万事屋完成签到 ,获得积分10
16秒前
zz完成签到,获得积分10
17秒前
单薄乐珍完成签到 ,获得积分0
17秒前
阿满完成签到 ,获得积分10
18秒前
西蓝花香菜完成签到 ,获得积分10
19秒前
隐形曼青应助哈h采纳,获得10
21秒前
21秒前
quyu发布了新的文献求助10
21秒前
GU发布了新的文献求助30
22秒前
23秒前
zzz发布了新的文献求助10
24秒前
笨笨的荧荧完成签到 ,获得积分10
25秒前
华展完成签到,获得积分20
25秒前
MarvelerYB3完成签到,获得积分10
26秒前
威武的翠安完成签到 ,获得积分10
26秒前
27秒前
daihq3完成签到,获得积分10
28秒前
ktw完成签到,获得积分10
28秒前
白子墨发布了新的文献求助10
28秒前
科研通AI2S应助GU采纳,获得10
30秒前
小二郎应助daihq3采纳,获得10
32秒前
ifegiugfieugfig完成签到,获得积分10
33秒前
辣椒完成签到 ,获得积分10
36秒前
君知完成签到,获得积分10
36秒前
konosuba完成签到,获得积分0
37秒前
高分求助中
Africanfuturism: African Imaginings of Other Times, Spaces, and Worlds 3000
Les Mantodea de Guyane: Insecta, Polyneoptera [The Mantids of French Guiana] 2000
Electron microscopy study of magnesium hydride (MgH2) for Hydrogen Storage 1000
Structural Equation Modeling of Multiple Rater Data 700
 Introduction to Comparative Public Administration Administrative Systems and Reforms in Europe, Third Edition 3rd edition 590
全球膝关节骨性关节炎市场研究报告 555
Exhibiting Chinese Art in Asia: Histories, Politics and Practices 540
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3889219
求助须知:如何正确求助?哪些是违规求助? 3431468
关于积分的说明 10773835
捐赠科研通 3156443
什么是DOI,文献DOI怎么找? 1743120
邀请新用户注册赠送积分活动 841514
科研通“疑难数据库(出版商)”最低求助积分说明 785966