A study of generative large language model for medical research and healthcare

可读性 热情 医疗保健 人工智能 考试(生物学) 相关性(法律) 计算机科学 自然语言处理 比例(比率) 生成语法 数据科学 心理学 政治学 地理 社会心理学 古生物学 地图学 法学 生物 程序设计语言
作者
Peng Cheng,Xi Yang,Aokun Chen,Kaleb E. Smith,Nima PourNejatian,Anthony Costa,Cheryl Martin,Mona G. Flores,Ying Zhang,Tanja Magoč,Gloria Lipori,Duane A. Mitchell,Naykky Singh Ospina,Mustafa M. Ahmed,William R. Hogan,Louis Shenkman,Yi Guo,Jiang Bian,Yonghui Wu
出处
期刊:npj digital medicine [Springer Nature]
卷期号:6 (1) 被引量:17
标识
DOI:10.1038/s41746-023-00958-w
摘要

There are enormous enthusiasm and concerns in applying large language models (LLMs) to healthcare. Yet current assumptions are based on general-purpose LLMs such as ChatGPT, which are not developed for medical use. This study develops a generative clinical LLM, GatorTronGPT, using 277 billion words of text including (1) 82 billion words of clinical text from 126 clinical departments and approximately 2 million patients at the University of Florida Health and (2) 195 billion words of diverse general English text. We train GatorTronGPT using a GPT-3 architecture with up to 20 billion parameters and evaluate its utility for biomedical natural language processing (NLP) and healthcare text generation. GatorTronGPT improves biomedical natural language processing. We apply GatorTronGPT to generate 20 billion words of synthetic text. Synthetic NLP models trained using synthetic text generated by GatorTronGPT outperform models trained using real-world clinical text. Physicians' Turing test using 1 (worst) to 9 (best) scale shows that there are no significant differences in linguistic readability (p = 0.22; 6.57 of GatorTronGPT compared with 6.93 of human) and clinical relevance (p = 0.91; 7.0 of GatorTronGPT compared with 6.97 of human) and that physicians cannot differentiate them (p < 0.001). This study provides insights into the opportunities and challenges of LLMs for medical research and healthcare.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
脑洞疼应助0411345采纳,获得10
1秒前
5秒前
6秒前
6秒前
小黑完成签到 ,获得积分10
9秒前
老西瓜完成签到,获得积分10
9秒前
芋你呀完成签到,获得积分10
9秒前
轻松海云给轻松海云的求助进行了留言
10秒前
筱尤发布了新的文献求助10
11秒前
天下发布了新的文献求助10
11秒前
111完成签到,获得积分10
11秒前
正丁基锂发布了新的文献求助10
12秒前
旧雨新知完成签到 ,获得积分10
14秒前
18秒前
CipherSage应助单于明辉采纳,获得10
21秒前
27秒前
scot应助谨慎的荷花采纳,获得10
28秒前
29秒前
keyanzhang完成签到 ,获得积分10
30秒前
auraLyV完成签到,获得积分10
30秒前
tafffya完成签到 ,获得积分10
33秒前
小天使发布了新的文献求助10
33秒前
英俊的铭应助yuan采纳,获得10
34秒前
wjswift完成签到,获得积分10
35秒前
打打应助正丁基锂采纳,获得10
37秒前
txmjsn完成签到,获得积分10
40秒前
Antil完成签到,获得积分10
40秒前
宣依云完成签到 ,获得积分10
40秒前
土拨鼠完成签到,获得积分10
41秒前
蓝桉完成签到 ,获得积分10
42秒前
Yogita完成签到,获得积分10
44秒前
lieribingshu完成签到 ,获得积分10
47秒前
trf应助Tanya采纳,获得10
47秒前
筱尤完成签到 ,获得积分10
48秒前
貔貅完成签到 ,获得积分10
49秒前
50秒前
文献查找完成签到,获得积分10
52秒前
tylerconan完成签到 ,获得积分10
53秒前
单于明辉发布了新的文献求助10
54秒前
小刘爱读文献完成签到 ,获得积分10
55秒前
高分求助中
Un calendrier babylonien des travaux, des signes et des mois: Séries iqqur îpuš 1036
Sustainable Land Management: Strategies to Cope with the Marginalisation of Agriculture 1000
Corrosion and Oxygen Control 600
Python Programming for Linguistics and Digital Humanities: Applications for Text-Focused Fields 500
Heterocyclic Stilbene and Bibenzyl Derivatives in Liverworts: Distribution, Structures, Total Synthesis and Biological Activity 500
重庆市新能源汽车产业大数据招商指南(两链两图两池两库两平台两清单两报告) 400
Division and square root. Digit-recurrence algorithms and implementations 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2546350
求助须知:如何正确求助?哪些是违规求助? 2175744
关于积分的说明 5600595
捐赠科研通 1896474
什么是DOI,文献DOI怎么找? 946322
版权声明 565379
科研通“疑难数据库(出版商)”最低求助积分说明 503557