清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Large Language Models for Diagnosing Focal Liver Lesions From CT/MRI Reports: A Comparative Study With Radiologists

医学诊断 组织病理学 回顾性队列研究 医学 鉴别诊断 放射科 磁共振成像 病理
作者
Liuji Sheng,Yidi Chen,Hong Wei,Feng Che,Yingyi Wu,Qin Qin,Chongtu Yang,Yanshu Wang,Jingwen Peng,Mustafa R. Bashir,Maxime Ronot,Bin Song,Hanyu Jiang
出处
期刊:Liver International [Wiley]
卷期号:45 (6) 被引量:1
标识
DOI:10.1111/liv.70115
摘要

ABSTRACT Background & Aims Whether large language models (LLMs) could be integrated into the diagnostic workflow of focal liver lesions (FLLs) remains unclear. We aimed to investigate two generic LLMs (ChatGPT‐4o and Gemini) regarding their diagnostic accuracies referring to the CT/MRI reports, compared to and combined with radiologists of different experience levels. Methods From April 2022 to April 2024, this single‐center retrospective study included consecutive adult patients who underwent contrast‐enhanced CT/MRI for single FLL and subsequent histopathologic examination. The LLMs were prompted by clinical information and the “findings” section of radiology reports three times to provide differential diagnoses in the descending order of likelihood, with the first considered the final diagnosis. In the research setting, six radiologists (three junior and three middle‐level) independently reviewed the CT/MRI images and clinical information in two rounds (first alone, then with LLM assistance). In the clinical setting, diagnoses were retrieved from the “impressions” section of radiology reports. Diagnostic accuracy was investigated against histopathology. Results 228 patients (median age, 59 years; 155 males) with 228 FLLs (median size, 3.6 cm) were included. Regarding the final diagnosis, the accuracy of two‐step ChatGPT‐4o (78.9%) was higher than single‐step ChatGPT‐4o (68.0%, p < 0.001) and single‐step Gemini (73.2%, p = 0.004), similar to real‐world radiology reports (80.0%, p = 0.34) and junior radiologists (78.9%–82.0%; p ‐values, 0.21 to > 0.99), but lower than middle‐level radiologists (84.6%–85.5%; p ‐values, 0.001 to 0.02). No incremental diagnostic value of ChatGPT‐4o was observed for any radiologist ( p ‐values, 0.63 to > 0.99). Conclusion Two‐step ChatGPT‐4o showed matching accuracies to real‐world radiology reports and junior radiologists for diagnosing FLLs but was less accurate than middle‐level radiologists and demonstrated little incremental diagnostic value.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
18秒前
大医仁心完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
雪白小丸子完成签到,获得积分10
1分钟前
科研通AI6应助Eileen采纳,获得10
1分钟前
WWW完成签到 ,获得积分10
2分钟前
2分钟前
陈无敌完成签到 ,获得积分10
3分钟前
3分钟前
科研通AI2S应助科研通管家采纳,获得10
4分钟前
yys完成签到,获得积分10
4分钟前
紫熊发布了新的文献求助10
5分钟前
紫熊完成签到,获得积分10
6分钟前
bkagyin应助科研通管家采纳,获得10
6分钟前
小蘑菇应助科研通管家采纳,获得30
6分钟前
6分钟前
6分钟前
Lucas应助lzmcsp采纳,获得10
6分钟前
阿凯完成签到 ,获得积分10
7分钟前
7分钟前
甫寸完成签到 ,获得积分10
8分钟前
别吃我的鱼完成签到,获得积分10
8分钟前
萝卜猪完成签到,获得积分10
9分钟前
9分钟前
10分钟前
lzmcsp发布了新的文献求助10
10分钟前
lzmcsp完成签到,获得积分10
10分钟前
10分钟前
xiaolang2004给xiaolang2004的求助进行了留言
10分钟前
vbnn完成签到 ,获得积分10
11分钟前
小脸红扑扑完成签到 ,获得积分10
13分钟前
小宏完成签到,获得积分10
13分钟前
guangshuang完成签到 ,获得积分10
14分钟前
14分钟前
xiaolang2004发布了新的文献求助10
14分钟前
康康完成签到 ,获得积分10
14分钟前
灿烂而孤独的八戒完成签到 ,获得积分0
15分钟前
激动的似狮完成签到,获得积分10
15分钟前
传奇3应助Xuancheng_SINH采纳,获得10
15分钟前
高分求助中
(应助此贴封号)【重要!!请各位详细阅读】【科研通的精品贴汇总】 10000
Pediatric Injectable Drugs 500
Instant Bonding Epoxy Technology 500
Methodology for the Human Sciences 500
ASHP Injectable Drug Information 2025 Edition 400
DEALKOXYLATION OF β-CYANOPROPIONALDEYHDE DIMETHYL ACETAL 400
March's Advanced Organic Chemistry: Reactions, Mechanisms, and Structure 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4377541
求助须知:如何正确求助?哪些是违规求助? 3873072
关于积分的说明 12068329
捐赠科研通 3516192
什么是DOI,文献DOI怎么找? 1929517
邀请新用户注册赠送积分活动 971107
科研通“疑难数据库(出版商)”最低求助积分说明 869767