Information extraction from weakly structured radiological reports with natural language queries

放射性武器 医学 神经组阅片室 介入放射学 信息抽取 情报检索 放射科 计算机科学 神经学 精神科
作者
Amin Dada,Tim Leon Ufer,Moon Kim,Max Hasin,Nicola Spieker,Michael Forsting,Felix Nensa,Jan Egger,Jens Kleesiek
出处
期刊:European Radiology [Springer Science+Business Media]
卷期号:34 (1): 330-337 被引量:6
标识
DOI:10.1007/s00330-023-09977-3
摘要

Abstract Objectives Provide physicians and researchers an efficient way to extract information from weakly structured radiology reports with natural language processing (NLP) machine learning models. Methods We evaluate seven different German bidirectional encoder representations from transformers (BERT) models on a dataset of 857,783 unlabeled radiology reports and an annotated reading comprehension dataset in the format of SQuAD 2.0 based on 1223 additional reports. Results Continued pre-training of a BERT model on the radiology dataset and a medical online encyclopedia resulted in the most accurate model with an F1-score of 83.97% and an exact match score of 71.63% for answerable questions and 96.01% accuracy in detecting unanswerable questions. Fine-tuning a non-medical model without further pre-training led to the lowest-performing model. The final model proved stable against variation in the formulations of questions and in dealing with questions on topics excluded from the training set. Conclusions General domain BERT models further pre-trained on radiological data achieve high accuracy in answering questions on radiology reports. We propose to integrate our approach into the workflow of medical practitioners and researchers to extract information from radiology reports. Clinical relevance statement By reducing the need for manual searches of radiology reports, radiologists’ resources are freed up, which indirectly benefits patients. Key Points • BERT models pre-trained on general domain datasets and radiology reports achieve high accuracy (83.97% F1-score) on question-answering for radiology reports. • The best performing model achieves an F1-score of 83.97% for answerable questions and 96.01% accuracy for questions without an answer. • Additional radiology-specific pretraining of all investigated BERT models improves their performance. Graphical Abstract
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
yy-完成签到,获得积分10
刚刚
fafafasci完成签到,获得积分10
1秒前
语行完成签到,获得积分10
1秒前
1秒前
1秒前
端庄书雁发布了新的文献求助10
1秒前
漂南仰发布了新的文献求助10
2秒前
zzxxll发布了新的文献求助10
3秒前
lu发布了新的文献求助10
3秒前
koco完成签到,获得积分10
3秒前
啰啰发布了新的文献求助10
3秒前
yimi完成签到,获得积分10
4秒前
盐碱地杂草完成签到 ,获得积分10
4秒前
5秒前
qianqian_wang发布了新的文献求助10
5秒前
yy-发布了新的文献求助10
5秒前
李爱国应助不知道叫什么采纳,获得10
6秒前
7秒前
7秒前
一颗肉丸发布了新的文献求助30
8秒前
博弈春秋完成签到,获得积分10
8秒前
反杀闰土的猹完成签到,获得积分10
8秒前
labor完成签到,获得积分10
8秒前
9秒前
So1arAy完成签到,获得积分10
9秒前
10秒前
10秒前
11秒前
番茄发布了新的文献求助10
11秒前
哈哈哈发布了新的文献求助10
11秒前
12秒前
鱼鱼发布了新的文献求助80
12秒前
Owen应助hh采纳,获得10
12秒前
张本丁完成签到,获得积分10
13秒前
小罗黑的发布了新的文献求助10
13秒前
13秒前
14秒前
KK发布了新的文献求助30
14秒前
山山而川完成签到,获得积分10
14秒前
小白完成签到 ,获得积分10
14秒前
高分求助中
(禁止应助)【重要!!请各位详细阅读】【科研通的精品贴汇总】 10000
Functional High Entropy Alloys and Compounds 1000
Building Quantum Computers 1000
Apiaceae Himalayenses. 2 500
Molecular Cloning: A Laboratory Manual (Fourth Edition) 500
Social Epistemology: The Niches for Knowledge and Ignorance 500
优秀运动员运动寿命的人文社会学因素研究 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4239217
求助须知:如何正确求助?哪些是违规求助? 3773003
关于积分的说明 11848979
捐赠科研通 3428784
什么是DOI,文献DOI怎么找? 1881776
邀请新用户注册赠送积分活动 933936
科研通“疑难数据库(出版商)”最低求助积分说明 840616