Infusing Multi-Hop Medical Knowledge Into Smaller Language Models for Biomedical Question Answering

计算机科学 答疑 Hop(电信) 医学知识 自然语言处理 人工智能 情报检索 数据科学 计算机网络 医学 医学教育
作者
Jing Chen,Zhihua Wei,Wen Shen,Rui Shang
出处
期刊:IEEE Journal of Biomedical and Health Informatics [Institute of Electrical and Electronics Engineers]
卷期号:: 1-13
标识
DOI:10.1109/jbhi.2025.3547444
摘要

MedQA-USMLE is a challenging biomedical question answering (BQA) task, as its questions typically involve multi-hop reasoning. To solve this task, BQA systems should possess substantial medical professional knowledge and strong medical reasoning capabilities. While state-of-the-art larger language models, such as Med-PaLM 2, have overcome this challenge, smaller language models (SLMs) still struggle with it. To bridge this gap, we introduces a multi-hop medical knowledge infusion (MHMKI) procedure to endow SLMs with medical reasoning capabilities. Specifically, we categorize MedQA-USMLE questions into distinct reasoning types, then create pre-training instances tailored to each type of questions with the semi-structured information and hyperlinks of Wikipedia articles. To enable SLMs to efficiently capture the multi-hop knowledge embedded in these instances, we design a reasoning chain masked language model for further pre-training of BERT models. Moreover, we transform these pre-training instances into a combined question answering dataset for intermediate fine-tuning of GPT models. We evaluate MHMKI with six SLMs (three BERT models and three GPT models) across five datasets spanning three BQA tasks. Results show that MHMKI benefits SLMs in nearly all tasks, especially those requiring multi-hop reasoning. For instance, the accuracy of MedQA-USMLE shows a significant increase of 5.3% on average.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
123完成签到 ,获得积分10
2秒前
肖婷发布了新的文献求助20
3秒前
3秒前
pure123完成签到 ,获得积分10
4秒前
bing完成签到 ,获得积分10
4秒前
小美发布了新的文献求助10
5秒前
JamesPei应助假面绅士采纳,获得10
5秒前
7秒前
量子星尘发布了新的文献求助30
7秒前
9秒前
月月完成签到,获得积分10
9秒前
9秒前
9秒前
1997张三发布了新的文献求助30
9秒前
10秒前
12秒前
坦率紫槐应助路痴采纳,获得10
13秒前
YOYOYO发布了新的文献求助20
13秒前
小邓发布了新的文献求助30
14秒前
14秒前
刘晶发布了新的文献求助10
14秒前
ww完成签到,获得积分10
14秒前
琪琪发布了新的文献求助10
15秒前
阿豪发布了新的文献求助10
16秒前
17秒前
17秒前
月月发布了新的文献求助10
18秒前
BareBear应助我很好采纳,获得10
19秒前
CKJ完成签到,获得积分10
20秒前
21秒前
发财的Mei完成签到 ,获得积分10
22秒前
蓝橙发布了新的文献求助10
22秒前
情怀应助琪琪采纳,获得10
22秒前
路痴发布了新的文献求助10
23秒前
可靠烧鹅完成签到,获得积分10
23秒前
假面绅士发布了新的文献求助10
23秒前
26秒前
11发布了新的文献求助10
28秒前
猫先生发布了新的文献求助10
28秒前
CodeCraft应助11采纳,获得10
34秒前
高分求助中
传播真理奋斗不息——中共中央编译局成立50周年纪念文集 2000
The Oxford Encyclopedia of the History of Modern Psychology 2000
Chinesen in Europa – Europäer in China: Journalisten, Spione, Studenten 1200
Deutsche in China 1920-1950 1200
中共中央编译局成立四十周年纪念册 / 中共中央编译局建局四十周年纪念册 950
Applied Survey Data Analysis (第三版, 2025) 850
Mineral Deposits of Africa (1907-2023): Foundation for Future Exploration 800
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3877452
求助须知:如何正确求助?哪些是违规求助? 3420303
关于积分的说明 10716476
捐赠科研通 3144838
什么是DOI,文献DOI怎么找? 1735140
邀请新用户注册赠送积分活动 837429
科研通“疑难数据库(出版商)”最低求助积分说明 783127