A dictionary-guided attention network for biomedical named entity recognition in Chinese electronic medical records

计算机科学 医学术语 术语 注释 人工智能 自然语言处理 匹配(统计) 命名实体识别 词(群论) 情报检索 语言学 经济 任务(项目管理) 管理 哲学 统计 数学
作者
Zhichao Zhu,Jianqiang Li,Zhao Quan,Faheem Akhtar
出处
期刊:Expert Systems With Applications [Elsevier]
卷期号:231: 120709-120709
标识
DOI:10.1016/j.eswa.2023.120709
摘要

Biomedical named entity recognition (BNER) is a critical task for biomedical information extraction. Most popular BNER approaches based on deep learning utilize words and characters as features to represent medical texts. However, many medical terminologies are composed of multiple words and characters, and splitting medical terminology into multiple words (or characters) and assigning weight values for each word (or character) by a standard attention mechanism may disperse the attention score and result in a lower weight value for the medical terminology. This paper proposes a Dictionary-guided Attention Network (DGAN) for BNER in Chinese electronic medical records (EMRs). First, the medical concepts are extracted as large-size words to supplement the comprehensive semantic information of the medical terminology by matching the EMR text to the biomedical dictionary. Then, based on the matched dictionary results, an optimized attention strategy is proposed to focus on the medical concept and adaptively assign higher weights to the characters contained in a concept. Furthermore, semisupervised learning is introduced to reduce the manual labeling of data and to handle the entities not defined in the medical dictionary. To validate our new model in recognizing biomedical named entities, we conduct comprehensive experiments on a real-world Chinese EMR dataset and the CCKS2017 dataset. Our promising results illustrate that our method not only achieves a state-of-the-art performance in BNER but also reduces manual data annotation.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
汉堡发布了新的文献求助10
7秒前
9秒前
烟花应助CT采纳,获得10
10秒前
11秒前
阿大呆呆应助坂井泉水采纳,获得10
14秒前
大个应助lvsehx采纳,获得10
14秒前
陆晓亦完成签到,获得积分10
15秒前
sekidesu发布了新的文献求助10
15秒前
王洋洋发布了新的文献求助10
15秒前
lew14应助牛牛要当院士喽采纳,获得50
18秒前
pluto应助潇湘夜雨采纳,获得10
19秒前
20秒前
21秒前
斯文败类应助王洋洋采纳,获得10
22秒前
CT发布了新的文献求助10
24秒前
BreadCheems发布了新的文献求助10
26秒前
30秒前
CT完成签到,获得积分10
30秒前
32秒前
Hello应助科研通管家采纳,获得10
35秒前
35秒前
共享精神应助科研通管家采纳,获得10
35秒前
秋雪瑶应助科研通管家采纳,获得10
35秒前
pluto应助科研通管家采纳,获得10
35秒前
ding应助科研通管家采纳,获得10
35秒前
bkagyin应助科研通管家采纳,获得10
35秒前
小二郎应助科研通管家采纳,获得10
35秒前
Owen应助科研通管家采纳,获得10
35秒前
35秒前
安静幼南发布了新的文献求助20
36秒前
37秒前
xzh发布了新的文献求助10
38秒前
惜墨发布了新的文献求助100
38秒前
王洋洋发布了新的文献求助10
41秒前
斯文宛秋完成签到 ,获得积分10
42秒前
43秒前
李爱国应助shj采纳,获得10
43秒前
陈龙艳完成签到,获得积分10
44秒前
44秒前
高分求助中
The Illustrated History of Gymnastics 800
The Bourse of Babylon : market quotations in the astronomical diaries of Babylonia 680
Division and square root. Digit-recurrence algorithms and implementations 500
機能營養學前瞻(3 Ed.) 300
Problems of transcultural communication 300
Zwischen Selbstbestimmung und Selbstbehauptung 300
Johann Gottlieb Fichte: Die späten wissenschaftlichen Vorlesungen / IV,1: ›Transzendentale Logik I (1812)‹ 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2504551
求助须知:如何正确求助?哪些是违规求助? 2157743
关于积分的说明 5522378
捐赠科研通 1878112
什么是DOI,文献DOI怎么找? 934105
版权声明 563932
科研通“疑难数据库(出版商)”最低求助积分说明 498937