Multi-level semantic enhancement based on self-distillation BERT for Chinese named entity recognition

计算机科学 人工智能 自然语言处理 模式识别(心理学) 蒸馏 机器学习 情报检索 化学 色谱法
作者
Zepeng Li,Shengcao Cao,Minyu Zhai,Nengneng Ding,Zhenwen Zhang,Bin Hu
出处
期刊:Neurocomputing [Elsevier]
卷期号:586: 127637-127637
标识
DOI:10.1016/j.neucom.2024.127637
摘要

As an important foundational task in the field of natural language processing, the Chinese named entity recognition (NER) task has received widespread attention in recent years. Self-distillation plays a role in exploring the potential of the knowledge carried by internal parameters in the BERT NER model, but few studies have noticed the impact of different granularity semantic information during the distillation process. In this paper, we propose a multi-level semantic enhancement approach based on self-distillation BERT for Chinese named entity recognition. We first design a feasible data augmentation method to improve the training quality for handling complex entity compositions, then construct a boundary smoothing module to achieve the model's moderate learning on entity boundaries. Besides, we utilize the distillation reweighting method to let the model acquire balanced entity and context knowledge. Experimental results on two Chinese named entity recognition benchmark datasets Weibo and Resume have 72.09% and 96.93% F1 scores, respectively. Compared to three different basic distillation BERT models, our model can also produce better results. The source code is available at https://github.com/lookmedandan/MSE.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
anannnnn完成签到 ,获得积分10
1秒前
bakbak完成签到,获得积分10
2秒前
哟哟哟发布了新的文献求助10
3秒前
5秒前
6秒前
6秒前
7秒前
麦片发布了新的文献求助30
7秒前
思芋奶糕发布了新的文献求助10
8秒前
云里完成签到,获得积分10
9秒前
wuhaixia完成签到,获得积分10
9秒前
在水一方应助Grace_Willis采纳,获得10
9秒前
英俊的铭应助哟哟哟采纳,获得10
9秒前
10秒前
99668完成签到,获得积分10
10秒前
机智傀斗完成签到,获得积分10
10秒前
思芋奶糕发布了新的文献求助10
10秒前
张泽崇应助木头人采纳,获得10
13秒前
甄道之完成签到 ,获得积分10
13秒前
14秒前
秋雪瑶应助北洛采纳,获得30
16秒前
Roman完成签到,获得积分10
21秒前
还没睡醒完成签到,获得积分10
22秒前
北洛应助文件撤销了驳回
23秒前
清欢完成签到,获得积分10
24秒前
疯狂的翠柏完成签到 ,获得积分10
25秒前
27秒前
打打应助xu采纳,获得10
27秒前
桐桐应助吴1采纳,获得10
29秒前
坚强的广山应助zhangyumin采纳,获得10
29秒前
赘婿应助叶楠采纳,获得10
29秒前
Vamos发布了新的文献求助10
33秒前
自由破十三完成签到 ,获得积分10
34秒前
changes完成签到 ,获得积分10
35秒前
jasmine发布了新的文献求助10
35秒前
35秒前
hhhhhh给hhhhhh的求助进行了留言
36秒前
37秒前
38秒前
福气番茄应助闪闪的冬菱采纳,获得10
39秒前
高分求助中
Manual of Clinical Microbiology, 4 Volume Set (ASM Books) 13th Edition 1000
Sport in der Antike 800
De arte gymnastica. The art of gymnastics 600
少脉山油柑叶的化学成分研究 530
Electronic Structure Calculations and Structure-Property Relationships on Aromatic Nitro Compounds 500
Berns Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
Stephen R. Mackinnon - Chen Hansheng: China’s Last Romantic Revolutionary (2023) 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2414455
求助须知:如何正确求助?哪些是违规求助? 2107845
关于积分的说明 5328864
捐赠科研通 1835070
什么是DOI,文献DOI怎么找? 914378
版权声明 561017
科研通“疑难数据库(出版商)”最低求助积分说明 488942