亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Heterogeneous graph contrastive learning with adaptive data augmentation for semi‐supervised short text classification

计算机科学 人工智能 图形 机器学习 标记数据 模式识别(心理学) 数据挖掘 理论计算机科学
作者
Mingqiang Wu,Zhuoming Xu,Lei Zheng
出处
期刊:Expert Systems [Wiley]
标识
DOI:10.1111/exsy.13744
摘要

Abstract Short text classification has been widely used in many fields. Due to the scarcity of labelled data, implementing short text classification under semi‐supervised learning setting has become increasingly popular. Semi‐supervised short text classification methods based on graph neural networks can achieve state‐of‐the‐art classification performance by utilizing the expressive power of graph neural networks. However, these methods usually fail to mine the hidden patterns of a large amount of short text node data in the graph to optimize the short text node embeddings, which limits the semantic representation power of the short texts, thus leading to suboptimal classification performance. To overcome the limitation, this paper proposes a novel semi‐supervised short text classification method called the Heterogeneous Graph Contrastive Learning with Adaptive Data Augmentation (HGCLADA). In the knowledge bases guided soft prompt‐based data augmentation component, the related words of the tag words are used to optimize the soft prompts for generating diverse augmented samples. In the heterogeneous graph contrastive learning framework component, a heterogeneous graph that is constructed using short texts and keywords and an effective edge augmentation scheme based on a short text clustering algorithm are proposed. The optimized short text embeddings can be obtained to achieve the effective semi‐supervised short text classification. Extensive experiments on six benchmark datasets show that our HGCLADA method outperforms four classes of state‐of‐the‐art methods in terms of classification accuracy, especially with significant performance improvements of 8.74% on the TagMyNews dataset when each class only contains 20 labelled data.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
文静依萱完成签到,获得积分10
8秒前
雪糕完成签到,获得积分10
12秒前
19秒前
26秒前
34秒前
莫大完成签到 ,获得积分10
1分钟前
酷酷的雨完成签到,获得积分10
1分钟前
tanliulong完成签到 ,获得积分10
1分钟前
1分钟前
ckkk发布了新的文献求助10
1分钟前
2分钟前
9527发布了新的文献求助10
2分钟前
羞涩的烨华完成签到,获得积分10
2分钟前
姚老表完成签到,获得积分10
3分钟前
平淡夏青完成签到,获得积分10
3分钟前
acacxhm7完成签到 ,获得积分10
3分钟前
3分钟前
闪闪访波完成签到,获得积分10
3分钟前
4分钟前
英勇的落雁完成签到,获得积分10
4分钟前
心无杂念完成签到 ,获得积分10
5分钟前
9527发布了新的文献求助10
5分钟前
美丽的迎蕾完成签到,获得积分10
5分钟前
hhuajw发布了新的文献求助10
5分钟前
斯文败类应助9527采纳,获得10
5分钟前
陶醉之柔完成签到,获得积分10
6分钟前
6分钟前
lihongchi发布了新的文献求助10
6分钟前
6分钟前
留胡子的丹亦完成签到,获得积分10
7分钟前
代dai发布了新的文献求助10
7分钟前
ok123完成签到 ,获得积分0
7分钟前
7分钟前
科研通AI2S应助科研通管家采纳,获得10
7分钟前
怡然碧空完成签到,获得积分10
7分钟前
hhuajw完成签到,获得积分10
7分钟前
ROOOOOK发布了新的文献求助10
7分钟前
威威完成签到,获得积分10
7分钟前
张丽妍发布了新的文献求助10
7分钟前
ROOOOOK完成签到,获得积分10
8分钟前
高分求助中
Overcoming Stigma and Bias in Obesity Management 800
Malcolm Fraser : a biography 700
Signals, Systems, and Signal Processing 610
Bounds for Statistical Estimation in Semiparametric Models 500
Climate change and sports: Statistics report on climate change and sports 500
Forced degradation and stability indicating LC method for Letrozole: A stress testing guide 500
Ideology and Meaning-Making under the Putin Regime 450
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6473107
求助须知:如何正确求助?哪些是违规求助? 8276471
关于积分的说明 17646722
捐赠科研通 5552775
什么是DOI,文献DOI怎么找? 2909674
邀请新用户注册赠送积分活动 1886452
关于科研通互助平台的介绍 1738243