A novel textual data augmentation method for identifying comparative text from user-generated content

计算机科学 文字嵌入 任务(项目管理) 情报检索 词(群论) 人工智能 嵌入 社会化媒体 自然语言处理 万维网 语言学 哲学 经济 管理
作者
Na Wei,Shengchuan Zhao,Jing Liu,Shenghui Wang
出处
期刊:Electronic Commerce Research and Applications [Elsevier BV]
卷期号:53: 101143-101143 被引量:2
标识
DOI:10.1016/j.elerap.2022.101143
摘要

Mining user-generated content on e-commerce platforms and social media is timely and more objective compared with other information access channels for gaining competitive intelligence. Identifying comparative text from large volumes of non-comparative text is an important but challenging task. On one hand, existing methods are time-consuming and not generalizable across different domains. On the other hand, the datasets for the task generally suffer from the severe imbalance issue. To address abovementioned problems, we propose a framework adopting advanced deep learning methods to automatically learn features and a novel textual data augmentation method named TA3S to deal with the data imbalance issue. Specifically, the TA3S method simultaneously considers the syntactic structure and semantic information of comparative text samples. Moreover, in order to support the successful implementation of TA3S, we develop a novel method based on word embedding and label propagation algorithm to distinguish between synonymous and antonymous substitute words. The experiments on two real-world datasets demonstrate the feasibility and effectiveness of our framework, and present that our framework outperforms state-of-the-art methods in identifying comparative text from user-generated content.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
阳光迎夏完成签到 ,获得积分10
1秒前
桐桐应助JJ采纳,获得10
1秒前
星辰大海应助Sci采纳,获得10
2秒前
orixero应助小王采纳,获得10
3秒前
Copyright应助Jiang_sir采纳,获得10
4秒前
666完成签到,获得积分10
4秒前
6秒前
彭于晏应助无尽幻想采纳,获得10
6秒前
htyhh完成签到,获得积分10
8秒前
ZZH完成签到,获得积分10
8秒前
9秒前
文静的翠彤完成签到 ,获得积分10
10秒前
yuanyuanyang发布了新的文献求助10
10秒前
10秒前
朴素的闭月完成签到,获得积分10
11秒前
12秒前
努力TOP完成签到 ,获得积分10
12秒前
12秒前
Mr权完成签到,获得积分10
13秒前
14秒前
15秒前
czj发布了新的文献求助10
16秒前
16秒前
小王发布了新的文献求助10
17秒前
17秒前
17秒前
18秒前
18秒前
叶子完成签到,获得积分10
18秒前
李兴雅发布了新的文献求助10
21秒前
22秒前
22秒前
22秒前
Jasper应助yuanyuanyang采纳,获得10
23秒前
24秒前
徐徐完成签到,获得积分10
24秒前
yu发布了新的文献求助10
24秒前
24秒前
感动的博超完成签到,获得积分10
24秒前
高分求助中
Principles of Economics, 11th Edition 10000
Prescott's Microbiology: 2026 Release ISE 10000
University Physics with Modern Physics, 16th edition 10000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Environmental Leverage in Times of Climate Crisis: Product Standards, Carbon Border Measures and Preferential Trade Agreements 1000
Interactions of Vowel Quality and Prosody in East Slavic 1000
Erwählung und Berufung bei Paulus: Bedeutung, Entwicklung und Funktion einer Vorstellung in ihrem frühjüdischen und griechisch-römischen Kontext 850
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7194547
求助须知:如何正确求助?哪些是违规求助? 8830285
关于积分的说明 18643257
捐赠科研通 6831586
什么是DOI,文献DOI怎么找? 3176401
关于科研通互助平台的介绍 2329122
邀请新用户注册赠送积分活动 2150846