Heuristic-Assisted BERT for Twitter Sentiment Analysis

计算机科学 词汇分析 情绪分析 自然语言处理 人工智能 编码器 停止语 俚语 词典序 预处理器 语言学 哲学 数学 组合数学 操作系统
作者
Gokul Yenduri,B. R. Rajakumar,K. Praghash,D. Binu
出处
期刊:International Journal of Computational Intelligence and Applications [Imperial College Press]
卷期号:20 (03) 被引量:18
标识
DOI:10.1142/s1469026821500152
摘要

The identification of opinions and sentiments from tweets is termed as “Twitter Sentiment Analysis (TSA)”. The major process of TSA is to determine the sentiment or polarity of the tweet and then classifying them into a negative or positive tweet. There are several methods introduced for carrying out TSA, however, it remains to be challenging due to slang words, modern accents, grammatical and spelling mistakes, and other issues that could not be solved by existing techniques. This work develops a novel customized BERT-oriented sentiment classification that encompasses two main phases: pre-processing and tokenization, and a “Customized Bidirectional Encoder Representations from Transformers (BERT)”-based classification. At first, the gathered raw tweets are pre-processed under stop-word removal, stemming and blank space removal. After pre-processing, the semantic words are obtained, from which the meaningful words (tokens) are extracted in the tokenization phase. Consequently, these extracted tokens are classified via optimized BERT, where biases and weight are tuned optimally by Particle-Assisted Circle Updating Position (PA-CUP). Moreover, the maximal sequence length of the BERT encoder is updated using standard PA-CUP. Finally, the performance analysis is carried out to substantiate the enhancement of the proposed model.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
忐忑的远山完成签到,获得积分10
刚刚
泡芙完成签到,获得积分10
1秒前
123123完成签到,获得积分10
1秒前
chensiyao完成签到,获得积分10
1秒前
1秒前
NexusExplorer应助十三采纳,获得10
1秒前
可乐不加冰完成签到,获得积分10
2秒前
AGOA小秘书完成签到,获得积分10
2秒前
2秒前
鸡蛋发布了新的文献求助10
3秒前
wewe11发布了新的文献求助10
3秒前
3秒前
ZY完成签到,获得积分10
3秒前
feng完成签到,获得积分10
3秒前
水牛完成签到,获得积分10
3秒前
another完成签到,获得积分10
3秒前
了0完成签到 ,获得积分10
3秒前
TAO发布了新的文献求助10
4秒前
zyj完成签到,获得积分10
4秒前
韩俊杰完成签到,获得积分10
4秒前
还有发布了新的文献求助10
5秒前
5秒前
5秒前
5秒前
黄兆强完成签到 ,获得积分10
5秒前
喻白玉完成签到,获得积分10
6秒前
cm完成签到,获得积分10
6秒前
6秒前
CipherSage应助小张采纳,获得10
6秒前
6秒前
生动的战斗机完成签到,获得积分10
6秒前
小张爱学习完成签到,获得积分20
6秒前
高兴的苞络完成签到,获得积分10
6秒前
chensiyao发布了新的文献求助10
7秒前
无奈皮皮虾完成签到,获得积分10
8秒前
你的风筝完成签到,获得积分0
8秒前
睡呀完成签到,获得积分10
8秒前
勾勾1991完成签到,获得积分10
8秒前
8秒前
9秒前
高分求助中
Malcolm Fraser : a biography 680
Signals, Systems, and Signal Processing 610
天津市智库成果选编 600
Climate change and sports: Statistics report on climate change and sports 500
Forced degradation and stability indicating LC method for Letrozole: A stress testing guide 500
Organic Reactions Volume 118 400
A Foreign Missionary on the Long March: The Unpublished Memoirs of Arnolis Hayman of the China Inland Mission 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6459661
求助须知:如何正确求助?哪些是违规求助? 8268676
关于积分的说明 17623762
捐赠科研通 5529060
什么是DOI,文献DOI怎么找? 2905996
邀请新用户注册赠送积分活动 1882736
关于科研通互助平台的介绍 1727990