Sentiment analysis of financial Twitter posts on Twitter with the machine learning classifiers

人工智能 机器学习 情绪分析 计算机科学 支持向量机 词典 Python(编程语言) 分类器(UML) 多层感知器 土耳其 自然语言处理 人工神经网络 语言学 哲学 操作系统
作者
Handan Çam,Ali Cam,Uğur Demirel,Sana Ahmed
出处
期刊:Heliyon [Elsevier]
卷期号:10 (1): e23784-e23784
标识
DOI:10.1016/j.heliyon.2023.e23784
摘要

This paper presents a sentiment analysis combining the lexicon-based and machine learning (ML)-based approaches in Turkish to investigate the public mood for the prediction of stock market behavior in BIST30, Borsa Istanbul. Our main motivation behind this study is to apply sentiment analysis to financial-related tweets in Turkish. We import 17189 tweets posted as "#Borsaistanbul, #Bist, #Bist30, #Bist100″ on Twitter between November 7, 2022, and November 15, 2022, via a MAXQDA 2020, a qualitative data analysis program. For the lexicon-based side, we use a multilingual sentiment offered by the Orange program to label the polarities of the 17189 samples as positive, negative, and neutral labels. Neutral labels are discarded for the machine learning experiments. For the machine learning side, we select 9076 data as positive and negative to implement the classification problem with six different supervised machine learning classifiers conducted in Python 3.6 with the sklearn library. In experiments, 80 % of the selected data is used for the training phase and the rest is used for the testing and validation phase. Results of the experiments show that the Support Vector Machine and Multilayer Perceptron classifier perform better than other classifiers with 0.89 and 0.88 accuracy and AUC values of 0.8729 and 0.8647 respectively. Other classifiers obtain approximately a 78,5 % accuracy rate. It is possible to increase sentiment analysis accuracy with parameter optimization on a larger, cleaner, and more balanced dataset by changing the pre-processing steps. This work can be expanded in the future to develop better sentiment analysis using deep learning approaches.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
刚刚
1秒前
无花果应助Otorhino采纳,获得10
1秒前
圆圆发布了新的文献求助10
1秒前
王药剂发布了新的文献求助10
2秒前
梦想or现实完成签到,获得积分10
2秒前
2秒前
3秒前
WYY发布了新的文献求助10
4秒前
赵岩发布了新的文献求助10
5秒前
聪明眼睛完成签到,获得积分10
6秒前
冷静如柏完成签到,获得积分10
6秒前
淡定亦凝完成签到 ,获得积分10
7秒前
天真水壶完成签到 ,获得积分10
7秒前
喜悦兔子完成签到 ,获得积分10
7秒前
7秒前
manman发布了新的文献求助10
8秒前
TIANRU发布了新的文献求助10
8秒前
思源应助圆圆采纳,获得10
9秒前
10秒前
WYL发布了新的文献求助10
10秒前
义气严青完成签到,获得积分10
11秒前
11秒前
浮世完成签到,获得积分10
11秒前
陈龙发布了新的文献求助10
11秒前
12秒前
封迎松完成签到,获得积分10
12秒前
NexusExplorer应助中科路2020采纳,获得20
12秒前
移动马桶完成签到 ,获得积分10
12秒前
周周完成签到,获得积分10
13秒前
等待的问夏完成签到 ,获得积分10
13秒前
14秒前
姬因完成签到,获得积分10
14秒前
孤独的匕发布了新的文献求助10
14秒前
rrjl发布了新的文献求助10
15秒前
文雨非完成签到 ,获得积分10
16秒前
刻苦鱼发布了新的文献求助10
17秒前
自由的未来完成签到,获得积分10
17秒前
赵岩完成签到,获得积分20
17秒前
高分求助中
Un calendrier babylonien des travaux, des signes et des mois: Séries iqqur îpuš 1036
IG Farbenindustrie AG and Imperial Chemical Industries Limited strategies for growth and survival 1925-1953 800
The Found Generation: Chinese Communists in Europe during the Twenties 700
Sustainable Land Management: Strategies to Cope with the Marginalisation of Agriculture 600
麦可思2024版就业蓝皮书 500
Handbook of Language Analysis in Psychology 500
Prochinois Et Maoïsmes En France (et Dans Les Espaces Francophones) 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2537469
求助须知:如何正确求助?哪些是违规求助? 2172507
关于积分的说明 5585527
捐赠科研通 1892822
什么是DOI,文献DOI怎么找? 943604
版权声明 565183
科研通“疑难数据库(出版商)”最低求助积分说明 502732