Classification of Imbalanced Big Data using SMOTE with Rough Random Forest

过采样 大数据 随机森林 计算机科学 数据挖掘 股市预测 水准点(测量) 机器学习 集成学习 人工智能
出处
期刊:International journal of engineering and advanced technology [Blue Eyes Intelligence Engineering and Sciences Engineering and Sciences Publication - BEIESP]
卷期号:9 (2): 5174-5184 被引量:1
标识
DOI:10.35940/ijeat.b4096.129219
摘要

Learning from datasets is an important research topic today. Amongst the various data mining tools available for the purpose, none works satisfactorily in the case of imbalanced data mainly because this type of data gives rise to various minority classes, which may affect the learning process. In addition to the large volume, characteristics of Big Data also include velocity and variety. The Synthetic Minority Oversampling Technique (SMOTE) is a widely used technique to balance imbalanced data. Here, we have focussed on extending this concept to conform to the Big Data environment by combining it with the concepts of rough random forest (RRF). This hybrid approach comprising SMOTE and RRF algorithms for learning from imbalanced datasets has been applied on various benchmark datasets from the KEEL Dataset Repository. The results obtained are satisfactory. The velocity aspect of Big Data has been handled by this method on the dynamic dataset of the stock market. The results obtained have been verified using popular online websites related to stock markets
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
星河圈揽发布了新的文献求助10
2秒前
郭敬杰完成签到,获得积分10
3秒前
奈落完成签到 ,获得积分10
4秒前
4秒前
5秒前
star应助废寝忘食采纳,获得30
9秒前
dqqi完成签到,获得积分10
10秒前
11秒前
皮卡丘完成签到,获得积分10
11秒前
dqqi发布了新的文献求助10
14秒前
丰荣发布了新的文献求助10
15秒前
11完成签到 ,获得积分10
15秒前
Jasper应助centlay采纳,获得10
17秒前
星河圈揽完成签到,获得积分10
18秒前
鬼鬼的眼睛完成签到,获得积分10
24秒前
古月完成签到 ,获得积分10
26秒前
AnZeng完成签到,获得积分10
27秒前
春衫发布了新的文献求助20
28秒前
完美世界应助LIU采纳,获得10
29秒前
stick发布了新的文献求助10
31秒前
ding应助科研老炮采纳,获得10
32秒前
乘风破浪完成签到 ,获得积分10
33秒前
stick完成签到,获得积分10
38秒前
39秒前
LIU发布了新的文献求助10
43秒前
44秒前
闹一闹吧费曼先生完成签到 ,获得积分10
48秒前
Yous完成签到,获得积分10
50秒前
Miracle发布了新的文献求助10
51秒前
Lyn13完成签到,获得积分10
51秒前
52秒前
BBFIU完成签到,获得积分10
53秒前
彗星完成签到,获得积分10
53秒前
杭汝燕完成签到,获得积分10
55秒前
上官若男应助大呲花采纳,获得10
56秒前
PANGQI完成签到,获得积分10
57秒前
温酒随行完成签到 ,获得积分10
57秒前
huanglm发布了新的文献求助10
58秒前
执着的难破完成签到 ,获得积分10
1分钟前
英姑应助子车半烟采纳,获得10
1分钟前
高分求助中
The three stars each: the Astrolabes and related texts 1120
The Late Jurassic shark Palaeocarcharias (Elasmobranchii, Selachimorpha) – functional morphology of teeth, dermal cephalic lobes and phylogenetic position 500
Electronic Structure Calculations and Structure-Property Relationships on Aromatic Nitro Compounds 500
Berns Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
Stephen R. Mackinnon - Chen Hansheng: China’s Last Romantic Revolutionary (2023) 500
Psychological Warfare Operations at Lower Echelons in the Eighth Army, July 1952 – July 1953 400
宋、元、明、清时期“把/将”字句研究 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2436129
求助须知:如何正确求助?哪些是违规求助? 2116764
关于积分的说明 5372322
捐赠科研通 1844580
什么是DOI,文献DOI怎么找? 918012
版权声明 561683
科研通“疑难数据库(出版商)”最低求助积分说明 491095