Combining integrated sampling with SVM ensembles for learning from imbalanced datasets

支持向量机 计算机科学 机器学习 人工智能 采样(信号处理) 集成学习 班级(哲学) 数据挖掘 背景(考古学) 过采样 模式识别(心理学) 滤波器(信号处理) 古生物学 生物 带宽(计算) 计算机视觉 计算机网络
作者
Liu Yang,Xiaohui Yu,Jimmy Xiangji Huang,Aijun An
出处
期刊:Information Processing and Management [Elsevier BV]
卷期号:47 (4): 617-631 被引量:131
标识
DOI:10.1016/j.ipm.2010.11.007
摘要

Learning from imbalanced datasets is difficult. The insufficient information that is associated with the minority class impedes making a clear understanding of the inherent structure of the dataset. Most existing classification methods tend not to perform well on minority class examples when the dataset is extremely imbalanced, because they aim to optimize the overall accuracy without considering the relative distribution of each class. In this paper, we study the performance of SVMs, which have gained great success in many real applications, in the imbalanced data context. Through empirical analysis, we show that SVMs may suffer from biased decision boundaries, and that their prediction performance drops dramatically when the data is highly skewed. We propose to combine an integrated sampling technique, which incorporates both over-sampling and under-sampling, with an ensemble of SVMs to improve the prediction performance. Extensive experiments show that our method outperforms individual SVMs as well as several other state-of-the-art classifiers.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
雪崩发布了新的文献求助10
1秒前
梅者如西发布了新的文献求助10
1秒前
默存完成签到,获得积分10
3秒前
哈哈哈完成签到,获得积分10
4秒前
量子星尘发布了新的文献求助10
5秒前
6秒前
LIU完成签到,获得积分10
7秒前
7秒前
alpha完成签到,获得积分20
9秒前
Lucas应助雪崩采纳,获得30
9秒前
10秒前
ghn123456789完成签到,获得积分10
12秒前
12秒前
orixero应助暮间晖采纳,获得10
16秒前
Sue完成签到 ,获得积分10
18秒前
19秒前
李健应助闪闪的屁股采纳,获得10
19秒前
19秒前
史蒂夫发布了新的文献求助30
19秒前
1阿完成签到,获得积分10
20秒前
20秒前
寂静沐风完成签到,获得积分10
22秒前
Jy发布了新的文献求助10
23秒前
24秒前
25秒前
JingZZ发布了新的文献求助10
25秒前
Julie完成签到 ,获得积分10
25秒前
付珊珊发布了新的文献求助10
26秒前
梅思寒完成签到 ,获得积分10
27秒前
Jie发布了新的文献求助10
27秒前
27秒前
28秒前
29秒前
30秒前
量子星尘发布了新的文献求助10
30秒前
30秒前
科研通AI2S应助科研通管家采纳,获得10
30秒前
Jasper应助科研通管家采纳,获得10
30秒前
31秒前
深情安青应助科研通管家采纳,获得10
31秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Burger's Medicinal Chemistry, Drug Discovery and Development, Volumes 1 - 8, 8 Volume Set, 8th Edition 1800
Cronologia da história de Macau 1600
Contemporary Debates in Epistemology (3rd Edition) 1000
International Arbitration Law and Practice 1000
文献PREDICTION EQUATIONS FOR SHIPS' TURNING CIRCLES或期刊Transactions of the North East Coast Institution of Engineers and Shipbuilders第95卷 1000
BRITTLE FRACTURE IN WELDED SHIPS 1000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 纳米技术 计算机科学 化学工程 生物化学 物理 复合材料 内科学 催化作用 物理化学 光电子学 细胞生物学 基因 电极 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6160659
求助须知:如何正确求助?哪些是违规求助? 7988882
关于积分的说明 16606318
捐赠科研通 5268842
什么是DOI,文献DOI怎么找? 2811280
邀请新用户注册赠送积分活动 1791294
关于科研通互助平台的介绍 1658165