Finding the Best Classification Threshold in Imbalanced Classification

计算机科学 接收机工作特性 集合(抽象数据类型) 人工智能 班级(哲学) 软件 统计分类 数据集 机器学习 模式识别(心理学) 数据挖掘 程序设计语言
作者
Quan Zou,Sifa Xie,Ziyu Lin,Meihong Wu,Ying Ju
出处
期刊:Big Data Research [Elsevier BV]
卷期号:5: 2-8 被引量:227
标识
DOI:10.1016/j.bdr.2015.12.001
摘要

Abstract Classification with imbalanced class distributions is a major problem in machine learning. Researchers have given considerable attention to the applications in many real-world scenarios. Although several works have utilized the area under the receiver operating characteristic (ROC) curve to select potentially optimal classifiers in imbalanced classifications, limited studies have been devoted to finding the classification threshold for testing or unknown datasets. In general, the classification threshold is simply set to 0.5, which is usually unsuitable for an imbalanced classification. In this study, we analyze the drawbacks of using ROC as the sole measure of imbalance in data classification problems. In addition, a novel framework for finding the best classification threshold is proposed. Experiments with SCOP v.1.53 data reveal that, with the default threshold set to 0.5, our proposed framework demonstrated a 20.63% improvement in terms of F-score compared with that of more commonly used methods. The findings suggest that the proposed framework is both effective and efficient. A web server and software tools are available via http://datamining.xmu.edu.cn/prht/ or http://prht.sinaapp.com/ .
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
July发布了新的文献求助10
2秒前
4秒前
Damon发布了新的文献求助10
4秒前
静oo完成签到,获得积分10
8秒前
10秒前
11秒前
猛男航发布了新的文献求助10
14秒前
16秒前
July完成签到,获得积分10
16秒前
lxl发布了新的文献求助10
17秒前
无心的砖家完成签到 ,获得积分10
17秒前
勤劳冰烟完成签到,获得积分10
17秒前
18秒前
单薄的沛槐完成签到,获得积分10
19秒前
迷路的紫完成签到,获得积分10
19秒前
123完成签到 ,获得积分10
21秒前
21秒前
21秒前
cc完成签到,获得积分20
22秒前
ZZZww完成签到 ,获得积分10
22秒前
加油呀发布了新的文献求助20
22秒前
浅汐完成签到,获得积分10
23秒前
24秒前
酥酥完成签到,获得积分10
24秒前
丰富沛山完成签到 ,获得积分10
24秒前
25秒前
卡黄99完成签到,获得积分10
25秒前
25秒前
cc发布了新的文献求助10
26秒前
x5kyi完成签到,获得积分10
27秒前
可爱的函函应助ryanzhang采纳,获得10
27秒前
酷波er应助紧张的剑心采纳,获得200
28秒前
Ldmlly完成签到,获得积分10
28秒前
29秒前
30秒前
30秒前
31秒前
马可波航完成签到 ,获得积分10
32秒前
32秒前
高分求助中
The Graphene Handbook (2019 Edition) 800
Signals, Systems, and Signal Processing 610
IEST-RP-CC018: Cleanroom Cleaning and Sanitization: Operating and Monitoring Procedures 600
Fundamentals of Pharmaceutical and Biologics Regulations: A Global Perspective, Second Edition 600
久松真一著作集〈第5巻〉禅と芸術 500
Fundamentals of Modern Mathematics: A Practical Review (Dover Books on Mathematics) 500
Cold War Transcended: Australia's China Policy, 1949-1990 470
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6599421
求助须知:如何正确求助?哪些是违规求助? 8368648
关于积分的说明 17912229
捐赠科研通 5754101
什么是DOI,文献DOI怎么找? 2954075
邀请新用户注册赠送积分活动 1929303
关于科研通互助平台的介绍 1824480