ASER: Adapted squared error relevance for rare cases prediction in imbalanced regression

加权 公制(单位) 计算机科学 相关性(法律) 回归 均方误差 数据挖掘 人工智能 任务(项目管理) 性能指标 回归分析 机器学习 统计 算法 数学 医学 运营管理 管理 政治学 法学 经济 放射科
作者
Ying Kou,Guang‐Hui Fu
出处
期刊:Journal of Chemometrics [Wiley]
卷期号:37 (11) 被引量:1
标识
DOI:10.1002/cem.3515
摘要

Abstract Many real‐world data mining applications involve using imbalanced datasets to obtain predictive models. Imbalanced data can hinder the model performance of learning algorithms in rare cases. Although there are many well‐researched classification task solutions, most of them cannot be directly applied to regression task. One of the challenges in imbalanced regression is to find a suitable evaluation and optimization standard that can improve the predictive ability of the model without severe model bias. Based on the importance of rare cases, this study proposes a new evaluation metric called adapted squared error relevance (ASER) by defining new relevance function and weighting functions. This metric weights data points by defining the importance of rare cases and assigns different weights to losses of the same size at different rare cases, thus enabling the model selected by this evaluation metric to better predict rare cases. ASER is compared with SER on 32 real datasets and 9 simulated datasets to verify the predictive performance of the selected model at rare cases. The experimental results show that the new evaluation metric ASER can obtain a high prediction performance at rare cases, while also not losing too much prediction accuracy in common cases.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
可爱的函函应助weijie采纳,获得10
刚刚
刚刚
汉堡包应助hx采纳,获得10
刚刚
刚刚
香菜卷煎饼完成签到,获得积分10
刚刚
1秒前
ins发布了新的文献求助10
1秒前
yyyyxxxg完成签到,获得积分10
1秒前
Bovr发布了新的文献求助10
1秒前
orixero应助细腻的凡儿采纳,获得10
1秒前
Wenzlee完成签到,获得积分10
2秒前
wwww关注了科研通微信公众号
2秒前
wyh发布了新的文献求助10
2秒前
万能图书馆应助兴奋秋珊采纳,获得10
2秒前
余一台完成签到,获得积分10
2秒前
3秒前
3秒前
3秒前
3秒前
Liar发布了新的文献求助10
3秒前
4秒前
LS发布了新的文献求助10
4秒前
4秒前
4秒前
4秒前
MY发布了新的文献求助10
4秒前
大个应助oia采纳,获得10
4秒前
慕青应助11采纳,获得10
4秒前
5秒前
CodeCraft应助CY采纳,获得10
5秒前
dreamM完成签到,获得积分10
5秒前
只有个石头完成签到,获得积分10
5秒前
光亮问凝发布了新的文献求助10
5秒前
石榴园长完成签到,获得积分10
6秒前
6秒前
今后应助沉静的樱桃采纳,获得10
6秒前
6秒前
6秒前
ss完成签到,获得积分10
6秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Kinesiophobia : a new view of chronic pain behavior 3000
Molecular Biology of Cancer: Mechanisms, Targets, and Therapeutics 1100
3O - Innate resistance in EGFR mutant non-small cell lung cancer (NSCLC) patients by coactivation of receptor tyrosine kinases (RTKs) 1000
Signals, Systems, and Signal Processing 510
Discrete-Time Signals and Systems 510
Proceedings of the Fourth International Congress of Nematology, 8-13 June 2002, Tenerife, Spain 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5937530
求助须知:如何正确求助?哪些是违规求助? 7037158
关于积分的说明 15871049
捐赠科研通 5067093
什么是DOI,文献DOI怎么找? 2725335
邀请新用户注册赠送积分活动 1683836
关于科研通互助平台的介绍 1612184