An Empirical Study on Heterogeneous Defect Prediction Approaches

可解释性 计算机科学 公制(单位) 集合(抽象数据类型) 数据挖掘 领域(数学) 软件度量 软件 实证研究 机器学习 软件错误 预测建模 选择(遗传算法) 班级(哲学) 性能指标 转化(遗传学) 人工智能 软件开发 软件质量 程序设计语言 统计 数学 纯数学 管理 化学 运营管理 经济 基因 生物化学
作者
Haowen Chen,Xiao‐Yuan Jing,Zhiqiang Li,Di Wu,Peng Yi,Zhiguo Huang
出处
期刊:IEEE Transactions on Software Engineering [IEEE Computer Society]
卷期号:47 (12): 2803-2822 被引量:49
标识
DOI:10.1109/tse.2020.2968520
摘要

Software defect prediction has always been a hot research topic in the field of software engineering owing to its capability of allocating limited resources reasonably. Compared with cross-project defect prediction (CPDP), heterogeneous defect prediction (HDP) further relaxes the limitation of defect data used for prediction, permitting different metric sets to be contained in the source and target projects. However, there is still a lack of a holistic understanding of existing HDP studies due to different evaluation strategies and experimental settings. In this paper, we provide an empirical study on HDP approaches. We review the research status systematically and compare the HDP approaches proposed from 2014 to June 2018. Furthermore, we also investigate the feasibility of HDP approaches in CPDP. Through extensive experiments on 30 projects from five datasets, we have the following findings: (1) metric transformation-based HDP approaches usually result in better prediction effects, while metric selection-based approaches have better interpretability. Overall, the HDP approach proposed by Li et al. (CTKCCA) currently has the best performance. (2) Handling class imbalance problems can boost the prediction effects, but the improvements are usually limited. In addition, utilizing mixed project data cannot improve the performance of HDP approaches consistently since the label information in the target project is not used effectively. (3) HDP approaches are feasible for cross-project defect prediction in which the source and target projects have the same metric set.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
小管家完成签到 ,获得积分10
刚刚
会飞的猪猪完成签到,获得积分10
刚刚
Lee发布了新的文献求助20
刚刚
朴实霆完成签到,获得积分10
1秒前
2秒前
精灵夜雨完成签到,获得积分10
2秒前
夭夭完成签到,获得积分10
2秒前
2秒前
3秒前
菜鸟完成签到,获得积分10
3秒前
3秒前
橘子洲完成签到,获得积分10
4秒前
ZSmile完成签到,获得积分10
4秒前
4秒前
一心完成签到,获得积分10
4秒前
咚咚糖发布了新的文献求助10
4秒前
ruby完成签到,获得积分10
4秒前
yslyslysl完成签到,获得积分10
4秒前
5秒前
cjmlslddjd完成签到,获得积分10
5秒前
小朱发布了新的文献求助10
5秒前
5秒前
小恶于完成签到 ,获得积分10
6秒前
檬檬完成签到,获得积分10
6秒前
7秒前
张康乐发布了新的文献求助10
7秒前
7秒前
YUE完成签到,获得积分10
8秒前
8秒前
小刘不怕困难完成签到,获得积分10
8秒前
俊俏的紫菜完成签到,获得积分10
8秒前
斯文败类应助淡定的萍采纳,获得10
9秒前
9秒前
张宇鑫发布了新的文献求助10
10秒前
youyyuy完成签到,获得积分10
10秒前
邋遢大王不邋遢完成签到,获得积分10
10秒前
曲去玖发布了新的文献求助10
10秒前
10秒前
wmqlu发布了新的文献求助10
10秒前
10秒前
高分求助中
Adhesion Science: Principles & Practice 1234
Signals, Systems, and Signal Processing 610
Introduction to Cosmetic Formulation and Technology, 2nd Edition 400
Petrology and Plate Tectonics,2025 400
Burger's Medicinal Chemistry and Drug Discovery 400
Programming for Chemical Engineers Using C, C++, and MATLAB 320
Birth of Twins After Genome Editing for HIV Resistance 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6690759
求助须知:如何正确求助?哪些是违规求助? 8434084
关于积分的说明 18019971
捐赠科研通 5917764
什么是DOI,文献DOI怎么找? 2984815
邀请新用户注册赠送积分活动 1960771
关于科研通互助平台的介绍 1899589