亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Permutation importance: a corrected feature importance measure

可解释性 范畴变量 特征(语言学) 排列(音乐) 计算机科学 度量(数据仓库) 估计员 启发式 人工智能 机器学习 特征选择 变量(数学) 相关性(法律) 特征向量 支持向量机 模式识别(心理学) 数据挖掘 统计 数学 哲学 数学分析 物理 语言学 法学 声学 政治学
作者
André Altmann,Laura Toloşi,Oliver Sander,Thomas Lengauer
出处
期刊:Bioinformatics [Oxford University Press]
卷期号:26 (10): 1340-1347 被引量:1916
标识
DOI:10.1093/bioinformatics/btq134
摘要

Abstract Motivation: In life sciences, interpretability of machine learning models is as important as their prediction accuracy. Linear models are probably the most frequently used methods for assessing feature relevance, despite their relative inflexibility. However, in the past years effective estimators of feature relevance have been derived for highly complex or non-parametric models such as support vector machines and RandomForest (RF) models. Recently, it has been observed that RF models are biased in such a way that categorical variables with a large number of categories are preferred. Results: In this work, we introduce a heuristic for normalizing feature importance measures that can correct the feature importance bias. The method is based on repeated permutations of the outcome vector for estimating the distribution of measured importance for each variable in a non-informative setting. The P-value of the observed importance provides a corrected measure of feature importance. We apply our method to simulated data and demonstrate that (i) non-informative predictors do not receive significant P-values, (ii) informative variables can successfully be recovered among non-informative variables and (iii) P-values computed with permutation importance (PIMP) are very helpful for deciding the significance of variables, and therefore improve model interpretability. Furthermore, PIMP was used to correct RF-based importance measures for two real-world case studies. We propose an improved RF model that uses the significant variables with respect to the PIMP measure and show that its prediction accuracy is superior to that of other existing models. Availability: R code for the method presented in this article is available at http://www.mpi-inf.mpg.de/∼altmann/download/PIMP.R Contact: altmann@mpi-inf.mpg.de, laura.tolosi@mpi-inf.mpg.de Supplementary information: Supplementary data are available at Bioinformatics online.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
量子星尘发布了新的文献求助10
31秒前
科研通AI2S应助科研通管家采纳,获得10
1分钟前
量子星尘发布了新的文献求助10
1分钟前
1分钟前
霸气甜瓜发布了新的文献求助10
1分钟前
文与武完成签到 ,获得积分10
1分钟前
冷酷的澜完成签到 ,获得积分10
1分钟前
量子星尘发布了新的文献求助10
1分钟前
lixuebin完成签到 ,获得积分10
1分钟前
Lee完成签到,获得积分20
2分钟前
量子星尘发布了新的文献求助10
2分钟前
2分钟前
Mcdreamy完成签到,获得积分10
2分钟前
霸气甜瓜完成签到,获得积分10
2分钟前
量子星尘发布了新的文献求助10
2分钟前
俭朴蜜蜂完成签到 ,获得积分10
2分钟前
123456777完成签到 ,获得积分10
2分钟前
量子星尘发布了新的文献求助10
3分钟前
3分钟前
辰辰完成签到 ,获得积分10
3分钟前
量子星尘发布了新的文献求助10
3分钟前
摇晃的红酒杯给孫芸的求助进行了留言
3分钟前
3分钟前
量子星尘发布了新的文献求助10
4分钟前
4分钟前
坚果发布了新的文献求助10
4分钟前
呵呵贺哈完成签到 ,获得积分10
4分钟前
量子星尘发布了新的文献求助10
4分钟前
4分钟前
4分钟前
量子星尘发布了新的文献求助10
5分钟前
5分钟前
MchemG应助受伤如冬采纳,获得10
5分钟前
量子星尘发布了新的文献求助10
5分钟前
5分钟前
量子星尘发布了新的文献求助10
6分钟前
Cheney完成签到 ,获得积分10
6分钟前
6分钟前
量子星尘发布了新的文献求助10
6分钟前
科研通AI5应助123456采纳,获得10
6分钟前
高分求助中
【提示信息,请勿应助】请使用合适的网盘上传文件 10000
The Oxford Encyclopedia of the History of Modern Psychology 1500
Green Star Japan: Esperanto and the International Language Question, 1880–1945 800
Sentimental Republic: Chinese Intellectuals and the Maoist Past 800
The Martian climate revisited: atmosphere and environment of a desert planet 800
The Psychology of Advertising (5th edition) 500
Electron microscopy study of magnesium hydride (MgH2) for Hydrogen Storage 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3865727
求助须知:如何正确求助?哪些是违规求助? 3408277
关于积分的说明 10657128
捐赠科研通 3132257
什么是DOI,文献DOI怎么找? 1727494
邀请新用户注册赠送积分活动 832338
科研通“疑难数据库(出版商)”最低求助积分说明 780222