清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Conditional likelihood maximisation: a unifying framework for information theoretic feature selection

特征选择 启发式 计算机科学 启发式 马尔可夫毯 相互信息 特征(语言学) 冗余(工程) 条件互信息 概率逻辑 最小冗余特征选择 机器学习 人工智能 马尔可夫链 数学优化 数学 马尔可夫模型 马尔可夫性质 哲学 操作系统 语言学
作者
Gavin Brown,Adam Pocock,Mingjie Zhao,Mikel Luján
摘要

We present a unifying framework for information theoretic feature selection, bringing almost two decades of research on heuristic filter criteria under a single theoretical interpretation. This is in response to the question: “what are the implicit statistical assumptions of feature selection criteria based on mutual information?”. To answer this, we adopt a different strategy than is usual in the feature selection literature—instead of trying to define a criterion, we derive one, directly from a clearly specified objective function: the conditional likelihood of the training labels. While many hand-designed heuristic criteria try to optimize a definition of feature ‘relevancy ’ and ‘redundancy’, our approach leads to a probabilistic framework which naturally incorporates these concepts. As a result we can unify the numerous criteria published over the last two decades, and show them to be low-order approximations to the exact (but intractable) optimisation problem. The primary contribution is to show that common heuristics for information based feature selection (including Markov Blanket algorithms as a special case) are approximate iterative maximisers of the conditional likelihood. A large empirical study provides strong evidence to favour certain classes of criteria, in particular those that balance the relative size of the relevancy/redundancy terms. Overall we conclude that the JMI criterion (Yang and Moody, 1999; Meyer et al., 2008) provides the best tradeoff in terms of accuracy, stability, and flexibility with small data samples.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
CodeCraft应助科研通管家采纳,获得10
2秒前
MOLV应助雪山飞龙采纳,获得10
5秒前
雪山飞龙完成签到,获得积分10
11秒前
量子星尘发布了新的文献求助10
16秒前
企鹅v完成签到,获得积分10
36秒前
高高的从波完成签到,获得积分10
39秒前
可夫司机完成签到 ,获得积分10
47秒前
55秒前
icoo发布了新的文献求助10
59秒前
牛黄完成签到 ,获得积分10
1分钟前
脑洞疼应助icoo采纳,获得10
1分钟前
姚芭蕉完成签到 ,获得积分0
1分钟前
1分钟前
萌大叔发布了新的文献求助30
1分钟前
华仔应助科研通管家采纳,获得150
2分钟前
2分钟前
Liuruijia完成签到 ,获得积分10
2分钟前
whitepiece完成签到,获得积分10
2分钟前
2分钟前
icoo发布了新的文献求助10
2分钟前
orixero应助icoo采纳,获得10
3分钟前
JD完成签到 ,获得积分10
3分钟前
zzhui完成签到,获得积分10
3分钟前
3分钟前
skotrie189完成签到,获得积分10
3分钟前
ffff完成签到 ,获得积分10
3分钟前
红火发布了新的文献求助10
3分钟前
gyx完成签到 ,获得积分10
4分钟前
ding应助燕海雪采纳,获得10
4分钟前
Richard完成签到,获得积分20
4分钟前
4分钟前
vothuong完成签到,获得积分10
4分钟前
icoo发布了新的文献求助10
4分钟前
和谐的夏岚完成签到 ,获得积分10
4分钟前
yyds应助minahn采纳,获得50
4分钟前
隐形曼青应助icoo采纳,获得10
4分钟前
黄陈涛完成签到 ,获得积分10
4分钟前
4分钟前
Cell完成签到 ,获得积分10
5分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Encyclopedia of Reproduction Third Edition 3000
《药学类医疗服务价格项目立项指南(征求意见稿)》 1000
花の香りの秘密―遺伝子情報から機能性まで 800
1st Edition Sports Rehabilitation and Training Multidisciplinary Perspectives By Richard Moss, Adam Gledhill 600
Chemistry and Biochemistry: Research Progress Vol. 7 430
Bone Marrow Immunohistochemistry 400
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5628556
求助须知:如何正确求助?哪些是违规求助? 4717522
关于积分的说明 14964513
捐赠科研通 4786353
什么是DOI,文献DOI怎么找? 2555764
邀请新用户注册赠送积分活动 1516951
关于科研通互助平台的介绍 1477604