Interaction Screening for Ultrahigh-Dimensional Data

计算机科学 一致性(知识库) 集合(抽象数据类型) 财产(哲学) 选择(遗传算法) 软件 理论计算机科学 算法 数学优化 数学 机器学习 人工智能 哲学 认识论 程序设计语言
作者
Ning Hao,Hao Helen Zhang
标识
DOI:10.1080/01621459.2014.881741
摘要

In ultra-high dimensional data analysis, it is extremely challenging to identify important interaction effects, and a top concern in practice is computational feasibility. For a data set with n observations and p predictors, the augmented design matrix including all linear and order-2 terms is of size n × (p2 + 3p)/2. When p is large, say more than tens of hundreds, the number of interactions is enormous and beyond the capacity of standard machines and software tools for storage and analysis. In theory, the interaction selection consistency is hard to achieve in high dimensional settings. Interaction effects have heavier tails and more complex covariance structures than main effects in a random design, making theoretical analysis difficult. In this article, we propose to tackle these issues by forward-selection based procedures called iFOR, which identify interaction effects in a greedy forward fashion while maintaining the natural hierarchical model structure. Two algorithms, iFORT and iFORM, are studied. Computationally, the iFOR procedures are designed to be simple and fast to implement. No complex optimization tools are needed, since only OLS-type calculations are involved; the iFOR algorithms avoid storing and manipulating the whole augmented matrix, so the memory and CPU requirement is minimal; the computational complexity is linear in p for sparse models, hence feasible for p ≫ n. Theoretically, we prove that they possess sure screening property for ultra-high dimensional settings. Numerical examples are used to demonstrate their finite sample performance.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
等待小丸子完成签到,获得积分10
1秒前
lichunrong完成签到,获得积分10
3秒前
爱我不上火完成签到 ,获得积分10
5秒前
ACC完成签到 ,获得积分10
5秒前
尼古拉耶维奇完成签到 ,获得积分10
7秒前
25秒前
26秒前
dbc1234完成签到,获得积分10
28秒前
jiayelong发布了新的文献求助10
28秒前
香蕉觅云应助煜琪采纳,获得10
28秒前
翰飞寰宇完成签到 ,获得积分10
30秒前
坦率绮山完成签到 ,获得积分10
32秒前
小白果果完成签到,获得积分10
32秒前
披着羊皮的狼应助HYF采纳,获得10
43秒前
思源应助小蓝采纳,获得10
43秒前
52秒前
煜琪发布了新的文献求助10
55秒前
小崔加油完成签到 ,获得积分10
1分钟前
孟啊啊完成签到 ,获得积分10
1分钟前
lx完成签到 ,获得积分10
1分钟前
煜琪完成签到,获得积分10
1分钟前
hhh应助煜琪采纳,获得10
1分钟前
王志新完成签到 ,获得积分10
1分钟前
keyanxiaobaishu完成签到 ,获得积分10
1分钟前
1分钟前
张平一完成签到 ,获得积分10
1分钟前
小蓝发布了新的文献求助10
1分钟前
排骨大王完成签到 ,获得积分10
1分钟前
香蕉觅云应助小蓝采纳,获得10
1分钟前
懒得起名字完成签到 ,获得积分10
1分钟前
liuyepiao完成签到,获得积分10
1分钟前
粗暴的镜子完成签到,获得积分10
1分钟前
郭强完成签到,获得积分10
1分钟前
动人的诗霜完成签到 ,获得积分10
1分钟前
Kevin完成签到,获得积分10
1分钟前
1分钟前
hhh完成签到 ,获得积分10
1分钟前
xiaobin完成签到 ,获得积分10
2分钟前
左右完成签到 ,获得积分10
2分钟前
完美世界应助科研通管家采纳,获得10
2分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
天津市智库成果选编 600
全相对论原子结构与含时波包动力学的理论研究--清华大学 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6444807
求助须知:如何正确求助?哪些是违规求助? 8258579
关于积分的说明 17591494
捐赠科研通 5504451
什么是DOI,文献DOI怎么找? 2901543
邀请新用户注册赠送积分活动 1878538
关于科研通互助平台的介绍 1718106