清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Robust Huber-LASSO for improved prediction of protein, metabolite and gene expression levels relying on individual genotype data

Lasso(编程语言) 过度拟合 离群值 回归 单核苷酸多态性 线性回归 统计 计算生物学 生物 计算机科学 数学 基因型 遗传学 人工智能 基因 万维网 人工神经网络
作者
Heike Deutelmoser,Dominique Scherer,Hermann Brenner,Mélanie Waldenberger,Karsten Suhre,Gabi Kastenmüller,Justo Lorenzo Bermejo
出处
期刊:Briefings in Bioinformatics [Oxford University Press]
卷期号:22 (4) 被引量:13
标识
DOI:10.1093/bib/bbaa230
摘要

Abstract Least absolute shrinkage and selection operator (LASSO) regression is often applied to select the most promising set of single nucleotide polymorphisms (SNPs) associated with a molecular phenotype of interest. While the penalization parameter λ restricts the number of selected SNPs and the potential model overfitting, the least-squares loss function of standard LASSO regression translates into a strong dependence of statistical results on a small number of individuals with phenotypes or genotypes divergent from the majority of the study population—typically comprised of outliers and high-leverage observations. Robust methods have been developed to constrain the influence of divergent observations and generate statistical results that apply to the bulk of study data, but they have rarely been applied to genetic association studies. In this article, we review, for newcomers to the field of robust statistics, a novel version of standard LASSO that utilizes the Huber loss function. We conduct comprehensive simulations and analyze real protein, metabolite, mRNA expression and genotype data to compare the stability of penalization, the cross-iteration concordance of the model, the false-positive and true-positive rates and the prediction accuracy of standard and robust Huber-LASSO. Although the two methods showed controlled false-positive rates ≤2.1% and similar true-positive rates, robust Huber-LASSO outperformed standard LASSO in the accuracy of predicted protein, metabolite and gene expression levels using individual SNP data. The conducted simulations and real-data analyses show that robust Huber-LASSO represents a valuable alternative to standard LASSO in genetic studies of molecular phenotypes.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
jfw完成签到 ,获得积分10
15秒前
甜甜的tiantian完成签到 ,获得积分10
16秒前
1437594843完成签到 ,获得积分10
17秒前
虚心以蓝完成签到,获得积分10
25秒前
碧蓝雁风完成签到 ,获得积分10
40秒前
danli完成签到 ,获得积分10
54秒前
liuqi完成签到 ,获得积分10
1分钟前
dyuguo3完成签到 ,获得积分10
1分钟前
海阔天空完成签到 ,获得积分10
1分钟前
1分钟前
jumbaumba发布了新的文献求助10
1分钟前
许之北完成签到 ,获得积分10
1分钟前
海洋岩土12138完成签到 ,获得积分10
1分钟前
1分钟前
2分钟前
SciGPT应助贪玩钢铁侠采纳,获得10
2分钟前
2分钟前
乐乐完成签到 ,获得积分10
2分钟前
2分钟前
3分钟前
3分钟前
3分钟前
Noah完成签到 ,获得积分0
3分钟前
简奥斯汀完成签到 ,获得积分10
3分钟前
无悔完成签到 ,获得积分10
3分钟前
搜集达人应助Tethys采纳,获得10
3分钟前
温暖坚定完成签到 ,获得积分10
4分钟前
4分钟前
Tethys发布了新的文献求助10
4分钟前
呆萌的语芹完成签到,获得积分10
4分钟前
蚂蚁踢大象完成签到 ,获得积分10
4分钟前
大胆的小懒猪完成签到 ,获得积分10
5分钟前
胃是内分泌器官完成签到,获得积分10
5分钟前
希望天下0贩的0应助automan采纳,获得10
5分钟前
浚稚完成签到 ,获得积分10
5分钟前
ding应助细心的语蓉采纳,获得30
5分钟前
5分钟前
5分钟前
automan发布了新的文献求助10
5分钟前
5分钟前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 2500
Technologies supporting mass customization of apparel: A pilot project 450
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
A China diary: Peking 400
Brain and Heart The Triumphs and Struggles of a Pediatric Neurosurgeon 400
Cybersecurity Blueprint – Transitioning to Tech 400
Mixing the elements of mass customisation 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3784818
求助须知:如何正确求助?哪些是违规求助? 3330065
关于积分的说明 10244270
捐赠科研通 3045410
什么是DOI,文献DOI怎么找? 1671678
邀请新用户注册赠送积分活动 800597
科研通“疑难数据库(出版商)”最低求助积分说明 759524