PLS/OPLS models in metabolomics: the impact of permutation of dataset rows on the K-fold cross-validation quality parameters

折叠(高阶函数) 排列(音乐) 代谢组学 OPL公司 交叉验证 计算机科学 人工智能 计算生物学 色谱法 生物 计算化学 化学 分子动力学 数据库 水模型 物理 声学 程序设计语言
作者
Mohamed N. Triba,Laurence Le Moyec,Roland Amathieu,Corentine Goossens,Nadia Bouchemal,Pierre Nahon,Douglas N. Rutledge,Philippe Savarin
出处
期刊:Molecular BioSystems [Royal Society of Chemistry]
卷期号:11 (1): 13-19 被引量:658
标识
DOI:10.1039/c4mb00414k
摘要

Among all the software packages available for discriminant analyses based on projection to latent structures (PLS-DA) or orthogonal projection to latent structures (OPLS-DA), SIMCA (Umetrics, Umeå Sweden) is the more widely used in the metabolomics field. SIMCA proposes many parameters or tests to assess the quality of the computed model (the number of significant components, R2, Q2, pCV-ANOVA, and the permutation test). Significance thresholds for these parameters are strongly application-dependent. Concerning the Q2 parameter, a significance threshold of 0.5 is generally admitted. However, during the last few years, many PLS-DA/OPLS-DA models built using SIMCA have been published with Q2 values lower than 0.5. The purpose of this opinion note is to point out that, in some circumstances frequently encountered in metabolomics, the values of these parameters strongly depend on the individuals that constitute the validation subsets. As a result of the way in which the software selects members of the calibration and validation subsets, a simple permutation of dataset rows can, in several cases, lead to contradictory conclusions about the significance of the models when a K-fold cross-validation is used. We believe that, when Q2 values lower than 0.5 are obtained, SIMCA users should at least verify that the quality parameters are stable towards permutation of the rows in their dataset.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
NTz完成签到,获得积分20
2秒前
hcdb完成签到,获得积分10
4秒前
alongi3完成签到,获得积分10
6秒前
NTz发布了新的文献求助10
6秒前
plz94完成签到 ,获得积分10
7秒前
charleslam完成签到,获得积分10
7秒前
7秒前
7秒前
8秒前
白夜行不起完成签到 ,获得积分10
8秒前
9秒前
宁安完成签到 ,获得积分10
10秒前
尊敬的夏槐完成签到,获得积分10
11秒前
慧慧34完成签到 ,获得积分10
12秒前
alongi3发布了新的文献求助10
14秒前
cliff139完成签到,获得积分10
17秒前
chen完成签到 ,获得积分10
17秒前
小亮完成签到,获得积分10
22秒前
zzj512682701完成签到,获得积分10
26秒前
nicheng完成签到 ,获得积分0
32秒前
小羊完成签到,获得积分0
36秒前
drtianyunhong完成签到,获得积分10
42秒前
清风细雨完成签到 ,获得积分10
43秒前
冰刀完成签到,获得积分10
45秒前
46秒前
无情的山雁完成签到 ,获得积分10
47秒前
jackhlj完成签到,获得积分10
50秒前
趁热拿铁完成签到 ,获得积分10
51秒前
柯彦完成签到 ,获得积分10
53秒前
欣喜的涵柏完成签到 ,获得积分10
53秒前
Juzco完成签到 ,获得积分10
1分钟前
1分钟前
香蕉觅云应助NTz采纳,获得10
1分钟前
1分钟前
Leanne应助科研通管家采纳,获得10
1分钟前
TTTTT完成签到 ,获得积分10
1分钟前
mimilv发布了新的文献求助10
1分钟前
昏睡的衬衫完成签到,获得积分10
1分钟前
笨笨水儿完成签到 ,获得积分10
1分钟前
高分求助中
Adhesion Science: Principles & Practice 1234
Signals, Systems, and Signal Processing 610
Burger's Medicinal Chemistry and Drug Discovery 400
A Step-by-Step Guide to Qualitative Data Coding 2nd Edition 400
Impact of Storage Orientation and Duration on Prefilled Syringe Performance: Break-Loose and Glide Forces, and Injection Time Across Multiple Time Points 360
Programming for Chemical Engineers Using C, C++, and MATLAB 300
Upland Kenya wild flowers and ferns: a flora of the flowers, ferns, grasses, and sedges of highland Kenya 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6663032
求助须知:如何正确求助?哪些是违规求助? 8413090
关于积分的说明 17984387
捐赠科研通 5866946
什么是DOI,文献DOI怎么找? 2974950
邀请新用户注册赠送积分活动 1950864
关于科研通互助平台的介绍 1876592