亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

[Optimizing MaxEnt model in the prediction of species distribution.]

过度拟合 特征选择 统计 计算机科学 样本量测定 最大熵原理 二进制数 数学 计量经济学 人工智能 人工神经网络 算术
作者
Wei Yao Kong,Xin Hai Li,Hong Fei Zou
出处
期刊:PubMed 卷期号:30 (6): 2116-2128 被引量:53
标识
DOI:10.13287/j.1001-9332.201906.029
摘要

Maximum Entropy (MaxEnt) model has been widely used in recent years. However, MaxEnt is highly inclined to produce misleading results if it is not well optimized. We summarized the researches about the model optimization for sampling bias correction, model complexity tuning, presence-absence threshold selection, and model evaluation. Spatial filtering performs best for sampling bias correction, while restricted background method shows the lowest efficacy. Model complexi-ty is mainly determined by three factors: The number of environmental variables, model feature types, and regularization multiplier. Variables filtering is needed when sample size is less than the number of environment variables. The criterion of variables selection should focus on their ecological significance rather than the co-linearity between them. The choice of feature types has relatively limi-ted effects on predictive performance of the model, therefore it is advised to choose simpler models. To control overfitting, it is necessary to conduct species-specific tuning on regularization multiplier, which was usually bigger than the default setting. There are three criteria called objectivity, equality and discriminability for selecting threshold to convert continuous predication (e.g. probability of presence) into binary results. Maximizing the sum of sensitivity and specificity is a sound method for threshold selection. Model evaluation methods could be classified into two main types: Threshold-independent and threshold-dependent. Among the threshold-independent evaluations, information criteria may offer significant advantages over AUC and COR. True Skill Statistics is a better index for threshold-dependent evaluations, because it takes both omission and commission errors into account, and is robust to pseudo-absence assumption and species prevalence.最大熵模型在物种分布的预测研究中得到广泛应用,但未经优化的模型的预测结果可能存在严重的拟合偏差.本文汇总了最大熵模型在取样偏差修正、模型复杂性调整、物种分布判定阈值选择以及模型检验过程中的若干优化方法.在取样偏差的修正中,空间筛除法的修正效果最好,而背景限制法表现不佳.模型复杂性受建模变量的数量、函数模式和调控系数的影响.在样本量小于建模变量的数量时需进行变量筛选,筛选标准应侧重其生态学意义,而非变量间的相关性;函数模式对模型表现影响不大,在预测结果相近情况下应选择简单模型;建模时需要调整调控系数以控制过度拟合,一般最优模型调控系数高于默认值.判定物种出现阈值应遵从客观性、等效性和判别力3个原则,敏感度和特异性加和最大是良好的阈值判定标准.模型检验可分为不依赖阈值的检验和依赖阈值的检验,在不依赖阈值的模型评估方法中,基于信息标准选择的模型表现优于基于AUC或相关系数(COR)选择的模型;在基于阈值的模型评估方法中,真实技能统计能够兼顾模型遗漏误差和错判误差,不受假设缺失影响,且受物种流行度的影响较小.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
仰勒完成签到 ,获得积分10
10秒前
11秒前
英俊的铭应助科研通管家采纳,获得10
11秒前
科研通AI2S应助科研通管家采纳,获得10
11秒前
共享精神应助泊岸采纳,获得10
16秒前
24秒前
leicaixia完成签到 ,获得积分10
25秒前
泊岸发布了新的文献求助10
29秒前
西吴完成签到 ,获得积分0
47秒前
泊岸发布了新的文献求助10
52秒前
1分钟前
烛光发布了新的文献求助10
1分钟前
bkagyin应助烛光采纳,获得10
1分钟前
爆米花应助泊岸采纳,获得10
1分钟前
1分钟前
泊岸发布了新的文献求助10
1分钟前
龚文亮完成签到,获得积分10
2分钟前
大模型应助泊岸采纳,获得30
2分钟前
汉堡包应助科研通管家采纳,获得10
2分钟前
2分钟前
科研通AI6.1应助文艺烧鹅采纳,获得10
2分钟前
2分钟前
泊岸发布了新的文献求助30
2分钟前
酷波er应助今天也要早睡采纳,获得10
2分钟前
胡德完成签到 ,获得积分10
2分钟前
爆米花应助泊岸采纳,获得30
3分钟前
3分钟前
3分钟前
泊岸发布了新的文献求助30
3分钟前
小透明发布了新的文献求助10
3分钟前
辣椒油完成签到,获得积分10
3分钟前
赘婿应助泊岸采纳,获得10
3分钟前
斯文败类应助xwz626采纳,获得10
3分钟前
4分钟前
深情安青应助科研通管家采纳,获得10
4分钟前
4分钟前
泊岸发布了新的文献求助10
4分钟前
4分钟前
xwz626发布了新的文献求助10
4分钟前
4分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
天津市智库成果选编 600
全相对论原子结构与含时波包动力学的理论研究--清华大学 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6444411
求助须知:如何正确求助?哪些是违规求助? 8258327
关于积分的说明 17591054
捐赠科研通 5503586
什么是DOI,文献DOI怎么找? 2901353
邀请新用户注册赠送积分活动 1878416
关于科研通互助平台的介绍 1717719