Maxent最大熵模型在实际操作做中,容易出现错误,该模型时非常容易上手,但会出现许多错误的模型。特别是大区域预测气候或生物栖息地。总结来说,一个简单的Maxent模型的结果,可以包括几个关键部分:一、模型表现的评估;二、阈值,判断是否有分布;三、预测的分布图;四、物种和环境的关系;五、环境变量对于这个物种分布的影响。
一、模型表现评估 二、Threshold阈值预测物种分布概率,但有些情况下,也可以解释为栖息地的适宜程度。将0-1连续数据变成一个分类值的阈值范围,认为大于这个值是有物种分布的。
三、预测分布图白点是我们的数据点,颜色越暖分布可能性越高
四、物种与环境关系
Response curves 物种与环境变量间的关系,第一行是所有变量加进去后物种与环境的关系,曲线显示了预测的存在概率如何随着每个环境变量的变化而变化,同时将所有其他环境变量保持在它们的平均样本值。第二行是单变量,就是但看这个物种跟变量的关系。如果变量之间存在强相关性,它们可能更容易解释。
五、环境变量对物种分布的影响参考下图中的表格。
六、关键衡量值
Reliable(可信)、Repeatable(可重复)、Defendable(可验证)这三个词就非常重要
在这个基础之上,其实我们做任何模型,都会发现这些模型的表现会存在两个关键的衡量的值。一个是Bias(偏差):模型预测的这个值跟真实值之间的差别,还有一个是Variance(变异),Variance指的是预测五次、预测十次或当用百分之百的数据、90%的数据、80%的数据,或当用各种各样的分析路径时,预测的结果是否稳定。
A预测准确;B出现某种系统误差,偏差大,变异小;C取均值也是不错的模型;D是最差情况。
模型验证:更好的方法是K-partitions(folds)
七、注意事项1.变量之间的相关性,若高度相关,应该保留一个或变成复合变量
2.数据过于集中
3.解读物种与环境相关时,需要谨慎
4.变量贡献值不稳定,是由于不同建模方法、不同变量数据导致的



