主要内容

验后估计与仿真诊断

实证,自定义和semiconjugate先前的模型产生顽固性分析后验分布(更多详情,请参阅分析棘手的后验).为了总结后验分布进行估计和推断,第一个模型需要蒙特卡罗抽样,而后两个模型需要马尔可夫链蒙特卡罗(MCMC)抽样。当使用蒙特卡罗样本,特别是MCMC样本估计后验时,您可能会遇到问题,导致样本不能充分代表或没有总结后验分布。在这种情况下,基于后验图的估计和推断可能是错误的。

即使是后分析听话或您的MCMC样本代表真实的后验好了,你的先验分布的选择可以影响意想不到的方式后验分布。例如,一个小的变化,以先验分布,如在先前超参数的值的少量增加,可以对后验估计或推断有很大影响。如果后是敏感之前的假设,然后统计和推论的解释基于后可能会产生误导。

因此,在抽样算法得到后验分布后,确定样本的质量是非常重要的。此外,无论后验在分析上是否可处理,重要的是检查后验对先验分布假设的敏感性。

获得诊断模型样本

当绘制一个MCMC样品,好的做法是绘制一个较小的,导频样本,然后视图跟踪地块的参数值,以检查样品是否足够。跟踪地块是相对于模拟索引所绘制的参数值的曲线图。满意的MCMC样品快速混合达到平稳分布很好,就是探索很少在宽阔的台阶分布没有先前的平局内存。这个数字是一个令人满意的MCMC样品的一个例子。

这个列表描述了MCMC示例中存在问题的特征,给出了在跟踪图中查找什么内容的示例,并描述了如何解决这个问题。

  • MCMC样本似乎以静止分配行进,即它显示瞬态特性

    要解决这个问题,可以使用以下方法之一:

    • 指定更接近静止分发的均值的参数的起始值,或者使用以下值指定您期望的值BetaStartSigma2Start名称 - 值对的参数。

    • 指定A.老化期间,即从数字抽取开始,从后验估计中去除,使用燃烧名称-值对的论点。烧入期应该足够大,以便剩余的样品类似于一个满意的MCMC样本,以及足够小,以便调整样本规模足够大。

  • MCMC样品显示高序列相关性。下图为轨迹图和自相关函数(ACF)图(见下图)autocorr).

    轨迹图显示,随后的样本似乎是过去样本的函数。ACF图显示了一个具有高度自相关性的过程。

    这样的MCMC样品混合不当,需要很长的时间来充分发掘分布。尝试以下内容:

    • 如果您有足够的资源,那么基于大型MCMC样本的估计值近似是正确的。

    • 为了降低高自相关性,您可以保留MCMC样本的一部分变薄使用名称-值对的论点。

    • 对于自定义之前的模型,尝试不同的取样器使用的取样器名称-值对的论点。要调整采样器的调整参数,请通过使用创建采样器选项结构sampleroptions,它允许您指定的调谐参数的采样和值。然后,通过采样器选项结构估计模拟,或预测通过使用'选项'名称-值对的论点。

  • 该MCMC样本跳跃的州。

    该图显示了以值为中心的子样本27, 和5,混合得很好。这种行为可能表明以下特征之一:

    • 至少其中一个参数是无法识别。您可能必须要改革你的模型和假设。

    • 有可能是您的吉布斯采样编码问题。

    • 平稳分布是多峰。在这个例子中,在状态的概率为中心在7是最高的,其次是2, 进而5.移出以点为中心的状态的概率7很低。

      如果您之前是强大的,你的样本量很小,那么你可能会看到这种类型的MCMC样本,这不一定是有问题的。

  • 马尔可夫链不收敛于其平稳分布。

    曲线看起来像随机散步,因为MCMC正在慢慢探索后部。如果发生此问题,则基于MCMC示例的后估计是不正确的。要纠正问题,请尝试以下技术:

    • 如果你有足够的资源,吸取更多的样品,然后再确定是否链条最终稳定和轻微混合。如果它落户和混合比较好,然后取出样品的开始部分,并考虑减薄样本的休息。例如,假设你画20000图中链的样本,然后你会发现链在附近-37000吸引了。你可以治疗抽筋1:7000作为老化(燃烧),然后瘦()其余即将实现的自相关的一个令人满意的水平。

    • 重新参数化先验分布。当估算customblm模型对象,您可以指定对对数尺度扰动方差的重新参数化使用回购名称-值对的论点。

    • 对于自定义之前的模型,尝试不同的取样器使用的取样器名称-值对的论点。要调整采样器的调整参数,请通过使用创建采样器选项结构sampleroptions,它允许您指定的调谐参数的采样和值。然后,通过采样器选项结构估计模拟,或预测通过使用'选项'名称-值对的论点。

除了跟踪和acf图,估计模拟, 和预测估计有效样本容量.如果有效样本大小小于观察数的1%,那么这些函数会抛出警告。有关详细信息,请参见[1]

进行敏感性分析

一个敏感性分析包括确定后验估计对先验和数据分布假设的稳健性。也就是说,目标是学习如何用合理的替代方案替换初始值和先验假设,从而影响后验分布和推论。如果后验和推论对应用没有太大的变化,那么后验对先验假设和初值是稳健的。后验和推论随着不同的初始假设而有很大的不同,可能导致错误的解释。

进行敏感性分析:

  1. 确定一组合理的先前模型。包括弥漫(diffuseblm)模型和主观(conjugateblm或者semiconjugateblm)模式,更容易理解和允许包含的先验信息。

  2. 对于每个先验模型,确定一组似是而非的超参数值。例如,对于正-逆-共轭或半共轭先验模型,选择回归系数的先验均值和协方差矩阵的不同值,以及干扰方差的逆伽马分布的形状和尺度参数。有关详细信息,请参见V一个, 和B的名称 - 值对参数bayeslm

  3. 对于所有先前的模型假设:

    1. 使用相应的评估后验估计

    2. 使用后验进行推断。例如,获得95%等尾可信区间或预测响应给定的预测数据使用预测

  4. 比较模型中估计和推断。

    • 如果所有的估计和推断足够相似,那么后强劲。

    • 如果预测或推断有足够的不同,则可能是与所选先验或数据可能一些潜在的问题。因为在计量经济学工具箱™贝叶斯线性回归框架总是假设数据是高斯,可以考虑:

      • 从回归模型中添加或删除预测变量

      • 使先验更多的信息

      • 完全不同的预先假设

有关敏感性分析的详细信息,请参阅[2],ch。6。

参考

[1]螟,C.J。“实用马尔可夫链蒙特卡洛”。统计科学。卷。7,1992,第473-483页。

[2]的Gelman,A.,J。B.卡林,H. S.斯特恩和D. B.鲁宾。贝叶斯数据分析,第2位。编辑。博卡拉顿:查普曼和霍尔/ CRC,2004年。

另请参阅

||

相关话题