如何评估安装分布通过比较定量统计数据?

39视图(30天)

显示旧的评论

弗兰克 2023年5月19日在7:31

评论道: 骑自行车的人约7小时前

你好,

我运行一个矩阵的回归(10 * 50回归,相同的原始数据集,不同的方法)。

旁边的r平方作简单比较的回归,我还想知道的残差分布由于残差是重要的进一步调查。我希望的残差收敛和很好分布式这意味着原始数据集和拟合曲线密切相关(概率偏差最小化)。

以来有很多的绘图方法不合适(柱状图、qqplot等)。我希望有一些数据可以计算拟合分布有多好,这样我就可以选择好的模型和使用它作为一个很好的方法及数据集。

与人类相比,我觉得安装分布可能t-localization-scale分布。我试着coftest,键槽和adt。然而,他们都拒绝零假设(即使r平方0.96)。我想知道我怎样才能改变零假设的标准?此外,假定值的收入都很低。我深感困惑。

这里有一些分布的比较:

正如你可以看到data1以及data2分布得很好,因为他们的形状而data3和data4 not-so-convergent。我甚至想比较loglikelihood但data4有1.0 e + 07 loglikelihood水平高。我应该做些什么呢?

骑自行车的人约5小时前

有一个很多在这个问题的解压缩。我不确定从哪里开始。

首先,你分享了一些信息,但可能不是最重要的信息。所以,在粗糙的重要性……

其他一些maybe-relevant想法:

coeftest、自主和adt有一些重要的区别。零假设你想测试什么呢?残差的正态分布吗?对一些模型,这是一个重要的考试,但对其他人来说,它不是。不管怎样,拥有如此庞大的数据集,我希望几乎总是被拒绝零假设。

“哪个模型是最好的?”的问题是高度依赖模型是用于什么。这就是应该驱动拟合优度的定义,不是一些(可能是任意的)统计。例如,经常“最佳”模型是一个你认为最能预测未来数据(即最小化泛化误差)。有估计的方法。

当你说,“假定值低”…… 什么假定值吗?

人工智能,数据科学和统计数据统计和机器学习工具概率分布连续分布非中心t分布

找到更多的在非中心t分布在帮助中心和文件交换

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!