如何评估安装分布通过比较定量统计数据?

39视图(30天)
你好,
我运行一个矩阵的回归(10 * 50回归,相同的原始数据集,不同的方法)。
旁边的r平方作简单比较的回归,我还想知道的残差分布由于残差是重要的进一步调查。我希望的残差收敛和很好分布式这意味着原始数据集和拟合曲线密切相关(概率偏差最小化)。
以来有很多的绘图方法不合适(柱状图、qqplot等)。我希望有一些数据可以计算拟合分布有多好,这样我就可以选择好的模型和使用它作为一个很好的方法及数据集。
与人类相比,我觉得安装分布可能t-localization-scale分布。我试着coftest,键槽和adt。然而,他们都拒绝零假设(即使r平方0.96)。我想知道我怎样才能改变零假设的标准?此外,假定值的收入都很低。我深感困惑。
这里有一些分布的比较:
正如你可以看到data1以及data2分布得很好,因为他们的形状而data3和data4 not-so-convergent。我甚至想比较loglikelihood但data4有1.0 e + 07 loglikelihood水平高。我应该做些什么呢?
2的评论
骑自行车的人
骑自行车的人 约5小时前
有一个 很多 在这个问题的解压缩。我不确定从哪里开始。
首先,你分享了一些信息,但可能不是最重要的信息。所以,在粗糙的重要性……
  • 你能共享数据集的吗?(我是正确的数据集可能拥有数百万数据点吗?)
  • 你能分享你用来构建模型的代码?
  • 如果你不能分享代码,至少描述您正在使用的模型。普通线性回归?机器学习(类型)什么?等。
  • 你有一个潜在的理论模型为什么会有一个特定的功能形式?
  • 是什么推动你的决定建造500个(!)模型?(看起来也许你手工调整参数?)
  • 你使用的所有数据训练模型,或者你使用独立的培训/验证/测试集吗?
其他一些maybe-relevant想法:
coeftest、自主和adt有一些重要的区别。零假设你想测试什么呢?残差的正态分布吗?对一些模型,这是一个重要的考试,但对其他人来说,它不是。不管怎样,拥有如此庞大的数据集,我希望几乎总是被拒绝零假设。
“哪个模型是最好的?”的问题是高度依赖模型是用于什么。这就是应该驱动拟合优度的定义,不是一些(可能是任意的)统计。例如,经常“最佳”模型是一个你认为最能预测未来数据(即最小化泛化误差)。有估计的方法。
当你说,“假定值低”…… 什么 假定值吗?

登录置评。

答案(0)

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!