以二进制fitcsvm考虑先验概率不同的类比例在训练集和测试集

2视图(30天)
你好,
我在一个二进制使用svm分类问题。由于不可避免的原因,我有不同的训练集和测试集类比例(约1:3 vs 1:5)。我想知道是否相应的测试先验概率的引入在选项前的培训fitcsvm时要考虑这种差异在测试集预测。

接受的答案

卡尔
卡尔 2017年10月10日
编辑:卡尔 2017年10月10日
嗨,亚历克西斯。指定一个值为“前”将影响支持向量机的训练过程,这将使一个差异如何为测试集预测。在任何情况下,“之前”的值不应该一定是您的测试集的先验概率,而是现实类的先验概率。
可以是有问题的,当真正的先验概率显著不同训练集的先验概率。如果你的训练集是代表的人口,那么你不应该提供任何“之前”。
这是一个更一般的问题被称为类不平衡或不平衡的数据集。你可以看到下面的答案发布之前建议如何解释这个问题:
//www.tatmou.com/matlabcentral/answers/11549-leraning-classification-with-most-training-samples-in-one-category
2的评论
恒马
恒马 2022年6月13日
哇!非常感谢。我也遇到这个问题。特里安之前数据集是1:7,特里accuary约为87.5%(这意味着不能单独的),但是使用这个特里结果,测试前数据集是1:1,accuary是90%左右,是错误的。

登录置评。

更多的答案(0)

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!