分类损失函数测量分类模型的预测不准确性。当你在许多模型中比较同一类型的损失时,损失越低表明预测模型越好。
假设如下:
l为加权平均分类损失。
n为样本量。
yj是被观察的类标签。软件将其编码为-1或1,表示负类或正类(或中第一类或第二类)一会
分别属性)。
f(Xj)为观察(行)的阳性分类评分j预测数据的X.
米j=yjf(Xj)为分类观察的分类评分j对应的类yj.积极的价值观米j表明正确的分类,对平均损失贡献不大。负的米j指出错误的分类,并对平均损失有很大的贡献。
观测权重j是wj.该软件将观测权值归一化,使其和为相应的先验类别概率。软件还将先验概率归一化,使其和为1。因此,
属性指定的支持的损失函数金宝app“LossFun”
名称-值参数。
损失函数 |
的价值LossFun |
方程 |
二项异常 |
“binodeviance” |
|
指数损失 |
“指数” |
|
十进制错误分类率 |
“classiferror” |
为得分最大的类对应的类标签。我{·}是指示函数。 |
铰链的损失 |
“枢纽” |
|
分对数损失 |
分对数的 |
|
最小的误分类成本 |
“mincost” |
“mincost” 只有当分类分数是后验概率时才合适。
该软件计算加权最小期望分类成本使用这一程序的观察j= 1,…,n.
估计对观测数据进行分类的预期误分类成本Xj到类k:
f(Xj)为观测的二值和多类分类的类后验概率列向量Xj.C成本矩阵存储在成本 模型的属性。
为观察j,预测与最小预期误分类成本相对应的类别标签:
使用C,确认已发生的成本(cj)做了预测。
最小期望误分类代价损失的加权平均值为
如果使用默认代价矩阵(其元素值为0表示正确分类,1表示不正确分类),则“mincost” 失则等于失“classiferror” 的损失。 |
二次损失 |
“二次” |
|
这个数字比较的损失函数(除了“mincost”
超过分数米一个观察。一些函数被归一化通过点(0,1)。