主要内容

使用判别分析模型进行预测

预测使用三个量对观察结果进行分类:后验概率先验概率,费用

预测分类以使预期的分类成本最小化:

y 参数 最小值 y 1 ... K k 1 K P k | x ) C y | k )

在哪里

  • y 是预测的分类。

  • K为类数。

  • P k | x ) 是类的后验概率吗k为观察x

  • C y | k ) 对观察进行分类的成本是y当它真正的阶级是k

的空间X值分为区域进行分类Y是一个特定的值。线性判别分析用直线分隔区域,二次判别分析用二次曲线(椭圆、双曲线或抛物线)分隔区域。有关这些区域的可视化,请参见创建和可视化判别分析分类器

后验概率

一个点的后验概率x属于类k的乘积是先验概率和多元正态密度。多元法线的密度函数d意思是μkd——- - - - - -d协方差Σk在1 -d指向x

P x | k ) 1 2 π ) d | Σ k | ) 1 / 2 经验值 1 2 x μ k ) Σ k 1 x μ k ) T )

在哪里 | Σ k | 是Σ的行列式吗k, Σ k 1 是逆矩阵。

允许Pk)表示类的先验概率k.然后是观察到的后验概率x他是一流的k

P k | x ) P x | k ) P k ) P x )

在哪里Px)是一个标准化常数,即求和k属于Px|k)Pk).

先验概率

先验概率是三种选择之一:

  • “统一”-类别的先验概率k是1除以总类数。

  • “经验”-类别的先验概率k班级的训练样本数是多少k除以训练样本总数。

  • 一个数字向量-类的先验概率kj第Th元素之前向量。看到fitcdiscr

创建分类器之后obj,你可以使用点表示法设置prior:

obj。Prior = v;

在哪里v是表示每个元素出现频率的正元素向量。设置新的先验值时,无需重新训练分类器。

费用

有两种与鉴别分析分类相关的成本:每类真实的误分类成本,和每观察的预期误分类成本。

每类真实误分类成本

成本(i, j)将观察结果分类的成本是多少j如果它真正的阶级是.默认情况下,成本(i,j)=1如果i~=j,成本(i,j)=0如果i=j.换句话说,成本是0正确分类,以及1不正确的分类。

您可以在创建分类器时设置任何您喜欢的成本矩阵费用名称-值对的fitcdiscr

创建分类器之后obj,你可以使用点符号设置自定义成本:

obj。费用=B;

B方阵的大小是多少K——- - - - - -K当有K类。在设置新的代价时,不需要重新训练分类器。

每次观察的预期误分类成本

假设你有诺布你想用训练过的判别分析分类器分类的观察结果obj.假设你有K类。你将观察结果放入一个矩阵中Xnew每行只有一个观测值。命令

(标签、分数、成本)=预测(obj Xnew)

在其他输出中,返回大小为的成本矩阵诺布——- - - - - -K.成本矩阵的每一行都包含了将观察结果分类为每一个的预期(平均)成本K类。成本(n, k)

1 K P | X n ) ) C k | )

在哪里

  • K为类数。

  • P | X n ) ) 后验概率类的为观察Xnewn).

  • C k | ) 费用将观察结果归类为k当它真正的阶级是

另请参阅

功能

对象

相关话题