主要内容

建立判别分析模型

判别分析模型为:

  • 每个类(Y)生成数据(X),采用多元正态分布。换句话说,模型假设X具有高斯混合分布(gmdistribution).

    • 对于线性判别分析,模型中每个类具有相同的协方差矩阵;只有平均值是变化的。

    • 对于二次判别分析,每个类的均值和协方差都是变化的。

在这个建模假设下,fitcdiscr推导每个类的均值和协方差参数。

  • 对于线性判别分析,它计算每个类的样本均值。然后计算样本协方差,首先从各类的观测值中减去各类的样本均值,然后取结果的经验协方差矩阵。

  • 对于二次判别分析,它计算每个类的样本均值。然后计算样本协方差,首先从各类的观测值中减去各类的样本均值,再取各类的经验协方差矩阵。

适合方法不使用先验概率或成本进行拟合。

加权观测

fitcdiscr使用下列方案构造加权分类器。假设是一个N——- - - - - -K类成员矩阵:

nk= 1 if观察n从类k
nk= 0。

未加权数据的类均值估计为

μ k n 1 N n k x n n 1 N n k

对于权重为正的加权数据wn,自然的概括是

μ k n 1 N n k w n x n n 1 N n k w n

未加权数据的合并协方差矩阵的无偏估计为

Σ n 1 N k 1 K n k x n μ k x n μ k T N K

对于二次判别分析,fitcdiscr使用K= 1

对于加权数据,假设权重和为1,合并协方差矩阵的无偏估计为

Σ n 1 N k 1 K n k w n x n μ k x n μ k T 1 k 1 K W k 2 W k

在哪里

  • W k n 1 N n k w n 是班级的权重之和吗k

  • W k 2 n 1 N n k w n 2 是每个类权重的平方和。

另请参阅

功能

对象

相关的话题