主要内容

创建判别分析模型

判别分析的模型是:

  • 每个类(Y)生成数据(X使用多元正态分布)。换句话说,模型假设X有一个高斯混合分布(gmdistribution)。

    • 线性判别分析,该模型为每个类有相同的协方差矩阵;唯一的手段不同。

    • 对于二次判别分析,两种均值和方差的每个类有所不同。

在这个模型的假设下,fitcdiscr推断每个类的均值和协方差参数。

  • 线性判别分析,计算每个类的样本均值。然后计算样本协方差先减去每个类的样本均值观测的类,并采取实证结果的协方差矩阵。

  • 对于二次判别分析,计算每个类的样本均值。然后先减去计算样本协方差的样本均值观测的类,每个类,每个类的经验协方差矩阵。

适合方法不使用先验概率或配件的成本。

加权观测

fitcdiscr构造加权分类器使用以下方案。假设是一个N——- - - - - -K类成员矩阵:

nk= 1如果观察n从类k
nk= 0。

类的估计意味着数据是无关紧要的

μ ^ k = n = 1 N n k x n n = 1 N n k

用积极的权重加权数据wn,自然推广

μ ^ k = n = 1 N n k w n x n n = 1 N n k w n

集中在无偏估计的协方差矩阵为无关紧要的数据

Σ ^ = n = 1 N k = 1 K n k ( x n μ ^ k ) ( x n μ ^ k ) T N K

对于二次判别分析,fitcdiscr使用K= 1

对于加权数据,假设权重之和为1,汇集成的无偏估计协方差矩阵

Σ ^ = n = 1 N k = 1 K n k w n ( x n μ ^ k ) ( x n μ ^ k ) T 1 k = 1 K W k ( 2 ) W k ,

在哪里

  • W k = n = 1 N n k w n 类权重的总和吗k

  • W k ( 2 ) = n = 1 N n k w n 2 每个类是平方重量的总和。

另请参阅

功能

对象

相关的话题