创建判别分析模型
判别分析的模型是:
每个类(
Y
)生成数据(X
使用多元正态分布)。换句话说,模型假设X
有一个高斯混合分布(gmdistribution
)。线性判别分析,该模型为每个类有相同的协方差矩阵;唯一的手段不同。
对于二次判别分析,两种均值和方差的每个类有所不同。
在这个模型的假设下,fitcdiscr
推断每个类的均值和协方差参数。
线性判别分析,计算每个类的样本均值。然后计算样本协方差先减去每个类的样本均值观测的类,并采取实证结果的协方差矩阵。
对于二次判别分析,计算每个类的样本均值。然后先减去计算样本协方差的样本均值观测的类,每个类,每个类的经验协方差矩阵。
的适合
方法不使用先验概率或配件的成本。
加权观测
fitcdiscr
构造加权分类器使用以下方案。假设米是一个N——- - - - - -K类成员矩阵:
米nk= 1如果观察n从类k
米nk= 0。
类的估计意味着数据是无关紧要的
用积极的权重加权数据wn,自然推广
集中在无偏估计的协方差矩阵为无关紧要的数据
对于二次判别分析,fitcdiscr
使用K= 1。
对于加权数据,假设权重之和为1,汇集成的无偏估计协方差矩阵
在哪里
类权重的总和吗k。
每个类是平方重量的总和。