判别分析模型为:
每个类(Y
)生成数据(X
),采用多元正态分布。换句话说,模型假设X
具有高斯混合分布(gmdistribution
).
对于线性判别分析,模型中每个类具有相同的协方差矩阵;只有平均值是变化的。
对于二次判别分析,每个类的均值和协方差都是变化的。
在这个建模假设下,fitcdiscr
推导每个类的均值和协方差参数。
对于线性判别分析,它计算每个类的样本均值。然后计算样本协方差,首先从各类的观测值中减去各类的样本均值,然后取结果的经验协方差矩阵。
对于二次判别分析,它计算每个类的样本均值。然后计算样本协方差,首先从各类的观测值中减去各类的样本均值,再取各类的经验协方差矩阵。
的适合
方法不使用先验概率或成本进行拟合。
fitcdiscr
使用下列方案构造加权分类器。假设米是一个N——- - - - - -K类成员矩阵:
米nk= 1 if观察n从类k
米nk= 0。
未加权数据的类均值估计为
对于权重为正的加权数据wn,自然的概括是
未加权数据的合并协方差矩阵的无偏估计为
对于二次判别分析,fitcdiscr
使用K= 1.
对于加权数据,假设权重和为1,合并协方差矩阵的无偏估计为
在哪里
是班级的权重之和吗k.
是每个类权重的平方和。