模型建立和评估

特征选择、特征工程、模型选择、超参数优化、交叉验证、预测性能评估、分类精度比较试验

在构建高质量的预测分类模型时，选择正确的特征(或预测器)和调优超参数(未估计的模型参数)非常重要。

功能选择和超参数调整可以产生多个模型k-模型中的折叠误分类率、受试者操作特征（ROC）曲线或混淆矩阵。或者，进行统计测试，以检测一个分类模型是否显著优于另一个分类模型。

要在训练分类模型之前设计新的特征，请使用地理特征．

为了交互式地建立和评估分类模型，使用分类学习者应用程序。

要自动选择具有调优超参数的模型，请使用fitcauto．此函数尝试选择具有不同超参数值的分类模型类型，并返回一个最终模型，该模型预计将在新数据上运行良好。使用fitcauto当您不确定哪种分类器类型最适合您的数据时。

要优化特定模型的超参数，请选择超参数值并使用这些值交叉验证模型。例如，要调优SVM模型，选择一组框约束和核尺度，然后为每一对值交叉验证模型。某些Statistics和Machine Learning Toolbox™分类函数通过贝叶斯优化、网格搜索或随机搜索提供自动超参数调优。然而，用于实现贝叶斯优化的主要函数，bayesopt，足够灵活，可用于其他应用。看见贝叶斯优化工作流．

要解释分类模型，您可以使用石灰，沙普利和局部依赖．

应用程序

分类学习者

使用有监督机器学习训练数据分类模型

功能

全部展开

特征选择

`fscchi2`	基于卡方检验的单变量特征分类排序
`fscmrmr`	使用最小冗余最大相关（MRMR）算法对分类特征进行排序
`fscnca`	基于邻域分量分析的分类特征选择
`oobPermutedPredictorImportance`	分类树随机森林的预测值重要性估计
`predictorImportance`	分类树预测器重要性的估计
`predictorImportance`	决策树分类集成中预测器重要性的估计
`顺序`	使用自定义标准的序列特征选择
`relieff`	使用ReliefF或RReliefF算法对预测因子的重要性进行排序

特征工程

`地理特征`	执行分类的自动化特征工程
`描述`	描述生成特性
`变换`	使用生成的特性转换新数据

自动模型选择

fitcauto 使用优化的超参数自动选择分类模型

超参数优化

`bayesopt`	使用贝叶斯优化选择最优的机器学习超参数
`hyperparameters`	优化拟合函数的变量描述
`优化变量`	变量描述`bayesopt`或其他优化

交叉验证

`crossval`	使用交叉验证估计损失
`cvpartition`	分区数据以进行交叉验证
`再分配`	交叉验证的重新分区数据
`测试`	交叉验证试验指标
`培训`	交叉验证的培训指标

模型的解释

本地可解释模型不可知解释(LIME)

`石灰`	局部可解释模型不可知解释（LIME）
`适合`	拟合局部可解释模型不可知解释的简单模型（LIME）
`情节`	局部可解释模型不可知解释（LIME）的绘图结果

夏普利值

`沙普利`	沙普利值
`适合`	计算查询点的Shapley值
`情节`	绘制Shapley值

部分依赖

`部分依赖`	计算部分依赖
`局部依赖`	创建部分依赖图(PDP)和个人条件期望图(ICE)

分类性能评价

`confusionchart`	创建分类问题的混淆矩阵图
`混淆垫`	计算分类问题的混淆矩阵
`性能曲线`	分类器输出的接收器工作特性（ROC）曲线或其他性能曲线