模型建立与评估

特征选择、特征工程、模型选择、超参数优化、交叉验证、预测性能评估、分类精度比较试验

在构建高质量的预测性分类模型时，选择正确的特征(或预测器)和调优超参数(未估计的模型参数)非常重要。

特征选择和超参数调整可以产生多个模型。你可以比较k-fold误分类率，受试者工作特征(ROC)曲线，或模型之间的混淆矩阵。或者，进行统计测试，以检测一个分类模型是否显著优于另一个。

要在训练分类模型之前设计新的特征，请使用gencfeatures．

为了交互式地建立和评估分类模型，使用分类学习者应用程序。

要自动选择具有调优超参数的模型，请使用fitcauto．此函数尝试选择具有不同超参数值的分类模型类型，并返回一个最终模型，该模型预计将在新数据上运行良好。使用fitcauto当您不确定哪种分类器类型最适合您的数据时。

要优化特定模型的超参数，请选择超参数值并使用这些值交叉验证模型。例如，要调优SVM模型，选择一组框约束和核尺度，然后为每一对值交叉验证模型。某些Statistics和Machine Learning Toolbox™分类函数通过贝叶斯优化、网格搜索或随机搜索提供自动超参数调优。bayesopt，实现贝叶斯优化的主要功能，对于许多其他应用程序也足够灵活。看到贝叶斯优化工作流程．

要解释分类模型，您可以使用石灰，沙普利,plotPartialDependence．

应用程序

分类学习者

使用有监督的机器学习训练模型来分类数据

功能

全部展开

特征选择

`fscchi2`	单变量特征排序分类使用卡方检验
`fscmrmr`	使用最小冗余最大相关性(MRMR)算法对等级特征进行分类
`fscnca`	特征选择使用邻域成分分析进行分类
`oobPermutedPredictorImportance`	分类树的随机森林的预测重要度由袋外预测观察的排列估计
`predictorImportance`	分类树中预测因子重要性的估计
`predictorImportance`	决策树分类集成中预测器重要性的估计
`sequentialfs`	使用自定义标准的顺序特征选择
`relieff`	使用ReliefF或RReliefF算法对预测因子的重要性进行排序

工程特性

`gencfeatures`	执行分类的自动化特征工程
`描述`	描述生成特性
`变换`	使用生成的特性转换新数据

自动模型选择

fitcauto 利用优化的超参数自动选择分类模型

Hyperparameter优化

`bayesopt`	使用贝叶斯优化选择最优的机器学习超参数
`hyperparameters`	用于优化拟合函数的变量描述
`optimizableVariable`	变量描述`bayesopt`或其他优化

交叉验证

`crossval`	使用交叉验证估计损失
`cvpartition`	分区数据以进行交叉验证
`重新分区`	重新分区数据以进行交叉验证
`测试`	交叉验证试验指标
`培训`	交叉验证的培训指标

模型的解释

本地可解释模型不可知解释(LIME)

`石灰`	局部可解释的模型不可知解释(LIME)
`适合`	拟合局部可解释模型不可知论解释(LIME)的简单模型
`情节`	局部可解释模型不可知解释(LIME)的图结果

沙普利值

`沙普利`	沙普利值
`适合`	计算查询点的Shapley值
`情节`	情节夏普利值

部分依赖

`partialDependence`	计算部分依赖
`plotPartialDependence`	创建部分依赖图(PDP)和个人条件期望图(ICE)

分类性能评价

`confusionchart`	创建分类问题的混淆矩阵图
`confusionmat`	计算分类问题的混淆矩阵
`perfcurve`	接收机工作特性(ROC)曲线或分类器输出的其他性能曲线