模型构建和评估

特征选择、特征工程、模式选择、hyperparameter优化,交叉验证,预测绩效评估,分类精度比较测试

当你建立一个高质量、预测分类模型中,重要的是要选择正确的特性(或因素)和调优hyperparameters(不估计模型参数)。

特征选择和hyperparameter调优可以产生多个模型。你可以比较k倍误分类率,接受者操作特征(ROC)曲线,或混淆矩阵的模型。或者进行统计检验,检测是否分类模型明显优于另一种。

之前工程师新功能训练一个分类模型,使用gencfeatures。

要构建和评估分类模型交互,可以使用分类学习者应用程序。

与调谐hyperparameters自动选择一个模型,使用fitcauto。这个函数尝试分类模型类型的选择与不同hyperparameter值并返回最后一个模型,将执行新的数据。使用fitcauto当你不确定分类器类型最适合您的数据。

调整hyperparameters特定的模型,选择hyperparameter值和模型旨在使用这些值。例如,调整一个SVM模型,选择一组框约束和内核扩展,然后为每一对旨在模型值。某些统计和机器学习工具箱™提供自动分类功能hyperparameter通过贝叶斯优化,优化网格搜索,或者随机搜索。bayesopt实现贝叶斯优化,主要的功能是足够灵活的许多其他应用程序。看到贝叶斯优化工作流程。

解释一个分类模型,您可以使用石灰,沙普利,plotPartialDependence。

应用程序

分类学习者

火车模型使用监督机器学习分类数据

功能

全部展开

特征选择

`fscchi2`	单变量特性排名分类使用卡方测试
`fscmrmr`	使用最小冗余最大相关性等级特性分类(MRMR)算法
`fscnca`	特征选择使用社区组件分析分类
`oobPermutedPredictorImportance`	预测估计重要性的排列out-of-bag预测观测随机森林分类树
`predictorImportance`	估计预测重要的分类树
`predictorImportance`	估计预测决策树分类合奏的重要性
`sequentialfs`	连续的特征选择使用自定义标准
`relieff`	排名使用ReliefF或RReliefF算法预测的重要性

工程特性

`gencfeatures`	执行工程自动化特性分类
`描述`	描述生成特性
`变换`	改变新的数据使用生成的特性

自动模型选择

fitcauto 自动选择与优化hyperparameters分类模型

Hyperparameter优化

`bayesopt`	选择最优的机器学习hyperparameters使用贝叶斯优化
`hyperparameters`	为优化变量描述一个合适的函数
`optimizableVariable`	变量描述`bayesopt`或其他优化

交叉验证

`crossval`	估计损失使用交叉验证
`cvpartition`	分区数据交叉验证
`重新分区`	重新分配数据交叉验证
`测试`	测试指标的交叉验证
`培训`	培训指标交叉验证

模型的解释

本地可Model-Agnostic解释(石灰)

`石灰`	本地可model-agnostic解释(石灰)
`适合`	适合当地可翻译的简单模型model-agnostic解释(石灰)
`情节`	当地阴谋的结果可判断的model-agnostic解释(石灰)

沙普利值

`沙普利`	沙普利值
`适合`	计算夏普利值查询点
`情节`	情节夏普利值

部分依赖

`partialDependence`	计算部分依赖
`plotPartialDependence`	创建部分依赖图(PDP)和个人条件期望(ICE)情节

分类性能评价

混淆矩阵

`confusionchart`	为分类问题创建混淆矩阵图
`confusionmat`	计算混淆矩阵的分类问题

接受者操作特征(ROC)曲线

`rocmetrics`	接受者操作特征(ROC)曲线和二进制和多类分类器的性能指标
`addMetrics`	计算额外的分类性能指标
`平均`	计算性能指标平均接受者操作特征(ROC)曲线的多类问题
`情节`	情节接受者操作特征(ROC)曲线和其他性能曲线
`perfcurve`	接受者操作特征(ROC)曲线或其他分类器输出性能曲线

模型精度比较测试

`testcholdout`	比较两种分类模型的预测精度
`testckfold`	比较两种分类模型的精度重复交叉验证

对象

全部展开

特征选择

FeatureSelectionNCAClassification 特征选择分类使用社区成分分析(NCA)

工程特性

FeatureTransformer 生成功能转换

Hyperparameter优化

BayesianOptimization 贝叶斯优化结果

属性

ConfusionMatrixChart属性	混淆矩阵图表外观和行为
ROCCurve属性	接受者操作特征(ROC)曲线的外观和行为

主题

分类学习者应用

训练分类模型的分类学习者应用
工作流程培训、比较和提高分类模型,包括自动、手动和并行训练。
可视化和评估分类器在分类学习者的表现
比较模型精度值,显示结果通过绘制类预测,并检查性能混淆矩阵中的每个类。
特征选择和特征转换使用分类学习者应用
排名算法识别有用的预测使用土地或特性,包括选择特性,并在分类学习者使用PCA变换特性。

特征选择

介绍了特征选择
学习特征选择算法和探索功能用于特征选择。
连续的特征选择
这个话题介绍顺序顺序特征选择和提供了一个示例,选择特性和使用自定义标准sequentialfs函数。
社区成分分析(NCA)特征选择
社区成分分析(NCA)是一种非参数方法选择功能最大化的目标回归和分类算法的预测精度。
调整正则化参数检测功能使用NCA分类
这个例子展示了如何调整正则化参数fscnca使用交叉验证。
规范判别分析分类器
做一个更健壮和简单的模型通过消除预测模型的预测能力的前提下。
为高维数据分类选择特性
这个例子展示了如何为高维数据分类选择特性。

工程特性

自动化功能工程分类
使用gencfeatures之前工程师新功能训练分类模型。之前预测新数据,应用相同的功能转换到新的数据集。

自动模型选择

自动化与贝叶斯分类器的选择和亚莎的优化
使用fitcauto尝试自动分类模型类型的选择与不同hyperparameter值,给定训练预测和响应数据。

Hyperparameter优化

贝叶斯优化工作流程
执行贝叶斯优化使用一个合适的函数或通过调用bayesopt直接。
变量的贝叶斯优化
为贝叶斯优化创建变量。
贝叶斯优化目标函数
建立贝叶斯优化的目标函数。
约束在贝叶斯优化
为贝叶斯优化设置不同类型的约束。
优化旨在使用bayesopt分类器
使用贝叶斯优化交叉验证的损失最小化。
优化分类器配合使用贝叶斯优化
使用交叉验证损失最小化OptimizeParameters名称-值参数的拟合函数。
贝叶斯优化情节功能
视觉监控一个贝叶斯优化。
贝叶斯优化输出功能
监控一个贝叶斯优化。
贝叶斯优化算法
理解底层为贝叶斯优化算法。
平行的贝叶斯优化
多贝叶斯优化并行工作。

模型的解释

解释机器学习模型
解释使用模型预测石灰和沙普利对象和plotPartialDependence函数。
沙普利值机器学习模型
机器学习模型计算夏普利值使用介入算法或条件的算法。

交叉验证

使用并行计算实现交叉验证
加快交叉验证使用并行计算。

分类性能评价

ROC曲线和性能指标
使用rocmetrics检查分类算法的性能测试数据集。
由perfcurve性能曲线
学习如何perfcurve函数计算一个接受者操作特征(ROC)曲线。