主要内容

模型构建和评估

特征选择、特征工程、模式选择、hyperparameter优化,交叉验证,预测绩效评估,分类精度比较测试

当你建立一个高质量、预测分类模型中,重要的是要选择正确的特性(或因素)和调优hyperparameters(不估计模型参数)。

特征选择和hyperparameter调优可以产生多个模型。你可以比较k倍误分类率,接受者操作特征(ROC)曲线,或混淆矩阵的模型。或者进行统计检验,检测是否分类模型明显优于另一种。

之前工程师新功能训练一个分类模型,使用gencfeatures

要构建和评估分类模型交互,可以使用分类学习者应用程序。

与调谐hyperparameters自动选择一个模型,使用fitcauto。这个函数尝试分类模型类型的选择与不同hyperparameter值并返回最后一个模型,将执行新的数据。使用fitcauto当你不确定分类器类型最适合您的数据。

调整hyperparameters特定的模型,选择hyperparameter值和模型旨在使用这些值。例如,调整一个SVM模型,选择一组框约束和内核扩展,然后为每一对旨在模型值。某些统计和机器学习工具箱™提供自动分类功能hyperparameter通过贝叶斯优化,优化网格搜索,或者随机搜索。bayesopt实现贝叶斯优化,主要的功能是足够灵活的许多其他应用程序。看到贝叶斯优化工作流程

解释一个分类模型,您可以使用石灰,沙普利,plotPartialDependence

应用程序

分类学习者 火车模型使用监督机器学习分类数据

功能

全部展开

fscchi2 单变量特性排名分类使用卡方测试
fscmrmr 使用最小冗余最大相关性等级特性分类(MRMR)算法
fscnca 特征选择使用社区组件分析分类
oobPermutedPredictorImportance 预测估计重要性的排列out-of-bag预测观测随机森林分类树
predictorImportance 估计预测重要的分类树
predictorImportance 估计预测决策树分类合奏的重要性
sequentialfs 连续的特征选择使用自定义标准
relieff 排名使用ReliefF或RReliefF算法预测的重要性
gencfeatures 执行工程自动化特性分类
描述 描述生成特性
变换 改变新的数据使用生成的特性
fitcauto 自动选择与优化hyperparameters分类模型
bayesopt 选择最优的机器学习hyperparameters使用贝叶斯优化
hyperparameters 为优化变量描述一个合适的函数
optimizableVariable 变量描述bayesopt或其他优化
crossval 估计损失使用交叉验证
cvpartition 分区数据交叉验证
重新分区 重新分配数据交叉验证
测试 测试指标的交叉验证
培训 培训指标交叉验证

本地可Model-Agnostic解释(石灰)

石灰 本地可model-agnostic解释(石灰)
适合 适合当地可翻译的简单模型model-agnostic解释(石灰)
情节 当地阴谋的结果可判断的model-agnostic解释(石灰)

沙普利值

沙普利 沙普利值
适合 计算夏普利值查询点
情节 情节夏普利值

部分依赖

partialDependence 计算部分依赖
plotPartialDependence 创建部分依赖图(PDP)和个人条件期望(ICE)情节

混淆矩阵

confusionchart 为分类问题创建混淆矩阵图
confusionmat 计算混淆矩阵的分类问题

接受者操作特征(ROC)曲线

rocmetrics 接受者操作特征(ROC)曲线和二进制和多类分类器的性能指标
addMetrics 计算额外的分类性能指标
平均 计算性能指标平均接受者操作特征(ROC)曲线的多类问题
情节 情节接受者操作特征(ROC)曲线和其他性能曲线
perfcurve 接受者操作特征(ROC)曲线或其他分类器输出性能曲线
testcholdout 比较两种分类模型的预测精度
testckfold 比较两种分类模型的精度重复交叉验证

对象

全部展开

FeatureSelectionNCAClassification 特征选择分类使用社区成分分析(NCA)
FeatureTransformer 生成功能转换
BayesianOptimization 贝叶斯优化结果

属性

ConfusionMatrixChart属性 混淆矩阵图表外观和行为
ROCCurve属性 接受者操作特征(ROC)曲线的外观和行为

主题

分类学习者应用

特征选择

工程特性

  • 自动化功能工程分类
    使用gencfeatures之前工程师新功能训练分类模型。之前预测新数据,应用相同的功能转换到新的数据集。

自动模型选择

Hyperparameter优化

模型的解释

交叉验证

分类性能评价