模型构建和评估
特征选择、特征工程、模式选择、hyperparameter优化,交叉验证,预测绩效评估,分类精度比较测试
当你建立一个高质量、预测分类模型中,重要的是要选择正确的特性(或因素)和调优hyperparameters(不估计模型参数)。
特征选择和hyperparameter调优可以产生多个模型。你可以比较k倍误分类率,接受者操作特征(ROC)曲线,或混淆矩阵的模型。或者进行统计检验,检测是否分类模型明显优于另一种。
之前工程师新功能训练一个分类模型,使用gencfeatures
。
要构建和评估分类模型交互,可以使用分类学习者应用程序。
与调谐hyperparameters自动选择一个模型,使用fitcauto
。这个函数尝试分类模型类型的选择与不同hyperparameter值并返回最后一个模型,将执行新的数据。使用fitcauto
当你不确定分类器类型最适合您的数据。
调整hyperparameters特定的模型,选择hyperparameter值和模型旨在使用这些值。例如,调整一个SVM模型,选择一组框约束和内核扩展,然后为每一对旨在模型值。某些统计和机器学习工具箱™提供自动分类功能hyperparameter通过贝叶斯优化,优化网格搜索,或者随机搜索。bayesopt
实现贝叶斯优化,主要的功能是足够灵活的许多其他应用程序。看到贝叶斯优化工作流程。
解释一个分类模型,您可以使用石灰
,沙普利
,plotPartialDependence
。
应用程序
分类学习者 | 火车模型使用监督机器学习分类数据 |
功能
对象
属性
ConfusionMatrixChart属性 | 混淆矩阵图表外观和行为 |
ROCCurve属性 | 接受者操作特征(ROC)曲线的外观和行为 |
主题
分类学习者应用
- 训练分类模型的分类学习者应用
工作流程培训、比较和提高分类模型,包括自动、手动和并行训练。 - 可视化和评估分类器在分类学习者的表现
比较模型精度值,显示结果通过绘制类预测,并检查性能混淆矩阵中的每个类。 - 特征选择和特征转换使用分类学习者应用
排名算法识别有用的预测使用土地或特性,包括选择特性,并在分类学习者使用PCA变换特性。
特征选择
- 介绍了特征选择
学习特征选择算法和探索功能用于特征选择。 - 连续的特征选择
这个话题介绍顺序顺序特征选择和提供了一个示例,选择特性和使用自定义标准sequentialfs
函数。 - 社区成分分析(NCA)特征选择
社区成分分析(NCA)是一种非参数方法选择功能最大化的目标回归和分类算法的预测精度。 - 调整正则化参数检测功能使用NCA分类
这个例子展示了如何调整正则化参数fscnca
使用交叉验证。 - 规范判别分析分类器
做一个更健壮和简单的模型通过消除预测模型的预测能力的前提下。 - 为高维数据分类选择特性
这个例子展示了如何为高维数据分类选择特性。
工程特性
- 自动化功能工程分类
使用gencfeatures
之前工程师新功能训练分类模型。之前预测新数据,应用相同的功能转换到新的数据集。
自动模型选择
- 自动化与贝叶斯分类器的选择和亚莎的优化
使用fitcauto
尝试自动分类模型类型的选择与不同hyperparameter值,给定训练预测和响应数据。
Hyperparameter优化
- 贝叶斯优化工作流程
执行贝叶斯优化使用一个合适的函数或通过调用bayesopt
直接。 - 变量的贝叶斯优化
为贝叶斯优化创建变量。 - 贝叶斯优化目标函数
建立贝叶斯优化的目标函数。 - 约束在贝叶斯优化
为贝叶斯优化设置不同类型的约束。 - 优化旨在使用bayesopt分类器
使用贝叶斯优化交叉验证的损失最小化。 - 优化分类器配合使用贝叶斯优化
使用交叉验证损失最小化OptimizeParameters
名称-值参数的拟合函数。 - 贝叶斯优化情节功能
视觉监控一个贝叶斯优化。 - 贝叶斯优化输出功能
监控一个贝叶斯优化。 - 贝叶斯优化算法
理解底层为贝叶斯优化算法。 - 平行的贝叶斯优化
多贝叶斯优化并行工作。
模型的解释
- 解释机器学习模型
解释使用模型预测石灰
和沙普利
对象和plotPartialDependence
函数。 - 沙普利值机器学习模型
机器学习模型计算夏普利值使用介入算法或条件的算法。
交叉验证
- 使用并行计算实现交叉验证
加快交叉验证使用并行计算。
分类性能评价
- ROC曲线和性能指标
使用rocmetrics
检查分类算法的性能测试数据集。 - 由perfcurve性能曲线
学习如何perfcurve
函数计算一个接受者操作特征(ROC)曲线。