主要内容

이번역페이지는최신내용을담고있지않습니다。최신내용을영문으로보려면여기를클릭하십시오。

모델개발과평가

특징선택,모델선,택하이퍼파라미터최적화,교차검증,예측성능평가및분류정확도비교테스트

고품질예측분류모델을개발하는경우적합한특징(또는예측변수)을선택하고하이퍼파라미터(추정되지않은모델모수)를조율해야합니다。

특정모델의하이퍼파라미터를조율하려면하이퍼파라미터값을선택하고이들값을사용하여모델을교차검증하십시오。예를들어,SVM모델을조정하려면상자제약조건과커널스케일의집합을선택하고,값의쌍각각에대해모델을교차검증하십시오。특정统计和机器学习工具箱™분류함수는베이즈최적화,그리드탐색또는임의탐색을통해자동하이퍼파라미터조율기능을제공합니다。그러나,베이즈최적화를구현하는주요함수bayesopt은다른응용사례에사용할수있을정도로유연합니다。贝叶斯优化工作流程항목을참조하십시오。

특징선택과하이퍼파라미터조율을통해여러모델이생성될수있습니다。모델간k겹오분류율,中华民国(수신자조작특성)곡선또는혼동행렬을비교할수있습니다。또는,통계검정을수행하여어떠한분류모델이다른모델보다성능이훨씬더뛰어난지여부를파악할수있습니다。

조정된하이퍼파라미터를가진모델을자동으로선택하려면fitcauto를사용하십시오。이함수는다양한하이퍼파라미터값으로분류모델유형을선택해보고새데이터에서잘수행될것으로예상되는최종모델을반환합니다。어떤분류기유형이데이터에가장적합한지확신하지못할경우fitcauto를사용하십시오。

분류모델을대화형방식으로만들고평가하려면분류학습기앱을사용하십시오。

분류모델을해석하려면石灰또는plotPartialDependence를사용할수있습니다。

분류학습기 머신러닝지도학습을사용하여데이터를분류하도록모델훈련시키기

함수

모두확장

fscchi2 单变量特征排序分类使用卡方检验
fscmrmr 使用最小冗余最大相关性(MRMR)算法对等级特征进行分类
fscnca 特征选择使用邻域成分分析进行分类
oobPermutedPredictorImportance 分类树的随机森林的预测重要度由袋外预测观察的排列估计
predictorImportance 分类树中预测因子重要性的估计
predictorImportance 决策树分类集成中预测器重要性的估计
sequentialfs 使用自定义标准的顺序特征选择
relieff 使用ReliefF或RReliefF算法对预测因子的重要性进行排序
fitcauto 利用优化的超参数自动选择分类模型
bayesopt 使用贝叶斯优化选择最优的机器学习超参数
hyperparameters 用于优化拟合函数的变量描述
optimizableVariable 变量描述bayesopt或其他优化
crossval 使用交叉验证估计损失
cvpartition 교차검증을위한데이터분할
重新分区 重新分区数据以进行交叉验证
测试 交叉验证试验指标
培训 交叉验证的培训指标

本地可解释模型不可知解释

石灰 局部可解释的模型不可知解释(LIME)
适合 拟合局部可解释模型不可知论解释(LIME)的简单模型
情节 局部可解释模型不可知解释(LIME)的图结果

부분종속성

partialDependence 计算部分依赖
plotPartialDependence 创建部分依赖图(PDP)和个人条件期望图(ICE)
confusionchart 创建分类问题的混淆矩阵图
confusionmat 분류문제에대한정오분류표계산
perfcurve 분류기출력값에대한ROC(수신자조작특성)곡선또는기타성능곡선
testcholdout 比较两种分类模型的预测精度
testckfold 通过重复交叉验证比较两种分类模型的准确率

객체

모두확장

FeatureSelectionNCAClassification 基于邻域分量分析(NCA)的分类特征选择
BayesianOptimization 贝叶斯优化结果

도움말항목

분류학습기앱

분류학습기앱에서분류모델을훈련시키기

자동화된훈련,수동훈련,병렬훈련등분류모델을훈련시키고비교하고향상시킬수있는워크플로입니다。

在分类学习中评估分类器的表现

比较模型的准确性分数,通过绘制类预测图来可视化结果,并在混淆矩阵中检查每个类的表现。

使用分类学习软件进行特征选择和特征转换

使用图识别有用的预测器,手动选择特征包括,并在分类学习中使用PCA变换特征。

특징선택

特征选择简介

了解特征选择算法并探索特征选择可用的功能。

连续的特征选择

本主题介绍了顺序特性选择,并提供了一个使用自定义标准和sequentialfs函数。

邻域成分分析(NCA)特征选择

邻域分量分析(NCA)是一种非参数的特征选择方法,其目标是最大限度地提高回归和分类算法的预测精度。

调整正则化参数检测特征使用NCA分类

这个例子展示了如何调优正则化参数fscnca使用交叉验证。

正则化判别分析分类器

在不影响模型预测能力的情况下,通过删除预测器来建立一个更健壮、更简单的模型。

고차원데이터를분류하기위해특징선택하기

이예제에서는고차원데이터를분류하기위해특징을선택하는방법을보여줍니다。

자동모델선택

基于贝叶斯优化的自动分类器选择

使用fitcauto给定训练预测器和响应数据,自动尝试选择具有不同超参数值的分类模型类型。

하이퍼파라미터최적화

贝叶斯优化工作流程

使用fit函数或调用bayesopt直接。

贝叶斯优化的变量

为贝叶斯优化创建变量。

贝叶斯优化目标函数

为贝叶斯优化创建目标函数。

贝叶斯优化中的约束条件

为贝叶斯优化设置不同类型的约束。

使用贝叶斯算法优化交叉验证的SVM分类器

使用贝叶斯优化最小化交叉验证损失。

使用贝叶斯优化优化SVM分类器

使用OptimizeParameters拟合函数中的名称-值对。

贝叶斯优化绘图函数

可视化地监控贝叶斯优化。

贝叶斯优化输出函数

监控贝叶斯优化。

贝叶斯优化算法

了解贝叶斯优化的基本算法。

平行的贝叶斯优化

贝叶斯优化是如何并行工作的。

교차검증

使用并行计算实现交叉验证

使用并行计算加速交叉验证。

분류성능평가

性能曲线

使用接收机工作特性曲线在特定测试数据集上检验分类算法的性能。