모델개발과평가

특징선택,모델선,택하이퍼파라미터최적화,교차검증,예측성능평가및분류정확도비교테스트

고품질예측분류모델을개발하는경우적합한특징(또는예측변수)을선택하고하이퍼파라미터(추정되지않은모델모수)를조율해야합니다。

특정모델의하이퍼파라미터를조율하려면하이퍼파라미터값을선택하고이들값을사용하여모델을교차검증하십시오。예를들어,SVM모델을조정하려면상자제약조건과커널스케일의집합을선택하고,값의쌍각각에대해모델을교차검증하십시오。특정统计和机器学习工具箱™분류함수는베이즈최적화,그리드탐색또는임의탐색을통해자동하이퍼파라미터조율기능을제공합니다。그러나,베이즈최적화를구현하는주요함수bayesopt은다른응용사례에사용할수있을정도로유연합니다。贝叶斯优化工作流程항목을참조하십시오。

특징선택과하이퍼파라미터조율을통해여러모델이생성될수있습니다。모델간k겹오분류율,中华民国(수신자조작특성)곡선또는혼동행렬을비교할수있습니다。또는,통계검정을수행하여어떠한분류모델이다른모델보다성능이훨씬더뛰어난지여부를파악할수있습니다。

조정된하이퍼파라미터를가진모델을자동으로선택하려면fitcauto를사용하십시오。이함수는다양한하이퍼파라미터값으로분류모델유형을선택해보고새데이터에서잘수행될것으로예상되는최종모델을반환합니다。어떤분류기유형이데이터에가장적합한지확신하지못할경우fitcauto를사용하십시오。

분류모델을대화형방식으로만들고평가하려면분류학습기앱을사용하십시오。

분류모델을해석하려면石灰또는plotPartialDependence를사용할수있습니다。

앱

분류학습기

머신러닝지도학습을사용하여데이터를분류하도록모델훈련시키기

함수

모두확장

특징선택

`fscchi2`	单变量特征排序分类使用卡方检验
`fscmrmr`	使用最小冗余最大相关性(MRMR)算法对等级特征进行分类
`fscnca`	特征选择使用邻域成分分析进行分类
`oobPermutedPredictorImportance`	分类树的随机森林的预测重要度由袋外预测观察的排列估计
`predictorImportance`	分类树中预测因子重要性的估计
`predictorImportance`	决策树分类集成中预测器重要性的估计
`sequentialfs`	使用自定义标准的顺序特征选择
`relieff`	使用ReliefF或RReliefF算法对预测因子的重要性进行排序

자동모델선택

fitcauto 利用优化的超参数自动选择分类模型

하이퍼파라미터최적화

`bayesopt`	使用贝叶斯优化选择最优的机器学习超参数
`hyperparameters`	用于优化拟合函数的变量描述
`optimizableVariable`	变量描述`bayesopt`或其他优化

교차검증

`crossval`	使用交叉验证估计损失
`cvpartition`	교차검증을위한데이터분할
`重新分区`	重新分区数据以进行交叉验证
`测试`	交叉验证试验指标
`培训`	交叉验证的培训指标

모델해석

本地可解释模型不可知解释

`石灰`	局部可解释的模型不可知解释(LIME)
`适合`	拟合局部可解释模型不可知论解释(LIME)的简单模型
`情节`	局部可解释模型不可知解释(LIME)的图结果

부분종속성

`partialDependence`	计算部分依赖
`plotPartialDependence`	创建部分依赖图(PDP)和个人条件期望图(ICE)

분류성능평가

`confusionchart`	创建分类问题的混淆矩阵图
`confusionmat`	분류문제에대한정오분류표계산
`perfcurve`	분류기출력값에대한ROC(수신자조작특성)곡선또는기타성능곡선