主要内容

模型建设和评估

特征选择、特征工程、模型选择、超参数优化、交叉验证、残差诊断和绘图

当您构建高质量的回归模型时,要选择合适的功能(或预测),调整超级参数(模型参数不适合数据)非常重要,并通过剩余诊断评估模型假设。

您可以通过选择它们的选择值和使用您的选择进行交叉验证模型来调整HyperParameters。此过程产生多种模型,其中最佳模型可能是最小化估计的泛化误差的模型。例如,要调整SVM模型,请选择一组框约束和内核尺度,交叉验证每对值的模型,然后比较它们的10倍,交叉验证的平均平方误差估计。

在培训回归模型之前工程师新功能,使用GenrFeatures.

以交互式建立和评估回归模型,使用回归的学习者应用程序。

自动选择具有调谐超参数的型号,使用Fitrauto..该函数尝试选择具有不同超参数值的回归模型类型,并返回预期性能良好的最终模型。用Fitrauto.当您不确定哪种回归模型类型最适合您的数据。

Statistics和Machine Learning Toolbox™中的某些非参数回归函数通过贝叶斯优化、网格搜索或随机搜索提供自动超参数调优。Bayesopt.是实现贝叶斯优化的主要功能,对于许多其他应用程序来说足够灵活。有关更多详细信息,请参阅贝叶斯优化工作流程

要解释一个回归模型,您可以使用石灰福芙,情节依存

应用

回归的学习者 火车回归模型以预测使用监督机器学习的数据

职能

展开全部

FSRFTEST. 使用的单变量特征排名使用F- 最低
fsrnca 使用邻域分量分析来选择回归的功能选择
OobpermutedPredictorimportance. 预测对回归树木随机森林的禁止超预测性观测的排列的重要性估计
部分竞争 计算部分依赖
情节依存 创建部分依赖绘图(PDP)和个人有条件期望(ICE)绘图
预测算法 对回归树预测因子重要性的估计
预测算法 对回归集合的预测性重要性估计
relieff 使用ReliefF或RReliefF算法对预测因子的重要性进行排序
序列 使用自定义标准选择顺序特征选择
stepwiselm 执行逐步回归
挺身油 通过逐步回归创建概括的线性回归模型
GenrFeatures. 为回归执行自动功能工程
描述 描述生成的功能
变换 使用生成的功能转换新数据
Fitrauto. 自动选择超参数优化的回归模型
Bayesopt. 使用贝叶斯优化选择最佳机器学习超参数
hyperparameters 用于优化拟合功能的可变描述
优化不变 变量描述Bayesopt.或其他优化
横梁 使用交叉验证估算损失
CVPartition. 交叉验证的分区数据
重新分区 交叉验证的重置数据
测试 用于交叉验证的测试指标
训练 交叉验证的培训指标

本地可解释模型 - 不可知的解释(石灰)

石灰 本地可解释模型 - 不可知的解释(石灰)
合身 拟合局部可解释模型不可知论解释(LIME)的简单模型
阴谋 局部可解释模型不可知解释(LIME)的图结果

福利价值观

福芙 福利价值观
合身 计算查询点的福利值
阴谋 绘制福芙价值

部分依赖

部分竞争 计算部分依赖
情节依存 创建部分依赖绘图(PDP)和个人有条件期望(ICE)绘图
COEFCI. 线性回归模型系数估计的置信区间
COLEYEST. 线性回归模型系数的线性假设试验
DWTest. 线性回归模型对象的德宾-沃森检验
阴谋 散点图或添加的线性回归模型的可变曲线
plotadded. 添加了线性回归模型的变量图
plotAdjustedResponse 线性回归模型的调整后响应图
plotdiagnostics. 绘制线性回归模型的观察诊断图
丛林意见 在线性回归模型中绘制预测因子的主要作用
plotinteraction. 两个预测因子在线性回归模型的绘图交互效应
plotResiduals 线性回归模型的绘图残差
plotslice. 通过拟合线性回归表面切片曲线图
COEFCI. 广义线性回归模型系数估计的置信区间
COLEYEST. 广义线性回归模型系数的线性假设试验
DevianceTest. 广义线性回归模型的偏差分析
plotdiagnostics. 绘制广义线性回归模型的观察诊断图
plotResiduals 广义线性回归模型的绘图残差
plotslice. 穿过拟合的普通线性回归表面的切片
COEFCI. 非线性回归模型系数估计的置信区间
COLEYEST. 非线性回归模型系数的线性假设检验
plotdiagnostics. 绘图非线性回归模型的诊断
plotResiduals 绘制非线性回归模型的残差
plotslice. 通过拟合的非线性回归曲面绘制切片图
Linhyptest. 线性假设试验

对象

展开全部

PeazerateLectionNcArtortion. 使用邻域分量分析的回归特征选择(NCA)
FeatureTransformer. 生成功能转换
BayesianOptimization 贝叶斯优化结果

话题

回归学习者应用程序工作流程

在回归学习者应用程序中训练回归模型

用于培训、比较和改进回归模型的工作流,包括自动化、手动和并行培训。

选择回归模型选项

在回归学习者中,自动培训各种型号,或比较和调整线性回归模型的选项,回归树,支持向量机,高斯过程回归模型,回归树的合奏和回归神经网络。金宝app

使用回归学习软件进行特征选择和特征转换

使用绘图识别有用的预测器,手动选择要包含的功能和使用PCA在回归学习者中的功能。

评估回归学习者的模型性能

比较模型统计和可视化结果。

特征选择

功能选择简介

了解要素选择算法并探索功能选择的功能。

顺序特征选择

本主题介绍了顺序特征选择,并提供了一个使用自定义标准顺序选择功能的示例序列功能。

邻域成分分析(NCA)特征选择

邻域分量分析(NCA)是一种非参数的特征选择方法,其目标是最大限度地提高回归和分类算法的预测精度。

使用NCA进行回归的强大功能选择

执行使用NCA中的自定义鲁棒丢失函数对异常值强大的功能选择。

选择随机林的预测器

使用交互测试算法选择随机林的拆分预测器。

特征工程

回归自动特征工程

GenrFeatures.在训练回归模型之前设计新的特性。在对新数据进行预测之前,对新数据集应用相同的特性转换。

自动模型选择

自动回归模型选择与贝叶斯和ASHA优化

Fitrauto.给定培训预测器和响应数据,自动尝试具有不同的超参数值的回归模型类型。

HyperParameter优化

贝叶斯优化工作流程

使用fit函数或调用Bayesopt.直接地。

贝叶斯优化的变量

为贝叶斯优化创建变量。

贝叶斯优化目标函数

为贝叶斯优化创建目标函数。

贝叶斯优化中的约束条件

为贝叶斯优化设置不同类型的约束。

优化增强回归集成

最小化回归集合的交叉验证损失。

贝叶斯优化绘图函数

可视化地监控贝叶斯优化。

贝叶斯优化输出函数

监控贝叶斯优化。

贝叶斯优化算法

了解贝叶斯优化的底层算法。

并行贝叶斯优化

贝叶斯优化如何并行工作。

模型解释

解释机器学习模型

解释模型预测使用石灰福芙,情节依存

机器学习模型的福利值

使用两种算法计算机器学习模型的福利值:KENELSHAP和EXTRERNELSHAP的扩展名。

交叉验证

使用并行计算实现交叉验证

使用并行计算加速交叉验证。

线性模型诊断

解释线性回归结果

显示和解释线性回归输出统计信息。

线性回归

适合线性回归模型并检查结果。

与交互效应的线性回归

构造并分析互动效应的线性回归模型,解释结果。

输出摘要和诊断统计

通过使用模型属性和对象功能来评估拟合模型。

F统计和T型统计

在线性回归,F- 术是用于分析方差(ANOVA)方法的测试统计,以测试模型或模型中的组件的重要性。这T.-statistic对于推断回归系数是有用的。

确定系数(R角)

确定系数(R角)表示响应变量的比例变化量y由独立变量解释X在线性回归模型中。

系数标准错误和置信区间

估计系数差异和协方差捕获回归系数估计的精度。

剩余物

残差对于偏远来说是有用的y值和检查回归模型中的错误项的线性回归假设。

Durbin-Watson测试

Durbin-Watson测试评估是否存在时间序列数据的残差之间的自相关。

库克的距离

库克距离对于识别异常值很有用X值(预测器变量的观察)。

帽子矩阵和杠杆

帽子矩阵提供了杠杆的衡量标准。

Delete-1统计

删除 - 1变更协方差(科瓦拉蒂奥)确定对回归拟合有影响的观察结果。

广义线性模型诊断

广义线性模型

广义线性模型使用线性方法来描述预测器术语和响应变量之间的潜在非线性关系。

非线性模型诊断

非线性回归

参数非线性模型表示连续响应变量和一个或多个连续预测器变量之间的关系。