主要内容

绘图竞争依赖性

创建部分依赖图(PDP)和个人条件期望图(ICE)

描述

例子

plotPartialDependence(RegressionMdlvars.计算和绘制中列出的预测变量之间的部分依赖关系vars.以及用回归模型预测的响应RegressionMdl,其中包含预测数据。

  • 如果在中指定一个变量vars.,该函数创建对变量的部分依赖的线曲线。

  • 如果你指定两个变量vars.,该函数将创建与两个变量部分相关的曲面图。

例子

plotPartialDependence(classificationmdl.vars.标签计算和绘制中列出的预测变量之间的部分依赖关系vars.以及在标签通过使用分类模型classificationmdl.,其中包含预测数据。

  • 如果在中指定一个变量vars.和一个课程标签,该函数创建针对指定类的变量的部分依赖的线图。

  • 如果在中指定一个变量vars.和多个课程标签,函数在一个图形上为每个类创建一个线图。

  • 如果你指定两个变量vars.和一个课程标签,该函数将创建与两个变量部分相关的曲面图。

例子

plotPartialDependence(___数据使用新的预测器数据数据.您可以指定数据除了前面语法中的任何输入参数组合之外。

例子

plotPartialDependence(___名称,价值使用由一个或多个名称-值对参数指定的其他选项。例如,如果指定“有条件的”,“绝对”,绘图竞争依赖性函数创建一个图形,其中包括PDP,所选预测变量和预测响应或分数的散点图,以及每个观测的ICE图。

例子

斧头= plotPartialDependence (___返回情节的轴线。

例子

全部折叠

使用的方法训练回归树卡斯莫尔数据集,并创建一个显示特征与训练回归树中的预测响应之间关系的PDP。

加载卡斯莫尔数据集。

负载卡斯莫尔

指定重量气瓶,马力为预测变量(X),及MPG.作为响应变量(y).

X =(重量、气缸、马力);Y = MPG;

使用Xy

Mdl = fitrtree (X, Y);

查看经过训练的回归树的图形显示。

查看(MDL,“模式”'图形'

图回归树查看器包含一个轴和其他类型的uimenu, uicontrol的对象。轴包含60个类型为line, text的对象。

创建第一个预测变量的PDP,重量

plotPartialDependence (Mdl, 1)

图中包含一个轴。标题为“部分相关”的轴图包含类型为“直线”的对象。

这条标绘线代表了两者之间的平均部分关系重量(标记为x1) 和MPG.(标记为y)在训练的回归树中Mdl.的X中的小刻度表示唯一的值x1

回归树查看器显示第一个决定是吗?x1小于3085.5。PDP还显示了附近的大变化x1= 3085.5。树查看器根据预测器变量在每个节点处可视化每个节点的每个决定。您可以找到基于值的几个节点x1,但确定yx1这并不容易。但是,绘图竞争依赖性绘图平均预测反应x1,所以你可以清楚地看到部分依赖yx1

标签x1y是预测器名称和响应名称的默认值。您可以通过指定名称-值对参数来修改这些名称'predictornames'“ResponseName”当你训练Mdl使用fitrtree.. 也可以通过使用修改轴标签包含ylabel功能。

用。训练朴素贝叶斯分类模型鱼腥草数据集,并创建一个PDP,该PDP显示了用于多个类的预测变量和预测分数(后验概率)之间的关系。

加载鱼腥草数据集,包括物种()及尺寸()萼片长度,萼片宽度,花瓣长度和花瓣宽度为150鸢尾标本。数据集包含来自三种种类中的每一个的50个标本:Setosa,Versicolor和Virginica。

负载鱼腥草

用遗传算法训练朴素贝叶斯分类模型作为响应为预测因子。

MDL = FITCNB(MEAS,物种);

创建一个PDP的分数预测Mdl对于所有三个课程对阵第三预测变量x3.通过使用该标签来指定类标签Classnames.的属性Mdl

plotPartialDependence (Mdl 3 Mdl.ClassNames);

图中包含一个坐标轴。标题为“部分相关图”的轴包含3个类型为line的对象。这些物品代表着维珍卡。

根据该模型,概率弗吉纳斯增加x3.概率setosa从哪里约0.33x3是0到约2.5,然后概率下降到几乎0。

使用生成的样本数据训练高斯过程回归模型,其中响应变量包括预测变量之间的交互作用。然后,创建ICE图,显示每个观测的特征和预测响应之间的关系。

生成样本预测数据x1x2

rng (“默认”%的再现性n = 200;x1 =兰德(n - 1) * 2 - 1;x2 =兰德(n - 1) * 2 - 1;

生成响应值,包括之间的交互x1x2

y = x1-2 * x1。*(x2> 0)+ 0.1 * rand(n,1);

使用Gaussian进程回归模型[x1-x2]y

mdl = fitrgp([x1 x2],y);

为第一个预测器创建一个包括PDP(红线)的图x1的散点图(圆标记)x1并预测响应,并通过指定进行一组冰块(灰线)“条件”作为'中心'

plotPartialDependence (Mdl 1“条件”'中心'

图中包含一个坐标轴。具有标题个体条件期望绘图的轴包含202个类型的类型,分散。

什么时候“条件”'中心'绘图竞争依赖性偏移图,使所有图从零开始,这有助于检查所选特征的累积效应。

PDP找到平均的关系,因此它不会透露隐藏的依赖项,特别是当响应包括特征之间的交互时。然而,冰块清楚地表明了两个不同的回应依赖性x1

训练分类模型的集合并创建两个pdp,一个使用训练数据集,另一个使用新数据集。

加载人口普查1994.数据集,其中包含美国的年薪数据,分类为<= 50K.> 50 k,以及一些人口统计学变量。

负载人口普查1994.

从表中提取要分析的变量子集成人资料成年人

X = adultdata (: {“年龄”“workClass”“education_num”“marital_status”“种族”......'性别''资本收益'“资本损失”'每周几小时''薪水'}); Xnew=成人测试(:{“年龄”“workClass”“education_num”“marital_status”“种族”......'性别''资本收益'“资本损失”'每周几小时''薪水'});

用。训练分类器集合薪水作为响应,其余变量使用函数作为预测器fitcensemble.对于二进制分类,fitcensemble使用汇集100个分类树Logitboost.方法。

Mdl=fitcensemble(X,'薪水');

检查中的类名Mdl

Mdl.ClassNames
ans =.2 x1分类< = 50 k > 50 k

创建所预测的分数的部分依赖关系图Mdl对于第二阶级薪水> 50 k)与预测相反年龄使用训练数据。

plotPartialDependence(MDL,“年龄”Mdl.ClassNames (2))

图中包含一个轴。标题为“部分相关”的轴图包含类型为“直线”的对象。

为类创建一个分数的PDP> 50 k反对年龄使用来自表的新预测仪数据Xnew.

plotPartialDependence(MDL,“年龄”Xnew Mdl.ClassNames (2))

图中包含一个轴。标题为“部分相关”的轴图包含类型为“直线”的对象。

这两张图显示了预测高分的部分依赖性的相似形状薪水> 50 k)在年龄.这两个地块表明,预测的高薪得分速度速度快到30岁,然后保持几乎扁平,直到60岁,然后快速下降。然而,基于新数据的曲线产生超过65岁的比分略高。

使用培训回归的集合卡斯莫尔数据集,并使用新数据集为每个预测变量创建PDP绘图和冰块,CARBIG..然后比较数据,分析预测变量的重要性。同时,将结果与返回的预测器重要性的估计进行比较预测的重要性函数。

加载卡斯莫尔数据集。

负载卡斯莫尔

指定重量气瓶马力,Model_Year为预测变量(X),及MPG.作为响应变量(y).

X =[重量、气缸、马力,Model_Year];Y = MPG;

使用训练回归集成Xy

mdl = fitrensemble(x,y,......'predictornames', {“重量”“气缸”“马力”'模型年'},......“ResponseName”'mpg');

创建预测变量的重要性使用绘图竞争依赖性预测的重要性功能。的绘图竞争依赖性函数可视化所选预测器和预测响应之间的关系。预测的重要性总结预测器具有单个值的重要性。

为每个预测器创建一个包括PDP图(红线)和ICE图(灰线)的图绘图竞争依赖性并指定“有条件的”,“绝对”.每个图还包括一个散点图(圆圈标记)的选定预测器和预测响应。同时,加载CARBIG.数据集并将其用作新的预测器数据,Xnew..当你提供Xnew.,绘图竞争依赖性函数使用Xnew.而不是预测的数据Mdl

负载CARBIG.Xnew =[重量、气缸、马力,Model_Year];图t = tiledlayout(2,2,'tileespacing''袖珍的');标题(T,“个人条件期望图”i = 1:4 nextdile plotpartialdendence(mdl,i,xnew,“条件”“绝对”) 标题(结尾

图中包含4个轴。轴1包含408个类型为线、散点的对象。轴线2包含408个类型为线、散点的对象。轴线3包含408个类型为线、散的对象。轴4包含408个类型为线、散的对象。

计算通过使用计算预测的预测值估计预测的重要性.该函数对每个预测器的分裂导致的均方误差(MSE)的变化进行求和,然后除以分支节点的数量。

imp=预测重要性(Mdl);图形栏(imp)标题('预测重点估计') ylabel (“估计”)包含(“预测因素”) ax = gca;斧子。XTickLabel = Mdl.PredictorNames;

图中包含一个坐标轴。标题为Predictor Importance estimate的轴包含一个bar类型的对象。

变量重量对最有影响力MPG.根据预测值的重要性。的PDP重量也表明,MPG.有很大的部分依赖重量.变量气瓶影响最小MPG.根据预测值的重要性。的PDP气瓶也表明,MPG.根据具体情况变化不大气瓶

用线性和相互作用术语训练推广添加剂模型(GAM)以获得预测器。然后,使用线性和交互术语和仅具有线性术语的PDP创建PDP。指定是否在创建PDP时包含交互术语。

加载电离层数据集。这个数据集有34个预测器和351个雷达回波的二进制响应,或者是坏的(“b”)或好('G').

负载电离层

使用预测器训练游戏X和班级标签y.推荐的做法是指定类名。指定包含10个最重要的交互项。

Mdl=fitcgam(X,Y,'classnames', {“b”'G'},'互动',10);

Mdl是A.ClassificationGAM模型对象。

列出互动条款Mdl

mdl.interaction.
ans =.10×21 5 7 8 6 7 5 6 5 7 5 5 8 3 5 4 7 1 7 4 5

每一排相互作用表示一个交互项,并包含该交互项的预测变量的列索引。

找出交互项中最频繁的预测因子。

模式(mdl.interactions,“所有”
ans = 5

交互术语中最常见的预测器是第五预测器(x5). 为第五个预测器创建PDP。要从计算中排除交互项,请指定'internalidantaction',false第二个PDP。

plotPartialDependence (Mdl 5 Mdl.ClassNames (1))PlotPartialDependence(MDL,5,MDL.Classnames(1),'internalideraction',假)网格传奇('线性和互动条款'“线性条件仅”) 标题(第五预测器的后验概率的“PDP”)持有

图中包含一个坐标轴。第5 Predictor的后验概率pdp轴包含2个类型为line的对象。这些对象表示线性和交互项,仅表示线性项。

该图显示了分数(后验概率)的部分依赖性x5取决于模型是否包含交互项,特别是在哪里x5介于0.2和0.45之间。

训练支持向量机(金宝appSVM)回归模型使用卡斯莫尔数据集,并为两个预测变量创建PDP。然后,从输出中提取部分依赖估计值绘图竞争依赖性.或者,您可以通过使用来获得部分依赖值部分竞争函数。

加载卡斯莫尔数据集。

负载卡斯莫尔

指定重量气瓶移位,马力为预测变量(TBL.).

台=表(重量、汽缸、排量、马力);

使用。构建支持向量机回归模型TBL.和响应变量MPG.. 使用具有自动核尺度的高斯核函数。

mdl = fitrsvm(tbl,mpg,“ResponseName”'mpg'......'pationoricalpricictors'“气缸”“标准化”,真的,......“内核函数”“高斯”'kernelscale''汽车');

创建一个PDP,可视化预测响应的部分依赖(MPG.)关于预测变量重量气瓶.指定查询点以计算部分依赖重量通过使用'querypoints'名称-值对的论点。您不能指定'querypoints'气瓶因为它是一个分类变量。绘图竞争依赖性使用所有分类值。

pt=linspace(最小(重量),最大(重量),50';ax=绘图部分独立性(Mdl{“重量”“气缸”},'querypoints',{pt,[]});查看(140,30)%修改视角

图中包含一个坐标轴。具有标题部分依赖性图的轴包含类型表面的对象。

PDP显示了两者之间的相互作用效应重量气瓶. 部分依赖MPG.重量根据的值进行更改气瓶

提取估计的部分依赖MPG.重量气瓶.的XDataydata.,兹达塔的值斧子。Children是X轴值(第一选择的预测值值),y轴值(第二选定的预测值值)和z轴值(相应的部分依赖值)。

xval = ax.Children.XData;yval = ax.Children.YData;zval = ax.Children.ZData;

或者,您可以通过使用来获得部分依赖值部分竞争函数。

[PD,X,Y] = PartialDependence(MDL,{“重量”“气缸”},'querypoints',{pt,[]});

pd包含查询点的部分依赖值Xy

如果您指定“条件”作为“绝对”绘图竞争依赖性创建一个图形,包括PDP、散点图和一组ICE图。ax.Children (1)ax.Children (2)分别对应于PDP和散点图。剩余的元素斧子。Children对应ICE图。的XDataydata.的值ax.Children(我)是X轴值(所选预测值值)和Y轴值(相应的部分依赖值)。

输入参数

全部折叠

回归模型,指定为完整或紧凑的回归模型对象,如下表所支持的模型中给出。金宝app

模型 完整或紧凑的模型对象
广义线性模型 GeneralizedLinearModelCompact一项式标Model.
广义线性混合效应模型 GeneralizeLmixedModel.
线性回归 LinearModelCompactLinearModel
线性混合效应模型 线性矩阵模型
非线性回归 NonLinearModel
回归模型的集合 RegressionEnsemble回归分析CompactRegressionEnsemble
广义可加模型 回归compactregressiongam.
高斯过程回归 regressiongp.CompactregressionGP.
高斯核回归模型采用随机特征展开 回归科内尔
线性回归用于高维数据 回归线性
神经网络回归模型 RegressionNeuralNetworkcompactregressionneuralnetwork
金宝app支持向量机(SVM)回归 RegressionSVMcompactregressionsvm.
回归树 回归植物紧回归树
决策树集成的自举聚合 TreeBaggerCompactTreeBagger.

如果RegressionMdl是一个不包含预测数据(例如,紧凑型)的模型对象,您必须提供输入参数数据

绘图竞争依赖性不支持具有稀疏矩阵金宝app训练的模型对象。当您培训模型时,使用完整的数字矩阵或表格,用于预测数据,其中行对应各个观察。

分类模型,指定为完整或紧凑的分类模型对象,如下表所示。金宝app

模型 完整或紧凑的模型对象
判别分析分类器 分类Discriminant.紧分类判别式
支持向量机或其他分类器的多款模型金宝app ClassificationECOCCompactClassificationECOC
用于分类的学习者集合 分类素..CompactClassificationseMbleClassificationBaggedensemble.
广义可加模型 ClassificationGAMCompactClassificationgam.
高斯核分类模型使用随机特征展开 ClassificationKernel
K.最近的邻居分类器 ClassificationKnn.
线性分类模型 分类线性
多类朴素贝叶斯模型 ClassificationNaiveBayesCompactClassificationNaiveBayes
神经网络分类器 ClassificationNeuralNetworkCompactClassificationNeuralNetwork
金宝app支持向量机(SVM)分类器用于一类和二值分类 ClassificationSVMCompactClassificationsVM.
多包分类的二进制决策树 ClassificationTree.紧分类树
决策树的袋装集合 TreeBaggerCompactTreeBagger.

如果classificationmdl.是一个不包含预测数据(例如,紧凑型)的模型对象,您必须提供输入参数数据

绘图竞争依赖性不支持具有稀疏矩阵金宝app训练的模型对象。当您培训模型时,使用完整的数字矩阵或表格,用于预测数据,其中行对应各个观察。

预测变量,指定为正整数向量、字符向量、字符串标量、字符串数组或字符向量的单元格数组。您可以指定一个或两个预测变量,如下表所示。

一个预测变量

价值 描述
正整数 对应于预测器数据列的索引值。
字符矢量或字符串标量

预测变量的名称。名称必须与输入的条目匹配RegentionMDL.PRedictorNames.ClassificationMdl。PredictorNames

两个预测变量

价值 描述
两个正整数的向量 与预测数据列对应的索引值。
字符向量的字符串数组或单元格数组

预测变量的名称。数组中的每个元素都是一个预测变量的名称。名称必须与里面的条目相匹配RegentionMDL.PRedictorNames.ClassificationMdl。PredictorNames

例子:{'x1','x3'}

数据类型:|双倍的|char|细绳|细胞

类标签,指定为分类或字符阵列,逻辑或数字矢量或字符向量的单元格数组。值和数据类型标签必须匹配类名中的类名Classnames.的属性classificationmdl.classificationmdl.classnames.).

  • 只有在中指定一个变量时,才能指定多个类标签vars.并具体说明“条件”作为'没有任何'(默认)。

  • 使用部分竞争如果要在一个函数调用中计算多个变量和多个类标签的部分依赖项。

此参数仅在指定分类模型对象时有效classificationmdl.

例子:{“红”、“蓝”}

例子:classificationmdl.classnames([1 3])指定标签作为第一个和第三级classificationmdl.

数据类型:|双倍的|逻辑|char|细胞|分类

预测数据,指定为数字矩阵或表。每一排数据对应一个观察值,每一列对应一个变量。

数据必须与培训模型的预测数据一致(RegressionMdlclassificationmdl.),存储在X变量财产。

  • 如果使用数值矩阵训练模型,则数据必须是一个数值矩阵。组成列的变量数据必须具有与训练模型的预测变量相同的数量和顺序。

  • 如果您使用表培训模型(例如,TBL.), 然后数据一定是一张桌子。中的所有预测变量数据必须具有与名称和类型相同的变量名称和数据类型TBL..但是,列顺序数据不需要对应于列顺序TBL.

  • 绘图竞争依赖性不支持稀疏矩阵。金宝app

如果RegressionMdlclassificationmdl.是一个不包含预测器数据的模型对象,您必须提供数据.如果模型是包含预测器数据的完整模型对象,并指定此参数,则绘图竞争依赖性不使用预测数据的模型和使用数据只要。

数据类型:|双倍的|表格

名称-值对参数

指定可选的逗号分离对名称,价值论点。的名字参数名和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数name1,value1,...,namen,valuen

例子:plotPartialDependence (Mdl、var、数据“NumObservationsToSample”,100年,“UseParallel”,真的)通过使用100个采样的观察来创建PDP数据和执行-并行循环迭代。

绘图类型,指定为'没有任何'“绝对”,或'中心'

价值 描述
'没有任何'

绘图竞争依赖性创建一个PDP。图的类型取决于中指定的预测变量的数量vars.以及中指定的类标签数标签(用于分类模型)。

  • 一个预测变量和一个类标签-绘图竞争依赖性计算在查询点处的部分依赖性,并创建部分依赖的2-D线图。

  • 一个预测变量和多个类标签-绘图竞争依赖性创建一个数字,其中包含多个2-D线绘图的选定类。

  • 两个预测变量和一个类标签-绘图竞争依赖性创建一个与两个变量部分相关的曲面图。

“绝对”

绘图竞争依赖性创建一个图,包括以下三种类型的绘图:

  • 有红线的PDP

  • 所选预测变量的散点图,用圆形标记预测反应或分数

  • 用灰线为每个观察的冰块

中只选择一个预测变量时,此值有效vars.和一个类标签标签(用于分类模型)。

'中心'

绘图竞争依赖性创建一个图形,包括相同的三种类型的情节“绝对”.函数对绘图进行偏移,使所有绘图都从零开始。

中只选择一个预测变量时,此值有效vars.和一个类标签标签(用于分类模型)。

例子:“有条件的”,“绝对”

标志在部分依赖计算中包含广义可加模型(GAM)的交互项,指定为真正的.此参数仅适用于GAM。也就是说,只有在何时指定此参数RegressionMdl回归compactregressiongam.,或classificationmdl.ClassificationGAMCompactClassificationgam.

默认值'internalideraction'价值是真正的如果模型包含交互术语。价值必须是如果模型不包含交互项。

例子:'internalidantaction',false

数据类型:逻辑

标记在部分依赖计算中包含广义可加模型(GAM)的截距项,指定为真正的.此参数仅适用于GAM。也就是说,只有在何时指定此参数RegressionMdl回归compactregressiongam.,或classificationmdl.ClassificationGAMCompactClassificationgam.

例子:'internallectcept',false

数据类型:逻辑

要采样的观察数,指定为正整数。默认值是中的总观察数数据或模型(RegressionMdlclassificationmdl.).如果指定的值大于观测总数,则绘图竞争依赖性使用所有的观察。

绘图竞争依赖性样本观察,没有替换使用datasample函数,并使用采样的观察值来计算部分相关性。

绘图竞争依赖性在采样观测值的唯一值处显示小记号。

如果您指定“条件”as“绝对”'中心'绘图竞争依赖性创建一个图,包括每个采样观察的冰绘图。

例子:“NumObservationsToSample”,100年

数据类型:|双倍的

要绘制的轴,指定为轴对象。如果你没有指定坐标轴,并且当前的坐标轴是笛卡尔坐标,那么绘图竞争依赖性使用当前坐标轴(GCA.).如果轴不存在,绘图竞争依赖性在一个新图中的情节。

例子:“父”,ax

指定为数字列向量,数字两列矩阵或两个数字列向量的单元阵列的数字依赖性指定的部分依赖。

  • 如果选择一个预测器变量vars.,使用数字列向量。

  • 如果你选择两个预测变量vars.

    • 使用数字两列矩阵为每个预测变量指定相同的点数。

    • 使用由两个数字列向量组成的单元格数组为每个预测器变量指定不同数量的点。

默认值是数值列向量或数值两列矩阵,具体取决于所选预测变量的数量。每列包含对应预测变量的采样观测值的最小值和最大值之间的100个等距点。

如果“条件”“绝对”'中心',然后软件将预测数据值(数据或预测数据RegressionMdlclassificationmdl.)的选择预测器。

您不能修改'querypoints'对于一个分类变量。的绘图竞争依赖性函数使用选定变量中的所有分类值。

如果选择一个数值变量和一个分类变量,则可以指定'querypoints'通过使用由数字列向量和空数组组成的单元格数组来获取数值变量。

例子:'querypoints',{pt,[]}

数据类型:|双倍的|细胞

并行运行的标志,指定为真正的.如果您指定“UseParallel”,真的,绘图竞争依赖性函数执行使用议案预测每个观察结果的反应或分数并将其平均。此选项需要并行计算工具箱™。

例子:“UseParallel”,真的

数据类型:逻辑

输出参数

全部折叠

绘图的轴,作为轴对象返回。有关如何修改轴的外观并从图中提取数据的详细信息,请参阅轴的外观从图中提取部分相关估计

更多关于

全部折叠

回归模型的偏依赖

部分依赖[1]表示预测变量与训练回归模型中的预测响应之间的关系。绘图竞争依赖性通过边缘化通过其他变量来计算预测响应对预测变量子集的部分依赖性。

考虑对子集的部分依赖XS.整个预测变量集X= {X1X2、……Xm}.一个子集XS.包括一个或两个变量:XS.= {XS1}XS.= {XS1XS2}.让XC是互补的XS.X.预测的反应FX)取决于所有变量X

FX) =FXS.XC).

预测反应的部分依赖于XS.是由预测响应的期望来定义的XC

F S. X S. = E. C [ F X S. X C ] = F X S. X C P. C X C D. X C

在哪里P.CXC)是边缘概率XC, 那是, P. C X C P. X S. X C D. X S. .假设每个观察都同样可能,并且之间的依赖XS.XC以及相互作用XS.XC在反应中并不强烈,绘图竞争依赖性通过使用观察到的预测器数据估计部分依赖性,如下所示:

F S. X S. 1 N 一世 = 1 N F X S. X 一世 C (1)

在哪里N是观察次数和X一世=(X一世S.X一世C一世观察。

当你呼叫绘图竞争依赖性函数,您可以指定经过训练的模型(F(·))和选择变量(XS.)通过使用输入参数RegressionMdlvars.,分别。绘图竞争依赖性计算在100个等间距点处的部分相关XS.或者你用'querypoints'名称-值对的论点。您可以指定数字(N)的观察样本,从给定的预测数据使用'numobservationstosample'名称-值对的论点。

回归模型的个体条件期望

个人条件期望(ICE)[2]作为部分依赖的扩展,表示预测变量与每个观察的预测响应之间的关系。虽然部分依赖性示出了预测器变量与预测的响应之间的平均关系,但是一组冰曲线分解平均信息并显示每个观察的单独依赖性。

绘图竞争依赖性为每个观察创建冰块。一组冰块可用于研究源自不同观察的部分依赖性的异质性。绘图竞争依赖性还可以使用通过输入参数提供的任何预测数据创建ICE图数据.您可以使用此功能来探索预测的响应空间。

考虑选定预测变量的ICE图XS.具有给定观察X一世C, 在哪里XS.= {XS.}XC是互补的一组XS.在整个变量集合中X,X一世=(X一世S.X一世C一世观察。冰块对应于求和的汇总等式1

F S. 一世 X S. = F X S. X 一世 C

绘图竞争依赖性阴谋 F S. 一世 X S. 对于每次观察一世当你指定“条件”作为“绝对”.如果您指定“条件”作为'中心'绘图竞争依赖性删除因不同观测而产生的标高效果后绘制所有绘图:

F S. 一世 以中心为中心 X S. = F X S. X 一世 C F 最小值 X S. X 一世 C

这个减法确保每个情节从零开始,以便您可以检查累积的效果XS.以及它们之间的相互作用XS.XC

分类模型的部分依赖和冰

在分类模型中,绘图竞争依赖性用与回归模型相同的方法计算部分依赖和个人条件期望,但有一个例外:不是使用来自模型的预测响应,而是使用中指定的类的预测分数标签

加权遍历算法

加权遍历算法[1]是一种估计基于树的模型的部分依赖性的方法。估计的部分依赖性是在树遍历期间访问的叶节点对应的响应值或得分值的加权平均值。

XS.是整个变量集的子集XXC是互补的XS.X.对于每一个人XS.计算部分依赖的值,算法将树从根(开头)节点从根(开始)节点遍历到叶(终端)节点,并找到叶节点的权重。通过在根节点处分配一个权重值来开始遍历开始。如果节点拆分XS.,该算法遍历适当的子节点XS.价值。子节点的权重变为与其父节点相同的值。如果节点拆分XC,该算法遍历两个子节点。每个子节点的权重变为其父节点的值乘以与每个子节点对应的观察的分数。在完成树遍历之后,算法通过使用指定的权重来计算加权平均值。

对于袋装树的集合,估计的部分依赖性是各种树木的加权平均值的平均值。

算法

绘图竞争依赖性用A.预测用于预测响应或分数的函数。绘图竞争依赖性选择适当的预测根据模型运行(RegressionMdlclassificationmdl.)和运行预测使用默认设置。详细资料预测函数,请参见预测函数。如果指定的模型是基于树的模型(不包括增强的树集合)和“条件”'没有任何',然后绘图竞争依赖性使用加权遍历算法而不是预测函数。有关详细信息,请参见加权遍历算法

回归模型对象

模型类型 完整或紧凑回归模型对象 预测响应的功能
决策树集成的自举聚合 CompactTreeBagger. 预测
决策树集成的自举聚合 TreeBagger 预测
回归模型的集合 RegressionEnsemble回归分析CompactRegressionEnsemble 预测
高斯核回归模型采用随机特征展开 回归科内尔 预测
高斯过程回归 regressiongp.CompactregressionGP. 预测
广义加性模型 回归compactregressiongam. 预测
广义线性混合效应模型 GeneralizeLmixedModel. 预测
广义线性模型 GeneralizedLinearModelCompact一项式标Model. 预测
线性混合效应模型 线性矩阵模型 预测
线性回归 LinearModelCompactLinearModel 预测
线性回归用于高维数据 回归线性 预测
神经网络回归模型 RegressionNeuralNetworkcompactregressionneuralnetwork 预测
非线性回归 NonLinearModel 预测
回归树 回归植物紧回归树 预测
金宝app支持向量机 RegressionSVMcompactregressionsvm. 预测

分类模型对象

模型类型 完整或紧凑分类模型对象 预测标签和分数的功能
判别分析分类器 分类Discriminant.紧分类判别式 预测
支持向量机或其他分类器的多款模型金宝app ClassificationECOCCompactClassificationECOC 预测
用于分类的学习者集合 分类素..CompactClassificationseMbleClassificationBaggedensemble. 预测
高斯核分类模型使用随机特征展开 ClassificationKernel 预测
广义加性模型 ClassificationGAMCompactClassificationgam. 预测
K.最近的邻居模型 ClassificationKnn. 预测
线性分类模型 分类线性 预测
天真的贝叶斯模型 ClassificationNaiveBayesCompactClassificationNaiveBayes 预测
神经网络分类器 ClassificationNeuralNetworkCompactClassificationNeuralNetwork 预测
金宝app支持向量机用于单级和二进制分类 ClassificationSVMCompactClassificationsVM. 预测
多包分类的二进制决策树 ClassificationTree.紧分类树 预测
决策树的袋装集合 TreeBaggerCompactTreeBagger. 预测

替代功能

  • 部分竞争计算不可视化的部分依赖性。该函数可以在一次函数调用中计算两个变量和多个类的部分依赖关系。

参考

[1]弗里德曼,杰罗姆。H.“贪婪函数近似:梯度升压机。”统计史29,不。5(2001):1189-1232。

[2] 戈尔茨坦、亚历克斯、亚当·卡佩尔纳、贾斯汀·布莱奇和埃米尔·皮特金。”窥视黑匣子:通过个人条件期望图可视化统计学习。”计算和图形统计杂志24日,没有。1(2015年1月2日):44-65。

[3] Hastie,Trevor,Robert Tibshirani和Jerome Friedman。统计学习的要素。纽约,纽约:施普林格纽约,2001。

扩展功能

在R2017B中介绍