文档帮助中心文档
绘制福芙价值
情节(解释器)
情节(讲解员、名称、值)
b =情节(___)
例子
阴谋(解释者)的Shapley值的水平条形图沙普利对象解释者.这些值存储在对象的值中ShapleyValues财产。每个竖条显示黑箱模型中每个特性的Shapley值(讲解员。BlackBoxModel.)对于查询点(讲解员。QueryPoint)。
阴谋(解释者)
解释者
沙普利
ShapleyValues
讲解员。BlackBoxModel.
BlackBoxModel.
讲解员。QueryPoint
QueryPoint
阴谋(解释者,名称,价值)使用一个或多个名称值参数指定其他选项。例如,指定'numimportantpredictors',5绘制Shapley绝对值最高的五个特征的Shapley值。
阴谋(解释者,名称,价值)
名称,价值
'numimportantpredictors',5
b =情节(___)返回条形图对象b使用前面语法中的任何输入参数组合。使用b查询或修改酒吧属性在创建后的条形图。
b
全部收缩
训练分类模型并创建沙普利对象。然后利用目标函数绘制Shapley值情节.
情节
加载Creditrating_Historical.数据集。该数据集包含客户id及其财务比率、行业标签和信用评级。
Creditrating_Historical.
TBL = READTABLE(“CreditRating_Historical.dat”);
显示表的前三行。
头(资源描述,3)
ANS =.3×8表ID WC_TA RE_TA EBIT_TA MVE_BVTD S_TA工业评分_____ _____ _____ _______ ________ _____ ________ ______ 62394 0.013 0.104 0.036 0.447 0.142 3 { 'BB'} 48608 0.232 0.335 0.062 1.969 0.281 8 { 'A'} 42444 0.311 0.367 0.074 1.935 0.366 1 {'A'}
通过使用培训Blackbox模型的信用评级模型fitcecoc函数。使用从第二列到第七列的变量资源描述作为预测变量。推荐的实践是指定类名以设置类的顺序。
fitcecoc
资源描述
黑箱= fitcecoc(资源描述,'评分',...'predictornames',tbl.properties.variablenames(2:7),...“CategoricalPredictors”,“行业”,...“类名”, {“AAA”“AA”“一个”'bbb'“BB”“B”'CCC'});
创建一个沙普利对象,它解释了最后一次观测的预测。为了更快的计算,将25%的观测数据从资源描述分层并使用样品来计算福利值。
queryPoint =(资源(最终,:)
querypoint =表1×8ID WC_TA RE_TA EBIT_TA MVE_BVTD S_TA工业评分_____ _____ _____ _______ ________ ____ ________ ______ 73104 0.239 0.463 0.065 2.924 0.34 2 { 'AA'}
rng (“默认”)再现性的百分比c = cvpartition(tbl.rating,“坚持”,0.25);tbl_s = tbl(测试(c),:);解释者=福利(Blackbox,Tbl_s,“QueryPoint”,querypoint);
对于分类模型,沙普利使用每个类的预测类得分计算Shapley值。中的值显示ShapleyValues财产。
讲解员。ShapleyValues
ANS =.6×8表预测AAA AA BBB BB B CCC __________ __________ __________ ___________ __________ ___________ ___________ ___________ " WC_TA“0.014583 0.0064698 0.0027468 0.00045582 -0.0079591 -0.011811 -0.011279”RE_TA“0.047796 0.027083 0.015166 -0.0031936 -0.025054 -0.059564 -0.083439”EBIT_TA“0.00034326 0.0001524 0.00012384 3.5202 -0.00019141 e-05-0.00038252 -0.00033693 "MVE_BVTD" 0.38221 0.38229 0.19383 -0.0079011 -0.15755 -0.21522 -0.17022 "S_TA" -0.0035663 -0.0025991 -0.00021177 -0.0010166 -2.0989e-05 0.00041415 -0.00058882 "Industry" -0.028315 -0.013392 0.00089644 0.022877 0.025636 0.028485 0.044835
的ShapleyValues属性包含每个类的所有特性的Shapley值。
通过使用使用来绘制预测类的福利值情节函数。
水平条形图显示所有变量的福音值,按其绝对值排序。由于相应的变量,每个福芙值解释了从预测类的平均分数的查询点的分数的偏差。
中指定所有类名,绘制所有类的Shapley值讲解员。BlackBoxModel..
情节(解释者,“类名”explainer.BlackboxModel.ClassNames)
训练一个回归模型并创建一个沙普利对象。使用对象功能适合来计算指定查询点的Shapley值。然后利用目标函数绘制预测器的Shapley值情节.调用时指定要绘制的重要预测器的数量情节函数。
适合
加载carbig数据集,其中包含在20世纪70年代和20世纪80年代初进行的汽车测量。
carbig
负载carbig
创建包含预测器变量的表加速,气缸等等,以及响应变量MPG..
加速
气缸
MPG.
台=表(加速度、汽缸、排量、马力、Model_Year重量,MPG);
在培训集中删除缺失值可以帮助降低内存消耗并加速培训fitrkernel函数。删除缺失的值资源描述.
fitrkernel
台= rmmissing(台);
训练一个黑盒模型MPG.通过使用fitrkernel功能
rng (“默认”)再现性的百分比mdl = fitrkernel(资源描述,“英里”,“CategoricalPredictors”[2 - 5]);
创建一个沙普利对象。指定数据集资源描述,因为mdl不包含培训数据。
mdl
讲解员=沙普利(mdl(资源)
explainer = shapley with properties: BlackboxModel: [1x1 RegressionKernel] QueryPoint: [] BlackboxFitted: [] ShapleyValues: [] NumSubsets: 64 X: [392x7 table] CategoricalPredictors: [2 5] Method: ' interonal -kernel' Intercept: 22.6202
解释者存储训练数据资源描述在X财产。
X
计算所有预测变量的福利值,以获得第一次观察资源描述.
: queryPoint =(资源(1)
querypoint =表1×7加速气缸位移马力Model_Year体重MPG ____________ _________ ____________ __________ __________ ______ ___ 12 8 307 130 70 3504
解释者=适合(解释者,Querypoint);
对于回归模型,沙普利使用预测的响应计算Shapley值,并将它们存储在ShapleyValues财产。中的值显示ShapleyValues财产。
ANS =.6×2表Predictor ShapleyValue ______________ ____________“加速”-0.1561“圆柱”-0.18306“位移”-0.34203“马力”-0.27291“Model_year”-0.2926“重量”-0.32402
通过使用使用的查询点的福利值绘制情节函数。指定'numimportantpredictors',5只绘制预测反应的五个最重要的预测因子。
情节(解释者,'numimportantpredictors'5)
水平条形图显示了五个最重要的预测因子的福音值,由其绝对值排序。由于相应的变量,每个福族物值解释了对来自平均值的查询点的预测的偏差。
对象解释黑盒模型,指定为沙普利对象。
指定可选的逗号分隔的对名称,价值论点。的名字参数名和价值为对应值。的名字必须出现在引号内。您可以以任何顺序指定多个名称和值对参数Name1, Value1,…,的家.
的名字
价值
Name1, Value1,…,的家
情节(解释者,'NumimportantPredictors',5,'ClassNames',C)
c
Numimportantpredictors.
分钟(M, 10)
米
要绘制的重要预测数,指定为正整数。的情节函数绘制指定数量的具有最高绝对Shapley值的预测器的Shapley值。
例子:'numimportantpredictors',5指定绘制五个最重要的预测因子。的情节函数通过使用绝对Shapley值来确定重要性的顺序。
数据类型:单|双倍的
单
双倍的
一会
讲解员。BlackboxFitted
要绘制的类标签,指定为类别或字符数组、逻辑或数字向量或字符向量的单元格数组。中的值和数据类型“类名”属性中的类名必须匹配一会中机器学习模型的性质解释者(explainer.BlackboxModel.ClassNames)。
“类名”
explainer.BlackboxModel.ClassNames
您可以指定一个或多个标签。如果指定多个类标签,则函数绘制多个条形,具有不同颜色的每个功能。
默认值是查询点的预测类(BlackboxFitted财产解释者)。
BlackboxFitted
此参数仅在机器学习模型(BlackBoxModel.)解释者是一个分类模型。
例子:'classnames',{'红色','蓝'}
'classnames',{'红色','蓝'}
例子:'classnames',semoremer.blackboxmodel.classnames指定“类名”所有的班级BlackBoxModel..
'classnames',semoremer.blackboxmodel.classnames
数据类型:单|双倍的|逻辑|char|细胞|分类
逻辑
char
细胞
分类
在博弈论中,参与者的Shapley值是参与者在合作博弈中的平均边际贡献。在机器学习预测的上下文中,一个查询点的特征的Shapley值解释了该特征对指定查询点的预测(对回归的响应或分类的每个类的得分)的贡献。
查询点的特征的Shapley值是特征对平均预测偏差的贡献。对于一个查询点,所有特征的Shapley值的和对应于预测与平均值的总偏差。也就是说,所有特征的平均预测和Shapley值的和对应于查询点的预测。
有关详细信息,请参见机器学习模型的Shapley值.
Lundberg, Scott M和S. Lee。“解释模型预测的统一方法”神经信息处理系统研究进展30(2017): 4765 - 774。
Aas, Kjersti, Martin。朱勒姆和安德斯·洛兰德。解释特征依赖时的个人预测:对Shapley值的更精确的近似arxiv:1903.10464(2019).
沙普利|适合
您拥有此示例的修改版本。您是否希望使用您的编辑打开此示例?
你点击一个链接对应于这个MATLAB命令:
在MATLAB命令窗口中输入它来运行命令。Web浏览器不支持MATLAB命令。金宝app
选择一个网站,在那里获得翻译的内容,并看到当地的活动和优惠。根据您的位置,我们建议您选择:.
您还可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。
联系您当地的办公室