主要内容

为回归使用并行处理TreeBagger工作流

这个例子向您展示了如何:

  • 使用一个袋装回归树估计特性的重要性。

  • 通过使用并行计算提高计算速度。

1985年的样本数据是一个数据库汽车进口205观察,25预测,和1响应,保险风险评级,或“象征”。The first 15 variables are numeric and the last 10 are categorical. The symboling index takes integer values from -3 to 3.

加载示例数据单独成预测和响应数组。

负载进口- 85;Y = X (: 1);X = X(:, 2:结束);

设置并行环境,使用默认的工人数量。在创建这个示例中有六个核心的计算机。

mypool = parpool
开始平行池(parpool)使用“本地”概要文件…连接到平行池(工人数量:6)。mypool = ProcessPool属性:连接:真正的NumWorkers: 6集群:本地AttachedFiles: {} AutoAddClientPath:真正的IdleTimeout: 30分钟(30分钟)SpmdEnabled:真的

将选项设置为使用并行处理。

paroptions = statset (“UseParallel”,真正的);

使用叶片大小估计特征的重要性15000年树并行。时间函数进行比较。

抽搐b = TreeBagger(5000年,X, Y,“方法”,“r”,“OOBVarImp”,“上”,“猫”16:25,“MinLeafSize”,1“选项”,paroptions);toc
运行时间是9.873065秒。

在串行执行相同的计算时间的比较。

抽搐b = TreeBagger(5000年,X, Y,“方法”,“r”,“OOBVarImp”,“上”,“猫”16:25,“MinLeafSize”1);toc
运行时间是28.092654秒。

结果表明,并行计算需要的一小部分时间连续计算。注意,运行时间取决于您的操作系统。

另请参阅

(并行计算工具箱)||

相关的话题