为回归使用并行处理TreeBagger
工作流
这个例子向您展示了如何:
使用一个袋装回归树估计特性的重要性。
通过使用并行计算提高计算速度。
1985年的样本数据是一个数据库汽车进口205观察,25预测,和1响应,保险风险评级,或“象征”。The first 15 variables are numeric and the last 10 are categorical. The symboling index takes integer values from -3 to 3.
加载示例数据单独成预测和响应数组。
负载进口- 85;Y = X (: 1);X = X(:, 2:结束);
设置并行环境,使用默认的工人数量。在创建这个示例中有六个核心的计算机。
mypool = parpool
开始平行池(parpool)使用“本地”概要文件…连接到平行池(工人数量:6)。mypool = ProcessPool属性:连接:真正的NumWorkers: 6集群:本地AttachedFiles: {} AutoAddClientPath:真正的IdleTimeout: 30分钟(30分钟)SpmdEnabled:真的
将选项设置为使用并行处理。
paroptions = statset (“UseParallel”,真正的);
使用叶片大小估计特征的重要性1
和5000年
树并行。时间函数进行比较。
抽搐b = TreeBagger(5000年,X, Y,“方法”,“r”,“OOBVarImp”,“上”,…“猫”16:25,“MinLeafSize”,1“选项”,paroptions);toc
运行时间是9.873065秒。
在串行执行相同的计算时间的比较。
抽搐b = TreeBagger(5000年,X, Y,“方法”,“r”,“OOBVarImp”,“上”,…“猫”16:25,“MinLeafSize”1);toc
运行时间是28.092654秒。
结果表明,并行计算需要的一小部分时间连续计算。注意,运行时间取决于您的操作系统。
另请参阅
parpool
(并行计算工具箱)|statset
|TreeBagger