mapreducer

定义MapReduce和高大阵列并行执行环境

描述

mapreducer定义了执行环境mapreduce或高数组。使用mapreducer函数来改变所述执行环境使用不同的群集或以串联和并联的发展之间切换。

默认执行环境使用在本地MATLAB®会话,或者如果你有并行计算工具箱™并行池。如果您有并行计算工具箱安装,当您使用mapreduce功能,MATLAB自动启动的工人平行池,除非你已经改变了默认的首选项。默认情况下,并行池使用本地工人,通常一名工人在您的机器每个核心。如果你关闭自动创建并行池选项,则如果要使用并行资源,则必须显式启动池。看到指定并行首选项

当高大的数组时,使用mapreducer到执行环境中设置创建高大阵列之前。高大的阵列绑定到当前全球执行环境,他们构造时。如果随后更改了全球执行环境,那么高大的数组是无效的,你必须重新创建它。

注意

在MATLAB中,您不需要使用mapreducer因为mapreduce算法和高数组计算自动运行在本地MATLAB会话仅。如果您也有并行计算工具箱,那么您可以使用附加的mapreducer此页上列出的用于并行运行的配置选项。如果您有MATLAB编译器™,那么您可以使用单独mapreducer在部署环境中运行的配置选项。

看到:mapreducer在MATLAB文档中,或mapreducer在MATLAB编译器文档中。

mapreducer如果没有输入参数,则创建一个新的mapreducer执行环境与所有默认设置,并设置这是当前mapreduce或高数组执行环境。您可以使用gcmr获取当前mapreducer配置。

  • 如果您有默认的偏好(自动创建并行池那么,您还没有打开并行池吗mapreducer打开使用默认的群集配置文件,集水池gcmr返回到基于此池的mapreducer,并返回此mapreducer。

  • 如果您已经打开了一个并行池,那么mapreducergcmr返回一个基于当前池的mapreducer,并返回此mapreducer。

  • 如果已禁用自动创建并行池,并且您还没有开通并行池,然后mapreducergcmr到mapreducer基于本地MATLAB会话,和mapreducer返回这个mapreduce。

mapreducer(0)该指定mapreduce阵列计算在MATLAB客户端会话,而无需使用任何并行资源运行。

mapreducer(poolobj指定并行执行的并行池mapreduce或高数组。poolobjparallel.Pool目的。默认池是返回或打开当前池gcp

mapreducer(hadoopCluster指定一个Hadoop®的并行执行mapreduce或高数组。hadoopClusterparallel.cluster.Hadoop目的。

mapreducer(先生集全球执行环境mapreduce或tall数组,使用之前创建的MapReducer对象,先生,如果其ObjectVisibility属性是'上'

先生= mapreduce (___返回MapReducer对象到指定的执行环境。你可以通过一个作为输入参数来定义几个MapReducer对象,这使您可以交换执行环境mapreducemapreducer

先生= mapreduce (___'ObjectVisibility', '关')隐藏MapReducer对象的可见性,先生,使用任何以前的语法。使用此语法,而不影响的全球执行环境来创建新的对象MapReducermapreduce

例子

串再使用本地工人或集群发展

如果你想在串行开发而不使用本地工人或你指定的集群,输入:

mapreducer(0);
如果你使用mapreducer创建一个高大的阵列后更改执行环境,那么高大的数组是无效的,你必须重新创建它。要再次使用本地工人或您指定的集群,请输入:
mapreducer(GCP);

mapreducer自动创建并行池关掉

如果你已经关掉了自动创建并行池选项,则如果要使用并行资源,则必须显式启动池。看到指定并行首选项了解详情。

下面的代码演示了如何使用mapreducer无需输入参数执行环境设置为本地MATLAB会话,然后指定一个本地并行池:

>> mapreducer >> parpool('本地'1);
使用“本地”配置文件启动并行池(parpool)…连接到1个工人。
> >收集(min(高(rand (1000 1))))
评估使用本地MATLAB会话高表达:评价0秒完成ANS = 5.2238e-04

输入参数

全部折叠

用于并行执行的池,指定为parallel.Pool目的。

例子:poolobj = gcp

Hadoop集群为并行执行,指定为parallel.cluster.Hadoop目的。

例子:hadoopCluster = parallel.cluster.Hadoop

输出参数

全部折叠

执行环境mapreduce和高大阵列,返回为MapReducer对象。

如果ObjectVisibility财产先生被设置为'上', 然后先生定义所有的默认执行环境mapreduce算法和高数组计算。如果ObjectVisibility属性是“关闭”,你可以通过先生作为输入参数,以mapreduce明确指定为特定呼叫的执行环境。

你可以通过一个作为输入参数来定义几个MapReducer对象,这使您可以交换执行环境mapreducemapreducer

提示

一个高大的阵列开发的算法的好处是,你只需要编写一次代码。您可以在本地开发代码,然后使用mapreducer以扩大项目,并利用并行计算工具箱提供的能力,MATLAB并行服务器™或MATLAB编译器,而无需重写你的算法。

介绍了R2014b