parallel.cluster.Hadoop
mapreduce的Hadoop集群,mapreduce和高大的数组
描述
parallel.cluster。Hadoop集群对象提供一个配置mapreduce, mapreduce,高大的数组。
属性
parallel.cluster。Hadoop对象有以下属性。
财产 | 描述 |
---|---|
AdditionalPaths |
MATLAB文件夹添加到搜索路径的工人,指定为一个特征向量,字符串或字符串数组,数组或单元的特征向量 |
AttachedFiles |
文件和文件夹,在被发送到工人mapreduce 电话,指定为一个特征向量,字符串或字符串数组,数组或单元的特征向量 |
AutoAttachFiles |
指定是否自动附加文件 |
ClusterMatlabRoot |
指定路径MATLAB对工人使用 |
HadoopConfigurationFile |
应用程序配置文件Hadoop |
HadoopInstallFolder |
Hadoop在本地机器上的安装位置 |
HadoopProperties |
地图的名称属性对Hadoop |
LicenseNumber |
网络许可牌照号码使用 |
RequiresOnlineLicensing |
指定集群使用在线许可 |
SparkInstallFolder |
在本地机器上安装位置的火花 |
SparkProperties |
地图的名称属性对火花 |
当你卸下计算工人,计算所需的任何文件在客户端也必须上可用的工人。默认情况下,客户机试图自动检测和附加文件。关掉自动检测设置AutoAttachFiles
属性为false。如果自动检测不能找到所有的文件,或者从客户机发送文件到职工缓慢,使用以下属性。
如果无法访问的文件在一个文件夹上的工人,设置
AttachedFiles
财产。从客户机集群复制每个文件指定人员。如果文件在一个文件夹访问工人,你可以设置
AdditionalPaths
财产。使用AdditionalPaths
属性路径添加到每个工人的MATLAB®搜索路径,避免不必要的复制文件从客户端到工人。
HadoopProperties
允许您为Hadoop覆盖配置属性。看到在Hadoop的属性列表®文档。
的SparkInstallFolder
默认设置为吗SPARK_HOME
环境变量。这是高阵列所需评价Hadoop mapreduce(但不包括)。正确配置集群,您只需要设置安装文件夹。
SparkProperties
允许您覆盖配置属性的火花。看到火花的属性列表®文档。
帮助
为进一步帮助,类型:
帮助parallel.cluster.Hadoop
指定内存的属性
火花使Hadoop集群的地方限制有多少内存可用。你必须调整这些限制来支持您的工作流程。金宝app
收集的数据的大小
收集的数据给客户端火花是有限的属性:
spark.driver.memory
spark.executor.memory
收集的数据量从星星之火任务必须适应这些属性。星星之火的任务流程的数据块从HDFS,默认是128 MB的数据。如果你收集高数组包含大部分的原始数据,您必须确保这些属性设置为合适。
如果这些属性设置太小,你会看到一个错误如下。
错误使用高/收集(50行)的记忆;无法收集一个分区的大小300火花。调整spark.driver火花属性的值。内存和spark.executor。内存来适应这个分区。
调整属性的默认设置集群或直接在MATLAB。在MATLAB调整属性,添加名称-值对SparkProperties
集群的属性。例如:
集群= parallel.cluster.Hadoop;cluster.SparkProperties (“spark.driver.memory”)=“2048”;cluster.SparkProperties (“spark.executor.memory”)=“2048”;mapreduce(集群);
为MATLAB工人指定工作内存大小
MATLAB工人工作记忆的数量是有限的火花属性:
spark.yarn.executor.memoryOverhead
默认情况下,这个设置为2.5 GB。你通常需要增加这个如果你使用arrayfun
,cellfun
,或自定义数据存储生成的大量数据。建议增加这个如果你遇到丢失或火花执行人坠毁过程。
您可以调整这些属性的默认设置集群或直接在MATLAB。在MATLAB调整属性,添加名称-值对集群的SparkProperties属性。例如:
集群= parallel.cluster.Hadoop;cluster.SparkProperties (“spark.yarn.executor.memoryOverhead”)=“4096”;mapreduce(集群);
版本历史
介绍了R2014b