主要内容

高数组和mapreduce

使用MATLAB并行分析大数据集®高数组和数据存储或mapreduce在火花®和Hadoop®集群和并行池

您可以使用并行计算工具箱™使用桌面上的并行池并行计算高数组表达式。使用高数组可以运行计算机上内存无法容纳的大数据应用程序。还可以使用“并行计算工具箱”连接到运行在MATLAB并行服务器™集群。或者,您可以使用一个支持Spark的Hadoop集群运行MATLAB并行服务器.有关更多信息,请参见使用高阵列和数据存储的大数据工作流

功能

全部展开

创建高数组
数据存储 为大型数据集合创建数据存储
mapreduce 用于分析不适合存储的数据集的编程技术
mapreduce 为mapreduce和tall数组定义并行执行环境
分区 对数据存储进行分区
numpartitions 数据存储分区数
parpool 在集群上创建并行池
gcp 获取当前并行池

全部展开

平行的。池 平行的工人池
parallel.cluster.Hadoop Hadoop集群用于mapreducer、mapreduce和tall阵列
parallel.cluster.Spark 火花集群用于mapreducer, mapreduce和tall数组

例子和如何

概念