主要内容

高大的数组和mapreduce

使用MATLAB并行分析大数据集®高大的阵列和数据存储mapreduce在火花®和Hadoop®集群和并行池

您可以使用并行计算工具箱™并行评估tall-array表达式使用并行池在桌面上。使用高阵列允许您运行大数据不装入内存的应用程序在您的机器上。您还可以使用并行计算工具箱扩大tall-array处理连接到一个平行池上运行MATLAB并行服务器™集群。或者,您可以使用一个火花启用Hadoop集群运行MATLAB并行服务器。有关更多信息,请参见大数据工作流使用高阵列和数据存储

功能

全部展开

创建高数组
数据存储 创建数据存储大型数据集合
mapreduce 编程技术分析数据集不适合在内存中
mapreduce mapreduce和高大的数组定义并行执行环境
分区 分区数据存储
numpartitions 数量的数据存储分区
parpool 在集群上创建并行池
gcp 得到当前并行池

全部展开

parallel.Pool 平行的工人
parallel.cluster.Hadoop mapreduce的Hadoop集群,mapreduce和高大的数组

例子和如何

大数据工作流使用高阵列和数据存储

了解典型工作流使用高阵列来分析大数据集。

使用高阵列并行池

发现高计算工具箱和并行阵列MATLAB并行服务器

处理大数据在云端

这个例子展示了如何访问云中的大数据集和过程在云计算集群中使用MATLAB用于大数据的功能。

火花使Hadoop集群上使用高数组

创建和使用高表火花集群不改变你的MATLAB代码。

在并行运行mapreduce池

试一试mapreduce先进的大数据分析使用并行计算工具。

Hadoop集群上运行mapreduce

了解mapreduce先进的大数据分析的Hadoop集群。

分区并行数据存储

使用分区把你的数据存储成更小的部分。

概念

代码运行在并行池

了解启动和停止平行池,池的大小,和集群的选择。

指定您的平行的偏好

指定你的喜好,并自动创建一个平行的池。

发现集群和集群配置文件使用

找出如何使用集群配置文件和发现云团在Amazon EC2上运行。

特色的例子