高数组和mapreduce
使用MATLAB并行分析大数据集®高数组和数据存储或
mapreduce
在火花®和Hadoop®集群和并行池您可以使用并行计算工具箱™使用桌面上的并行池并行计算高数组表达式。使用高数组可以运行计算机上内存无法容纳的大数据应用程序。还可以使用“并行计算工具箱”连接到运行在MATLAB并行服务器™集群。或者,您可以使用一个支持Spark的Hadoop集群运行MATLAB并行服务器.有关更多信息,请参见使用高阵列和数据存储的大数据工作流.
功能
类
例子和如何
- 使用高阵列和数据存储的大数据工作流
了解使用高数组分析大数据集的典型工作流程。
- 在并行池上使用高数组
在并行计算工具箱和中发现高数组MATLAB并行服务器.
- 云端处理大数据
这个例子展示了如何在云中访问一个大数据集,并使用MATLAB的大数据功能在云集群中处理它。
- 在Spark集群中使用高阵列
在Spark集群上创建和使用高表,而不更改MATLAB代码。
- 在并行池上运行mapreduce
试一试
mapreduce
使用“并行计算工具箱”对大数据进行高级分析。 - 在Hadoop集群上执行mapreduce
了解
mapreduce
用于Hadoop集群上的高级大数据分析。 - 并行分区一个数据存储
使用
分区
分割你的数据存储
分成更小的部分。
概念
- 在并行池上运行代码
了解启动和停止并行池、池大小和集群选择。
- 指定并行首选项
指定您的首选项,并自动创建一个并行池。
- 发现集群并使用集群概要文件
了解如何使用集群概要文件并发现云集群。