mapreduce
mapreduce
在火花®和Hadoop®集群和并行池可以使用并行计算工具箱™使用桌面的并行池并行计算高数组表达式。使用高数组可以让您运行大数据应用程序,这些应用程序不适合您的机器内存。还可以使用并行计算工具箱,通过连接到运行在MATLAB并行服务器™集群。您也可以使用启用Spark的Hadoop集群运行MATLAB并行服务器.有关更多信息,请参见使用高数组和数据存储的大数据工作流.
了解使用高数组分析大数据集的典型工作流程。
在并行计算工具箱中发现高数组MATLAB并行服务器.
这个示例展示了如何访问云中的大型数据集,并使用MATLAB的大数据能力在云集群中处理它。
在Spark集群上创建和使用高表,无需更改MATLAB代码。
试一试mapreduce
使用并行计算工具箱进行大数据的高级分析。
了解mapreduce
用于Hadoop集群上的高级大数据分析。
使用分区
把你的数据存储
成更小的部分。
了解启动和停止并行池、池大小和集群选择。
指定您的首选项,并自动创建并行池。
了解如何使用集群配置文件,并发现在Amazon EC2上运行的云集群。