大数据处理

使用分布式阵列、大型阵列、数据存储或并行分析大数据集mapreduce在火花^®和Hadoop^®集群

您可以使用Parallel Computing Toolbox™在多个MATLAB®工作者之间并行分布大型数组，这样您就可以运行使用集群的组合内存的大数据应用程序。您将整个数组作为一个实体进行操作，但是，workers只对数组中它们的部分进行操作，并在必要时自动在它们之间传输数据。并行计算工具箱还使您能够执行MATLAB^®高大的数组,数据存储并行计算，这样您就可以分析不适合集群内存的大数据集。您可以使用MATLAB并行服务器™来运行tall array和数据存储在Spark启用的Hadoop集群上并行计算。这样做可以显著减少非常大的数据计算的执行时间。