主要内容

大数据处理

使用分布式数组、高数组、数据存储或并行分析大数据集mapreduce,使用Spark®和Hadoop®集群

您可以使用并行计算工具箱™在多个MATLAB®worker之间并行分布大型数组,以便您可以运行使用集群的组合内存的大数据应用程序。您将整个数组作为单个实体来操作,但是,worker只对数组中自己的部分进行操作,并在必要时自动在它们之间传输数据。并行计算工具箱还允许您执行MATLAB®高阵列和数据存储并行计算,这样您就可以分析不适合集群内存的大数据集。你可以使用MATLAB并行服务器要跑高阵和数据存储在Spark支持的Hadoop集群上并行计算。这样做可以显著减少非常大的数据计算的执行时间。

类别

  • 分布式阵列
    使用分布式数组和同时执行并行分析大数据集
  • Tall Arrays和mapreduce
    使用MATLAB高数组和数据存储或并行分析大数据集mapreduceSpark和Hadoop集群,以及并行池