使用高数组和数据存储的大数据工作流- MATLAB & Simulink -德国MathWorks金宝app

使用高数组和数据存储的大数据工作流

图中显示了一个典型的工作流，该工作流使用高数组来分析大型数据集。在这个工作流中，在扩展到分析整个数据集之前，先分析数据的一小部分。并行计算可以帮助您从步骤6扩展到步骤7。也就是说，在检查您的代码在小数据集上工作之后，在整个数据集上运行它。你可以用MATLAB^®以增强此工作流程。

问题	解决方案	所需的产品下载188bet金宝搏	更多的信息
你的数据太大了吗?	使用任何数量的带有任何行的内存up，使用高阵列。这个工作流非常适合数据分析和机器学习。	MATLAB	用于内存不足数据的高数组
	在本地机器上并行使用高数组。	MATLAB 并行计算工具箱™	在并行池中使用高数组
	在集群上并行使用高数组。	MATLAB 并行计算工具箱 MATLAB并行服务器™	要在Hadoop集群上使用高数组，请参见在启用Spark的Hadoop集群上使用高数组对于所有其他类型的集群，使用非本地集群配置文件来设置并行池。例如，请参见在并行池中使用高数组
	如果您的数据在多个维度上都很大，请使用`分布式`代替。	MATLAB 并行计算工具箱 MATLAB并行服务器	将数组分配给并行工作器