主要内容

大文件和大数据

访问和处理文件集合和大数据集

大数据集可能以大文件的形式存在,这些文件不适合存储在可用内存中,或者需要很长时间来处理。一个大数据集也可以是许多小文件的集合。处理大数据集没有单一的方法,所以用MATLAB®包括许多用于访问和处理大数据的工具。

首先创建一个数据存储,它可以一次访问一小部分数据。您可以使用数据存储来管理数据的增量导入。利用MATLAB常用函数分析数据,如的意思是柱状图,在数据存储上创建一个高数组。对于更复杂的问题,可以编写MapReduce算法来定义数据的分块和缩减。