MATLAB®为处理从单个工作站扩展到计算集群的大数据提供了大量的功能。这包括访问Hadoop Distributed File System (HDFS)的数据和在Apache Spark上运行算法。
使用MATLAB,您可以:
- 从HDFS访问数据来探索,可视化,并在本地工作站上进行原型分析
- 分析数据,创建准确的预测模型,并运行MATLAB算法,您的数据生活使用Hadoop和火花
高大的数组允许您使用MATLAB算法在本地工作站和Hadoop上使用Spark使用熟悉和直观的MATLAB语言。
你可以操作和清洁你的数据和执行机器学习,回归和各种统计分析.
MATLAB Tall Arrays in Action