MATLAB Hadoop和Spark

使用MATLAB与Spark在gb和tb数据

MATLAB®为处理从单个工作站扩展到计算集群的大数据提供了大量的功能。这包括访问Hadoop Distributed File System (HDFS)的数据和在Apache Spark上运行算法。

使用MATLAB,您可以:

  • 从HDFS访问数据来探索,可视化,并在本地工作站上进行原型分析
  • 分析数据,创建准确的预测模型,并运行MATLAB算法,您的数据生活使用Hadoop和火花

在MATLAB中使用HDFS和Spark中的数据

高大的数组允许您使用MATLAB算法在本地工作站和Hadoop上使用Spark使用熟悉和直观的MATLAB语言。

你可以操作和清洁你的数据和执行机器学习回归和各种统计分析


MATLAB Tall Arrays in Action