使用高阵列分析数据库中的大数据
此示例确定了存储在数据库中的大量飞行数据的最小到达延迟。您可以访问大型数据集并使用DataBaseDataStastore
具有数据库工具箱™的对象。一旦存在一个高阵列,您就可以在高阵列中可视化数据。另外,您可以编写一种MAPREDUCE算法,以定义数据的块和减少。
这DataBaseDataStastore
对象不使用并行计算工具箱™安装并金宝app行池支持。要使用高阵列分析数据或运行MAPREDUCE算法,请将全局执行环境设置为本地MATLAB®会话。
此示例使用预先配置的JDBC数据源来创建数据库连接。有关更多信息,请参阅
功能。configurejdbcdatasource
创造DataBaseDataStastore
目的
将全局执行环境设置为本地MATLAB®会话。
MapReducer(0);
文件AirlinesMall.CSV
包含大量的飞行数据。将此文件加载到Microsoft®SQLServer®数据库表中航空公司
。该表包含123,523个记录。
创建到JDBC数据源的数据库连接MSSQLSERVERJDBCAUTH
。此数据源将JDBC驱动程序配置为具有Windows®身份验证的Microsoft®SQLServer®数据库。指定空白的用户名和密码。
dataSource =“ mssqlserverjdbcauth”;用户名=“”;密码=“”;conn =数据库(数据源,用户名,密码);
创建一个DataBaseDataStastore
使用数据库连接和SQL查询对象。此SQL查询从航空公司
桌子。DataBaseDataStastore
执行SQL查询。
sqlquery =“从航空公司中选择Arrdelay”;dbds = databsedatastore(conn,sqlquery,“读取尺寸”,50000);
使用高阵列查找最小到达延迟
因为DataBaseDataStastore
对象返回表,创建一个高高的表。
tt =高(dbds);
找到最小到达延迟。
minarrdelay = min(tt.arrdelay);
Minarrdelay
包含未评估的最小到达延迟。要返回输出值,请使用收集
。有关详细信息,请参阅延期对高阵列的评估。
minarrdelayvalue =聚集(minarrdelay)
使用本地MATLAB会话评估高高的表达: - 1 of 1:以1.6秒的评估完成1.9秒Minarrdelayvalue = -64
除了确定最小值外,高阵列还支持许多其他功能。金宝app有关详细信息,请参阅金宝app支持功能。
关DataBaseDataStastore
对象和数据库连接
关闭(DBD)
也可以看看
DataBaseDataStastore
|数据库
|收集
|最小
|直方图
|MAPREDUCER
|高