探索和卡桑德拉从数据库导入数据表
这个例子展示了如何探索Apache™卡桑德拉®数据库的结构和卡桑德拉数据库表数据导入MATLAB®使用卡桑德拉与Apache Cassandra数据库c++数据库连接接口。卡珊德拉数据库存储数据库表分区键。分区键影响如何过滤数据在数据库中。
在本例中,数据库包含了卡桑德拉employees_by_job
员工数据和数据库表job_id
分区键。
创建卡桑德拉数据库连接
创建一个卡桑德拉数据库连接使用配置数据源CassandraDataSource
和一个空白的用户名和密码。的apacheCassandra
函数返回康涅狄格州
作为一个连接
对象。
数据源=“CassandraDataSource”;用户名=”“;密码=”“;康涅狄格州= apacheCassandra(数据源、用户名、密码);
探索卡桑德拉数据库结构
视图使用卡珊德拉卡珊德拉的用于数据库数据库连接。包含用于返回的字符串数组。用于包含一个或多个数据库表和定义了数据库中的数据表的复制。
conn.Keyspaces
ans =6×1的字符串“系统”“employeedata system_auth”“system_distributed”“system_schema”“system_traces”
返回卡桑德拉的数据库表的名称employeedata
用于。t
是一个字符串数组,其中包含的数据库表的名称吗employeedata
用于。
用于=“employeedata”;用于t =表名(康涅狄格州)
t =3×1的字符串“employees_by_job”“employees_by_id employees_by_name”
卡桑德拉的名称返回数据库中的列employees_by_job
数据库表中。
表名=“employees_by_job”;关口= columninfo(康涅狄格州、用于表名);
显示前几卡桑德拉数据库列的名称employees_by_job
数据库表中。
头(峡路)
ans =8×4表名字数据类型PartitionKey ClusteringColumn ___________ ________, _______ ___________“job_id”“文本”真”““hire_date”“日期”假“DESC”“employee_id”“int”假“ASC”“commission_pct”“替身”假““department_id”“int”假”“电子邮件”“文本”假““first_name”“文本”假“last_name”“文本”是假的”“
关口
是一个表与这些变量:
的名字
——卡桑德拉数据库列名数据类型
卡桑德拉的查询语言(CQL)卡桑德拉数据库列的数据类型PartitionKey
——分区关键指标ClusteringColumn
——聚集列指标
中的值PartitionKey
变量显示数据库列是否一个分区键。列job_id
(作业的标识符)是一个在这个数据库表分区键。
卡桑德拉从数据库导入数据
导入的数据employees_by_job
数据库表为MATLAB。这个数据库数据商店职员,所以使用分区键值SH_CLERK
。
keyValue =“SH_CLERK”;结果= partitionRead(康涅狄格州、用于表名,…keyValue);
显示返回的员工的前几行数据。
(结果)
ans =表8×13job_id hire_date employee_id commission_pct department_id邮件first_name last_name manager_id办公室performance_ratings phone_number工资建筑房间_________________ __________ __________ __________ __________ __________…………* * *……“SH_CLERK”___________ ___________________, * * * 03 - 183年2月- 2008年南50“GGEONI”“吉拉德”“Geoni”120“西方”121 {[2]}“650.507.9879”2800“SH_CLERK”13 - 199年1月- 2008年南50“DGRANT”“道格拉斯”“授予”124“西方”139 {3×1 int32}“650.507.9844”2600“SH_CLERK”19日——191年12月- 2007年南50“RPERKINS”“兰德尔”“珀金斯”122“西方”255 {[2]}“650.505.4876”2500“SH_CLERK”21日——182年6月- 2007年南50“MSULLIVA”“玛莎”“沙利文”120“东方”112 {2×1 int32}“650.507.9878”2500“SH_CLERK”21日——198年6月- 2007年南50“DOCONNEL”“唐老鸭”“OConnell”124“东方”125 {3×1 int32}“650.507.9833”2600“SH_CLERK”17 - mar - 2007 195南50“VJONES”“万斯”“琼斯”123“西方”236 {5×1 int32}“650.501.4876”2800“SH_CLERK 07 - 187年2月- 2007年南50“ACABRIO”“安东尼”“敞篷车”121“西方”345 {3×1 int32}“650.509.4876”3000“SH_CLERK”11——190年7月- 2006年南50“TGATES”“盖”“盖茨”122“东方”297 {3×1 int32}“650.505.3876”2900
结果
是一个表,其中包含这些变量:
job_id
——作业的标识符hire_date
——雇佣日期employee_id
——员工标识符commission_pct
,佣金比例department_id
——部门标识符电子邮件
——电子邮件地址first_name
——名字last_name
——姓manager_id
——经理标识符办公室
——办公室位置(表,其中包含两个变量的建筑和房间)performance_ratings
——性能评级phone_number
——电话号码工资
- - - - - -工资
关闭卡桑德拉的数据库连接
关上(康涅狄格州)
另请参阅
apacheCassandra
|表名
|columninfo
|partitionRead
|关闭