这个例子展示了如何探索一个Apache Cassandra®数据库的结构,并使用一个Cassandra数据库连接从一个Cassandra数据库表导入数据到MATLAB®。Cassandra数据库根据分区键存储数据库表。分区键影响数据库中数据的过滤方式。
在本例中,Cassandra数据库包含employees_by_job
包含员工数据的数据库表和job_id
分区键。
要运行此示例,必须首先安装Apache Cassandra®Database的Database Toolbox™接口。有关详细信息,请参见用于Apache Cassandra数据库安装的数据库工具箱接口.
使用本地主机地址创建一个Cassandra数据库连接。康涅狄格州
是一个卡珊德拉
对象。
联络点=“localhost”;康涅狄格州=卡桑德拉(联络点);
使用Cassandra数据库连接查看Cassandra数据库中的键空格。返回的字符串数组包含键空格。键空间包含一个或多个数据库表,并定义数据库如何复制表中的数据。
conn.Keyspaces
ans =1×6的字符串数组"employeedata" "system" "system_auth" "system_distributed" "system_schema" "system_traces"
属性中的Cassandra数据库表的名称employeedata
用于。t
中包含数据库表名称的字符串数组是否为employeedata
用于。
用于=“employeedata”;用于t =表名(康涅狄格州)
t =3×1的字符串数组“employees_by_id”“employees_by_job employees_by_name”
属性中返回Cassandra数据库列的名称employees_by_job
数据库表中。
表名=“employees_by_job”;关口= columninfo(康涅狄格州、用于表名);
控件中显示Cassandra数据库列的前几个名称employees_by_job
数据库表中。
头(峡路)
ans =8×4表数据类型名称PartitionKey ClusteringColumn ________________ ________ ____________ ________________ " job_id”“文本”真正的“”“hire_date”“日期“false”DESC”“employee_id”“int“false”ASC”“commission_pct”“双“false”“department_id”“int“false”“电子邮件”、“文本“false”“first_name”“文本“false”“last_name文本“false””
关口
是一个包含以下变量的表:
的名字
—Cassandra数据库列名
数据类型
—Cassandra数据库列的CQL (Cassandra Query Language)数据类型
PartitionKey
—分区键指示器
ClusteringColumn
-聚类列指示器
的值PartitionKey
变量指示数据库列是否为分区键。列job_id
(作业标识符)是该数据库表中的分区键。
从employees_by_job
将数据库表导入MATLAB,使用分区键值为店员,SH_CLERK
.
keyValue =“SH_CLERK”;结果= partitionRead(康涅狄格州、用于表名,...keyValue);
显示返回的员工数据的前几行。
(结果)
ans =表8×13job_id hire_date employee_id commission_pct department_id邮件first_name last_name manager_id办公室performance_ratings phone_number工资建筑房间 __________ ___________ ___________ ______________ _____________ __________ __________ __________ __________ ________________ ___________________ ______________ ______ " SH_CLERK“03 - 183年2月- 2008年NaN 50 "GGEONI" "Girard" "Geoni" 120 "West" 121 [ 2] "650.507.9879" 2800 "SH_CLERK" 13-Jan-2008 199 NaN 50 "DGRANT" "Douglas" "Grant" 124 "West" 139 [3×1 int32] "650.507.9844" 2600 "SH_CLERK" 19-Dec-2007 191 NaN 50 "RPERKINS" "Randall" "Perkins" 122 "West" 255 [ 2] "650.505.4876" 2500 "SH_CLERK" 21-Jun-2007 182 NaN 50 "MSULLIVA" "Martha" "Sullivan" 120 "East" 112 [2×1 int32] "650.507.9878" 2500 "SH_CLERK" 21-Jun-2007 198 NaN 50 "DOCONNEL" "Donald" "OConnell" 124 "East" 125 [3×1 int32] "650.507.9833" 2600 "SH_CLERK" 17-Mar-2007 195 NaN 50 "VJONES" "Vance" "Jones" 123 "West" 236 [5×1 int32] "650.501.4876" 2800 "SH_CLERK" 07-Feb-2007 187 NaN 50 "ACABRIO" "Anthony" "Cabrio" 121 "West" 345 [3×1 int32] "650.509.4876" 3000 "SH_CLERK" 11-Jul-2006 190 NaN 50 "TGATES" "Timothy" "Gates" 122 "East" 297 [3×1 int32] "650.505.3876" 2900
结果
是一个包含以下变量的表:
job_id
——作业的标识符
hire_date
——雇佣日期
employee_id
——员工标识符
commission_pct
,佣金比例
department_id
——部门标识符
电子邮件
——电子邮件地址
first_name
——名字
last_name
——姓
manager_id
——经理标识符
办公室
-办公室位置(包含建筑和房间两个变量的表)
performance_ratings
——性能评级
phone_number
——电话号码
工资
- - - - - -工资
关上(康涅狄格州)
partitionRead
|卡珊德拉
|columninfo
|表名
|关闭