主要内容

探索和导入数据从Cassandra数据库表

这个例子展示了如何探索一个Apache Cassandra®数据库的结构,并使用一个Cassandra数据库连接从一个Cassandra数据库表导入数据到MATLAB®。Cassandra数据库根据分区键存储数据库表。分区键影响数据库中数据的过滤方式。

在本例中,Cassandra数据库包含employees_by_job包含员工数据的数据库表和job_id分区键。

要运行此示例,必须首先安装Apache Cassandra®Database的Database Toolbox™接口。有关详细信息,请参见用于Apache Cassandra数据库安装的数据库工具箱接口

创建Cassandra数据库连接

使用本地主机地址创建一个Cassandra数据库连接。康涅狄格州是一个卡珊德拉对象。

联络点=“localhost”;康涅狄格州=卡桑德拉(联络点);

探索Cassandra数据库结构

使用Cassandra数据库连接查看Cassandra数据库中的键空格。返回的字符串数组包含键空格。键空间包含一个或多个数据库表,并定义数据库如何复制表中的数据。

conn.Keyspaces
ans =1×6的字符串数组"employeedata" "system" "system_auth" "system_distributed" "system_schema" "system_traces"

属性中的Cassandra数据库表的名称employeedata用于。t中包含数据库表名称的字符串数组是否为employeedata用于。

用于=“employeedata”;用于t =表名(康涅狄格州)
t =3×1的字符串数组“employees_by_id”“employees_by_job employees_by_name”

属性中返回Cassandra数据库列的名称employees_by_job数据库表中。

表名=“employees_by_job”;关口= columninfo(康涅狄格州、用于表名);

控件中显示Cassandra数据库列的前几个名称employees_by_job数据库表中。

头(峡路)
ans =8×4表数据类型名称PartitionKey ClusteringColumn  ________________ ________ ____________ ________________ " job_id”“文本”真正的“”“hire_date”“日期“false”DESC”“employee_id”“int“false”ASC”“commission_pct”“双“false”“department_id”“int“false”“电子邮件”、“文本“false”“first_name”“文本“false”“last_name文本“false””

关口是一个包含以下变量的表:

  • 的名字—Cassandra数据库列名

  • 数据类型—Cassandra数据库列的CQL (Cassandra Query Language)数据类型

  • PartitionKey—分区键指示器

  • ClusteringColumn-聚类列指示器

的值PartitionKey变量指示数据库列是否为分区键。列job_id(作业标识符)是该数据库表中的分区键。

从Cassandra数据库导入数据

employees_by_job将数据库表导入MATLAB,使用分区键值为店员,SH_CLERK

keyValue =“SH_CLERK”;结果= partitionRead(康涅狄格州、用于表名,...keyValue);

显示返回的员工数据的前几行。

(结果)
ans =表8×13job_id hire_date employee_id commission_pct department_id邮件first_name last_name manager_id办公室performance_ratings phone_number工资建筑房间  __________ ___________ ___________ ______________ _____________ __________ __________ __________ __________ ________________ ___________________ ______________ ______ " SH_CLERK“03 - 183年2月- 2008年NaN 50 "GGEONI" "Girard" "Geoni" 120 "West" 121 [ 2] "650.507.9879" 2800 "SH_CLERK" 13-Jan-2008 199 NaN 50 "DGRANT" "Douglas" "Grant" 124 "West" 139 [3×1 int32] "650.507.9844" 2600 "SH_CLERK" 19-Dec-2007 191 NaN 50 "RPERKINS" "Randall" "Perkins" 122 "West" 255 [ 2] "650.505.4876" 2500 "SH_CLERK" 21-Jun-2007 182 NaN 50 "MSULLIVA" "Martha" "Sullivan" 120 "East" 112 [2×1 int32] "650.507.9878" 2500 "SH_CLERK" 21-Jun-2007 198 NaN 50 "DOCONNEL" "Donald" "OConnell" 124 "East" 125 [3×1 int32] "650.507.9833" 2600 "SH_CLERK" 17-Mar-2007 195 NaN 50 "VJONES" "Vance" "Jones" 123 "West" 236 [5×1 int32] "650.501.4876" 2800 "SH_CLERK" 07-Feb-2007 187 NaN 50 "ACABRIO" "Anthony" "Cabrio" 121 "West" 345 [3×1 int32] "650.509.4876" 3000 "SH_CLERK" 11-Jul-2006 190 NaN 50 "TGATES" "Timothy" "Gates" 122 "East" 297 [3×1 int32] "650.505.3876" 2900

结果是一个包含以下变量的表:

  • job_id——作业的标识符

  • hire_date——雇佣日期

  • employee_id——员工标识符

  • commission_pct,佣金比例

  • department_id——部门标识符

  • 电子邮件——电子邮件地址

  • first_name——名字

  • last_name——姓

  • manager_id——经理标识符

  • 办公室-办公室位置(包含建筑和房间两个变量的表)

  • performance_ratings——性能评级

  • phone_number——电话号码

  • 工资- - - - - -工资

关闭Cassandra数据库连接

关上(康涅狄格州)

另请参阅

||||

相关的话题

外部网站