gbase数据、南大通用产品文档：gbase,数据,gbase数据,南大通用 GBase8a

使用GBase Python
本章节主要介绍如何使用GBase Python 接口创建数据库连接和操作数据库。
使用接
口类前需要使用python 语法的 from…import… 命令在python 文件头部引用接口
类。
from GBaseConnector import connect,GBaseError

使用“导入xml”功能，您可以将xml 文件数据导入到数据库中。
在“数据库导航”中，选择数据库标签下的数据库节点。该节点必须是当前连
接数据库节点。右键单击选择“导入数据库数据”,在弹出界面中点击“打开
文件”
，如下图所示

GBaseDataStudio 管理工具手册
南大通用数据技术股份有限公司
- 29 -
图5- 344 导入xml
选择文件类型xml
图5- 345 选择xml 文件

GBaseDataStudio 管理工具手册
- 30 -
南大通用数据技术股份有限公司
读取xml 文件后，
“来自文本文件的数据”tab 页显示如下内容
文件数据：从xml 文件中读取的原始数据
包围符：不填写，txt 文件导入时填写
分隔符：不填写，txt 文件导入时填写
换行符：不填写，txt 文件导入时填写
字段数：展示导入的字段数
行数：控制导入文件的行数
标题名：控制文件第一行是否是需要导入的数据
字符集：文件的字符集，选择完字符集后，需要重新点击“打开文件”
，选择文
件
预览：预览数据的内容
导入：开始导入按钮
“来自文本文件的数据”tab 如下面界面所示
图5- 346 来自文本文件的数据
读取xml 文件后，
“到数据库的数据”tab 页显示如下内容：
虚拟集群：选择导入的虚拟集群
数据库：选择导入的数据库
表：选择需要导入的表

GBaseDataStudio 管理工具手册
南大通用数据技术股份有限公司
- 31 -
（左边）字段：xml 文件中的字段
字段：数据库中的表字段
字段类型：自动匹配类型，不需要选择
日期格式：字段类型是Date 时，必须选择
“到数据库的数据”tab 页如下所示
图5- 347 到数据库的数据

示例中用到的表及数据：
CREATE TABLE h1(a INT, b INT, c INT) ENGINE='HIVE';
CREATE TABLE t1(a INT, b INT, c INT) ENGINE='EXPRESS';
INSERT INTO h1 VALUES(1, 2, 1), (2, 3, 2), (3, 3, 3);
INSERT INTO t1 VALUES(1, 2, 1), (2, 3, 2), (4, 3, 3);
示例1：不支持CLUSTER BY、DISTRIBUTE BY、SORT BY：
gbase> SELECT t1.b, h1.c FROM t1, h1 WHERE t1.a = h1.a CLUSTER BY h1.c;
ERROR 1105 (HY000): Only hive table supported sort by,cluster by,distribute by
示例2：不支持相关子查询：
gbase> SELECT t1.b FROM t1 WHERE EXISTS (SELECT 1 FROM h1 WHERE t1.a = h1.a);
ERROR 1149 (42000): (GBA-02SC-1001) Cross Instance Join syntax error, Cross Instance
correlated subquery isn't support yet.

注意
hive 表与其他不同引擎数据表join，需要保证hive 表数据中没有英文逗号，因为join
时内部会拉中间表，默认hive 数据以逗号分隔符load 入临时表，所以hive 数据中有英文逗号
跨引擎join 时会执行报错。

gbase数据、南大通用产品文档：GBase8a