返回首页

gbase数据、南大通用产品文档:GBase8a

更新日期:2024年09月11日

使用GBase Python
本章节主要介绍如何使用GBase Python 接口创建数据库连接和操作数据库。
使用接
口类前需要使用python 语法的 from…import… 命令在python 文件头部引用接口
类。
from GBaseConnector import connect,GBaseError

使用“导入xml”功能,您可以将xml 文件数据导入到数据库中。
在“数据库导航”中,选择数据库标签下的数据库节点。该节点必须是当前连
接数据库节点。右键单击选择“导入数据库数据”,在弹出界面中点击“打开
文件”
,如下图所示

GBaseDataStudio 管理工具手册
南大通用数据技术股份有限公司
- 29 -
图5- 344 导入xml
选择文件类型xml
图5- 345 选择xml 文件

GBaseDataStudio 管理工具手册
- 30 -
南大通用数据技术股份有限公司
读取xml 文件后,
“来自文本文件的数据”tab 页显示如下内容
文件数据:从xml 文件中读取的原始数据
包围符:不填写,txt 文件导入时填写
分隔符:不填写,txt 文件导入时填写
换行符:不填写,txt 文件导入时填写
字段数:展示导入的字段数
行数:控制导入文件的行数
标题名:控制文件第一行是否是需要导入的数据
字符集:文件的字符集,选择完字符集后,需要重新点击“打开文件”
,选择文

预览:预览数据的内容
导入:开始导入按钮
“来自文本文件的数据”tab 如下面界面所示
图5- 346 来自文本文件的数据
读取xml 文件后,
“到数据库的数据”tab 页显示如下内容:
虚拟集群:选择导入的虚拟集群
数据库:选择导入的数据库
表:选择需要导入的表

GBaseDataStudio 管理工具手册
南大通用数据技术股份有限公司
- 31 -
(左边)字段:xml 文件中的字段
字段:数据库中的表字段
字段类型:自动匹配类型,不需要选择
日期格式:字段类型是Date 时,必须选择
“到数据库的数据”tab 页如下所示
图5- 347 到数据库的数据

示例中用到的表及数据:
CREATE TABLE h1(a INT, b INT, c INT) ENGINE='HIVE';
CREATE TABLE t1(a INT, b INT, c INT) ENGINE='EXPRESS';
INSERT INTO h1 VALUES(1, 2, 1), (2, 3, 2), (3, 3, 3);
INSERT INTO t1 VALUES(1, 2, 1), (2, 3, 2), (4, 3, 3);
示例1:不支持CLUSTER BY、DISTRIBUTE BY、SORT BY:
gbase> SELECT t1.b, h1.c FROM t1, h1 WHERE t1.a = h1.a CLUSTER BY h1.c;
ERROR 1105 (HY000): Only hive table supported sort by,cluster by,distribute by
示例2:不支持相关子查询:
gbase> SELECT t1.b FROM t1 WHERE EXISTS (SELECT 1 FROM h1 WHERE t1.a = h1.a);
ERROR 1149 (42000): (GBA-02SC-1001) Cross Instance Join syntax error, Cross Instance
correlated subquery isn't support yet.

注意
hive 表与其他不同引擎数据表join,需要保证hive 表数据中没有英文逗号,因为join
时内部会拉中间表,默认hive 数据以逗号分隔符load 入临时表,所以hive 数据中有英文逗号
跨引擎join 时会执行报错。