返回首页

gbase数据、南大通用产品文档:GBase8a安装后检查

更新日期:2024年09月11日

操作场景
集群安装完成后,管理员可以通过gcadmin 查看集群的运行状态。
前提条件
gcadmin 命令在管理员用户(即安装时指定的dbaUser)下进行操作。
操作步骤
步骤1
在管理员用户下执行gcadmin 命令,
查看集群各节点状态是否正常。
显示内容如下:
$ gcadmin
CLUSTER STATE:
ACTIVE
======================================
|
GBASE GCWARE CLUSTER INFORMATION
|
======================================
| NodeName |
IpAddress
| gcware |

GBase 8a MPP Cluster 产品手册
3 集群安装升级与卸载
文档版本953(2022-09-15)
南大通用数据技术股份有限公司
85
--------------------------------------
| gcware1
| 192.168.146.20 |
OPEN
|
--------------------------------------
| gcware2
| 192.168.146.21 |
OPEN
|
--------------------------------------
| gcware3
| 192.168.146.22 |
OPEN
|
--------------------------------------
========================================================
|
GBASE COORDINATOR CLUSTER INFORMATION
|
========================================================
|
NodeName
|
IpAddress
| gcluster | DataState |
--------------------------------------------------------
| coordinator1 | 192.168.146.20 |
OPEN
|
0
|
--------------------------------------------------------
| coordinator2 | 192.168.146.21 |
OPEN
|
0
|
--------------------------------------------------------
| coordinator3 | 192.168.146.22 |
OPEN
|
0
|
--------------------------------------------------------
=============================================
|
GBASE VIRTUAL CLUSTER INFORMATION
|
=============================================
|
VcName
| DistributionId |
comment
|
---------------------------------------------
|
vc1
|
1
| comment
|
---------------------------------------------
|
vc2
|
2
| comment
|
---------------------------------------------
2 virtual cluster: vc1, vc2
3 coordinator node
0 free data node
$ gcadmin showcluster vc vc1
CLUSTER STATE:
ACTIVE
VIRTUAL CLUSTER MODE:
NORMAL
=========================================
|
GBASE VIRTUAL CLUSTER INFORMATION
|
=========================================
| VcName | DistributionId |
comment
|
-----------------------------------------
|
vc1
|
1
| vc1comments |
-----------------------------------------
===========================================================
=======

GBase 8a MPP Cluster 产品手册
3 集群安装升级与卸载
文档版本953(2022-09-15)
南大通用数据技术股份有限公司
86
|
VIRTUAL CLUSTER DATA NODE INFORMATION
|
===========================================================
=======
|NodeName|
IpAddress
|DistributionId|gnode|syncserver|DataState|
------------------------------------------------------------------
| node1
|192.168.146.20|
1
|OPEN |
OPEN
|
0
|
------------------------------------------------------------------
| node2
|172.168.146.40|
1
|OPEN |
OPEN
|
0
|
------------------------------------------------------------------
| node1
|192.168.146.21|
1
|OPEN |
OPEN
|
0
|
------------------------------------------------------------------
| node2
|172.168.146.41|
1
|OPEN |
OPEN
|
0
|
------------------------------------------------------------------
4 data node
$ gcadmin showcluster vc vc2
CLUSTER STATE:
ACTIVE
VIRTUAL CLUSTER MODE:
NORMAL
=========================================
|
GBASE VIRTUAL CLUSTER INFORMATION
|
=========================================
| VcName |DistributionId |
comment
|
-----------------------------------------
|
vc2
|
2
| vc2comments
|
-----------------------------------------
===========================================================
=======
|
VIRTUAL CLUSTER DATA NODE INFORMATION
|
===========================================================
=======
|NodeName|
IpAddress
|DistributionId|gnode|syncserver|DataState|
------------------------------------------------------------------
| node1
|192.168.146.22|
1
|OPEN |
OPEN
|
0
|
------------------------------------------------------------------
| node2
|172.168.146.42|
1
|OPEN |
OPEN
|
0
|
------------------------------------------------------------------
| node1
|192.168.146.23|
1
|OPEN |
OPEN
|
0
|
------------------------------------------------------------------
| node2
|172.168.146.43|
1
|OPEN |
OPEN
|
0
|
------------------------------------------------------------------
4 data node
步骤2
查看集群数据分片分布相关信息。显示内容如下:

GBase 8a MPP Cluster 产品手册
3 集群安装升级与卸载
文档版本953(2022-09-15)
南大通用数据技术股份有限公司
87
$gcadmin showdistribution vc vc1
Distribution ID: 1 | State: new | Total segment num: 4
Primary Segment Node IP
Segment ID
Duplicate Segment node IP
===========================================================
=======
|

GBase 8a MPP Cluster 提供动态数据脱敏的新特性,使得开发人员或者数
据库管理员能够控制敏感数据的暴露程度,并且在数据库层面生成数据,大大

GBase 8a MPP Cluster 技术白皮书


- 24 -

南大通用数据技术股份有限公司
简化了数据库应用层的安全设计和编码。
按权限及字段属性
用户可以通过sql 语法的形式,
给需要进行数据脱敏的字段添加脱敏属性,
通过用户权限控制,决定是否对有查询要求的用户暴露原始数据。
内置规则
动态数据脱敏并不会真正改动表中存储的实际数据,只是在查询的时候应
用该特性控制查询返回的数据,动态数据脱敏支持四种数据脱敏函数,包括默
认脱敏default、随机脱敏random、自定义脱敏partial、哈希脱敏SHA 和指
定符号为起始位置脱敏keymask。
动态数据脱敏是否启用受当前用户权限影响,
拥有unmask 权限的用户不受脱敏规则影响可以访问实际数据,没有unmask 权
限的用户受脱敏规则影响只能访问到脱敏后的数据。脱敏只对投影列有效。
全文检索
GBase 8a MPP Cluster 数据库支持全文检索,由于默认采用全单字索引方
式,
支持几乎所有的语种,
并且可以保证100%的查询召回率。
结合GBase
8a
MPP
Cluster 独特的列存储,压缩和智能索引技术,适合面向海量数据的检索查询
应用。
支持对外部存储文档建立全文索引并提供检索,支持的文档格式如txt、
doc、XML、HTML、PDF、xls 等。
主要功能包括:
1.
建立索引与搜索

在GBase 8a MPP Cluster 中内嵌全文检索引擎,支持表中所有文本类
型字段的索引与查询。

支持参数化管理,索引建立、分词、索引维护、搜索等过程均可以通
过GBase 8a MPP Cluster 的标准配置文件进行方便的配置。



GBase 8a MPP Cluster 技术白皮书
南大通用数据技术股份有限公司

- 25 -

在GBase 8a MPP Cluster 中内嵌文本分词器功能,以实现对文本列、
搜索串的单字切分,并能保证两者的切分规则、切分结果的一致性,
防止由上下文语境导致的切分不一致。

支持全文索引同步查询,在创建索引过程中可实现查询功能。新追加
数据可分批创建索引,当索引数据缓冲区中数据处理完成到索引文件
后,用户可立即搜索到这些已创建索引的新内容,而不是等所有新数
据都建好索引之后才能查询。

支持数据库表中已建立全文索引列的词句逻辑表达式查询(AND、
OR、NOT)、NEAR 查询,并支持与非全文索引字段之间的逻辑组合
查询。
2.
支持DML

支持数据库表中字符数据类型列已建立全文索引的在线删除。

支持列数据Update 后全文索引的同步更新。
3.
支持DDL

支持数据库表在建立全文索引列被删除后,索引的自动失效。

支持数据库表重新命名后,索引不失效。
库内挖掘
GBMLLib 是GBase 8a MPP Cluster 的数据挖掘和机器学习扩展库,
以插件的
形式添加到GBase 8a MPP Cluster 中。通过其提供的机器学习算法,GBase 8a
MPP Cluster 可以对用户数据进行深层次的分析和挖掘,
将用户数据转化为用户
价值。
GBMLLib 提供了基于SQL 的机器学习算法,
目前包括的算法有:
回归算法(线
性回归)、分类算法(Logistic 回归、支持向量机)和聚类算法(K-Means)。同时
也提供了一些数组操作和线性代数计算的基本函数。
GBMLLib 具备以下技术特征:

GBase 8a MPP Cluster 技术白皮书


- 26 -

南大通用数据技术股份有限公司

SQL 接口:
GBMLLib 提供了SQL 方式的数据挖掘算法,
模型的训练、
评估和预测都通过SQL 语句来执行,使得数据分析师非常容易掌握,
并与其现有技能结合,充分发挥其创造力、提高工作效率;

In-database 分析:不同于其他分析工具需要通过api 或odbc 把数据从
数据库搬移到分析节点进行处理的方式,GBMLLib 的分析算法以数
据库udf/udaf 的形式运行在GBase 8a MPP Cluster 的线程内部,通过
GBase 8a MPP Cluster 的执行计划进行调度,
最大程度的减少数据的搬
移、提升运行速度;

方便扩展:GBMLLib 以插件的形式添加到GBase 8a MPP Cluster 中,
并采用弹性灵活的软件架构,方便后续添加新的数据挖掘和机器学习
算法。



GBase 8a MPP Cluster 技术白皮书
南大通用数据技术股份有限公司

- 27 -
5 GBase
8a
MPP Cluster 运行环境和技术
指标
硬件环境
支持如下的硬件环境:
1) 支持服务器平台:x86_64 的标准PC 服务器、PowerLinux 服务器、浪
潮K1、华为泰山、中科曙光海光等;
2) 支持存储:本地存储(SATA、SAS、SSD 等)、阵列存储(SAN、NAS)、
SSD、Flash 卡;
3) 支持网络环境:千兆、万兆、InfiniBand。
操作系统和平台
支持如下的操作系统和平台:
1) 支持的CPU:Intel、AMD、申威、龙芯3B、飞腾、X86、Power、鲲鹏、
海光等;
2) 支持的操作系统:CentOS、Red Hat、SUSE、中标麒麟、PowerLinux、
深度、银河麒麟、凝思、中科方德、普华等64 位操作系统;
3) 支持基于x86 及Power 的虚拟机,如VMware
ESX 及KVM、OpenStack、
docker 等虚拟化技术。
与第三方软件平台的接口
兼容主流应用软件,包括:
1) BI 工具:MSTR、Cognos、R3 Query、SAS、SPSS 等;
2) ETL 工具:Datastage、Kettle、Informatica 等;

GBase 8a MPP Cluster 技术白皮书


- 28 -

南大通用数据技术股份有限公司
3) 中间件:WebSphere、Tuexdo、Hibernate、Weblogic、Tomcat 等。
技术指标
技术指标
描 述
单节点数据处理能力

100TB
数字精度
65
表的个数
受文件系统限制
Ext3 文件系统单个数据库中上限65535;其他
文件系统无限制。
每个表中列的个数
2000
每个表中行的个数
140737488355328
表中一行的内部长度
65534000 字节
一个INTEGER 类型列的长度
4 字节
日期类型列中表示年的位数
4 位
用户名包含字符的个数
16 字符
CHAR 类型列的长度
255 字符
BLOB 列的长度
32K 字节
VARCHAR 类型列长度
随字符集而不同,UTF8MB4、GB18030 是8192,
GBK、UTF-8 为10922 字符
行存列的长度
32KB
虚拟集群名长度
255
虚拟集群个数
64
数据库名长度
48 字符
表名长度
56 字符
列名长度
64 字符
索引名长度
64 字符
别名长度
255 字符
编码格式
UTF-8、UTF8MB4、GBK 、GB18030



GBase 8a MPP Cluster 技术白皮书
南大通用数据技术股份有限公司

- 29 -
6 GBase 8a MPP Cluster 管理工具
GBase
8a
MPP
Cluster 提供了GBaseDataStudio、集群监控工具、gcadmin
命令行工具、DB-Link 及透明网关等工具,可以对数据库的各项功能进行集中
式统一管理,对系统运行状态、资源占用、任务执行情况进行监控,实现数据
快速加载及集群间数据高效访问等多项功能。
客户端工具

使用 UDT Manager,可以从实现 SQLData 接口的现有 Java™ 类创建 Java 不透明类型。
UDT Manager 还可以帮助您在不需要准备 Java 类的情况下,创建 Java 不透明类型,可
以指定要创建的不透明类型的特征, UDT Manager 工具创建 Java 类然后创建 Java 不透
明类型。
按照本节中的步骤使用 UDTManager 类。
从现有 Java 类创建不透明类型
从现有 Java™ 类创建不透明类型:
1.
确保类符合转换为不透明类型的要求。
有关要求,请参阅Java 类的要求。
2. 如果您不想使用服务器提供的缺省输入和输出例程,
请编写支持的 UDR 以进行输
入和输出。
有关编写支持的 UDR 的一般信息,请参阅 GBase 8s 用户定义的例程和数据类型
开发者指南 。
3. 在数据库服务器上创建一个缺省 sbspace 来保存包含不透明类型代码的 JAR 文件。

有关创建 sbspace 的信息,请参阅您的数据库服务器的《GBase 8s 管理员指南》
和 J/Foundation 开发者指南。
4. 打开一个 JDBC 连接。
确保数据库对象与连接对象相关联。没有数据库对象,驱动程序就无法创建不透明
类型。有关创建具有数据库对象的连接的详细信息,请参阅连接至数据库。

GBase 8s JDBC Driver 程序员指南
南大通用数据技术股份有限公司
- 171 -

5. 安装 UDTManager 对象和 UDTMetaData 对象:
UDTManager udtmgr = new UDTManager(connection);
UDTMetaData mdata = new UDTMetaData();
6. 通过调用 UDTMetaData 对象中的方法设置不透明类型的属性。
至少,您必须指定 SQL 名称、UDT 长度和 JAR 文件 SQL 名称。有关 SQL 名
称的解释,请参阅 SQL 名称。
还可以指定对齐方式、隐式和显式强制转换以及任何支持的 UDR:
mdata.setSQLName("circle2");
mdata.setLength(24);
mdata.setAlignment(UDTMetaData.EIGHT_BYTE)
mdata.setJarFileSQLName("circle2_jar");
mdata.setUDR(areamethod, "area");
mdata.setSupportUDR(input, "input", UDTMetaData.INPUT)
mdata.setSupportUDR(output, "output",UDTMetaData.OUTPUT)
mdata.SetImplicitCast(com.gbasedbt.lang.IfxTypes.IFX_TYPE_
LVARCHAR, "input");
mdata.SetExplicitCast(com.gbasedbt.lang.IfxTypes.IFX_TYPE_
LVARCHAR, "output");
7. 如果需要,请指定驱动程序应将 JAR 文件放在数据库服务器文件系统中的路径名
称:
String pathname =
"/work/srv93/examples";udtmgr.setJarFileTmpPath(pathname);

请确保服务器文件系统中存在此路径。有关更多信息,请参阅指定 JAR 文件临时
路径。
8. 创建不透明类型:
udtmgr.createUDT(mdata, "Circle2.jar", "Circle2", 0);
有关从现有代码创建不透明类型的其它信息,请参阅从现有代码创建不透明类型。
有关使用上述步骤创建不透明类型的完整代码示例,请参阅使用 UDTManager 从现有的
Java 类创建不透明类型。
创建不透明类型,无需现有 Java 类
无需现有 Java™ 类创建不透明类型:
1. 在数据库服务器上创建一个缺省 sbspace 来保存包含不透明类型代码的 JAR 文件。


GBase 8s JDBC Driver 程序员指南
南大通用数据技术股份有限公司
- 172 -

有关创建 sbspace 的信息,请参阅您的数据库服务器的《GBase 8s 管理员指南》
和 J/Foundation 开发者指南。
2. 打开一个 JDBC 连接。
确保数据库对象与连接对象相关联。有关创建具有数据库对象的连接的详细信息,
请参阅连接至数据库。
3. 安装 UDTManager 对象和 UDTMetaData 对象:
UDTManager udtmgr = new UDTManager(connection);
UDTMetaData mdata = new UDTMetaData();
4. 通过调用 UDTMetaData 对象中的方法设置不透明类型的属性:
mdata.setSQLName("acircle");
mdata.setLength(24);
mdata.setFieldCount(3);
mdata.setFieldName(1, "x");
mdata.setFieldName(2, "y");
mdata.setFieldName(3, "radius");
mdata.setFieldType
(1,com.gbasedbt.lang.IfxTypes.IFX_TYPE_INT);
mdata.setFieldType
(2,com.gbasedbt.lang.IfxTypes.IFX_TYPE_INT);
mdata.setFieldType
(3,com.gbasedbt.lang.IfxTypes.IFX_TYPE_INT);
mdata.setJarFileSQLName("ACircleJar");
有关不透明类型的设置属性的更多信息,请参 指定不透明类型的属性。
5. 创建 Java 文件、类文件和 JAR 文件:
mdata.keepJavaFile(true);
String classname = udtmgr.createUDTClass(mdata);
String jarfilename = udtmgr.createJar(mdata, new String[] {classname
+ .class"});
有关更多信息,请参阅创建 JAR 和类文件。
6. 如果需要,请指定驱动程序应将 JAR 文件放在数据库服务器文件系统中的路径名
称:
String pathname =
"/work/srv93/examples";udtmgr.setJarFileTmpPath(pathname);
请确保此路径在服务器文件系统中存在。有关更多信息,请参阅指定 JAR 文件临
时路径。

GBase 8s JDBC Driver 程序员指南
南大通用数据技术股份有限公司
- 173 -

7. 将类定义发送到数据库服务器:
udtmgr.createUDT(mdata, jarfilename, classname, 0);
有关更多信息,请参阅将类定义发送到数据库服务器。
有关使用上述步骤创建不透明类型的完整代码示例,
请参阅不需现有的 Java 类创建不透明
类型。