返回首页

gbase数据、南大通用产品文档:GBase8sCDC记录序列号

更新日期:2024年09月11日

返回给客户端的大多数更改数据捕获(CDC)记录都包含序列号。

GBase 8s数据库安装手册
南大通用数据技术股份有限公司
6
与CDC 记录关联的序列号是BIGINT 数据类型。
CDC 记录序列号不一定与正在捕获的GBase 8s 逻辑日志的LSN 相同。
您可以比较为同一事务返回的CDC 记录的序列号。
在一个事务中,
CDC 记录
返回的序列号随着时间的推移而增加。较低的序列号表示CDC 记录比序列号较
高的CDC 记录更早返回。
您可以比较不同事务的CDC_REC_BEGINTX 记录的序号或CDC_REC_COMMTX
记录的序号。每个提交的事务都有一个CDC_REC_BEGINTX 记录和一个
CDC_RECC_COMMTX 记录。CDC_REC_BEGINTX 和CDC_ REC_ COMMTX 记录的序列
号按单调顺序排列。较低的序列号表示关联的事务比与较高序列号关联的事务
更早开始或提交。

设置分词类型
自然分词就是按照文本的类型分词,通过空格和标点符号自然分开。
对应配置项参数如下:(0:自然分词;1:数字多元分词;2:英文多元分词;3:
数字和英文多元分词;......):0
示例
原文本:
研发人员变更代码行数共112314 行,
其中resovled,
closed 状态的BUG 有53
个。
示例1:中文依照单字拆分。
研/发/人/员/变/更/代/码/行/数/共/112314/行/其/中/resovled/closed/状/态/的
/BUG/有/53/个
示例2:多元分词,如三元分词主要针对英文和数字,将3 个相连的字符当作一
个词元(term)。
研/发/人/员/变/更/代/码/行/数/共/112/123/231/314/行/其/中
/res/eso/sov/ovl/vle/led/clo/los/ose/sed/状/态/的/BUG/有/53/个

右边的三位存储在另外 2 个字节上,如图 1所示。
(未显示指数字节。)由于指数和符号需要额外字节,所以 DECIMAL(6,3) 总共需要
5 个字节的存储空间。 图 3. 说明 Decimal (p,s) 值中数位存储的示意图


可使用以下公式(下舍入为整数字节数)来计算 DECIMAL(p,s) 数据类型的字节存储
(N)(其中 N 包括存储指数和符号所需的字节):
如果小数位为奇数:N = (精度 + 4) / 2
如果小数位为偶数:N = (精度 + 3) / 2
例如,数据类型 DECIMAL(5,3) 需要 4 个字节的存储空间(9/2 下舍入等于 4)。
使用这些公式时要注意一点。数据库服务器用来存储小数值的最大字节数是 17。一

GBase 8s SQL 指南:参考
南大通用数据技术股份有限公司 - 97 -
个字节用来存储指数和符号,其余的 16 个字节用来存储最多 32 位精度。但是,如果指
定精度 32 和奇数小数位,那么会丢失 1 位精度。例如,考虑数据类型
DECIMAL(32,31)。将此小数定义为小数点左边 1 位,小数点右边 31 位。小数点左边的
1 位需要 1 个字节的存储器。这使得只留下 15 个字节的存储器给小数点右边的位。15
个字节只能容纳 30 位,因此丢失 1 位精度。