返回首页

gbase数据、南大通用产品文档:GBase8a

更新日期:2024年09月11日

同步工具全量转增量自动同步功能
同步工具全量转增量自动同步功能目前仅支持将Oracle 数据库的数据同

GBase RTSync 同步工具手册
- 32 -
南大通用数据技术股份有限公司
步到GBase 8a 集群数据库。
使用全量转增量自动同步功能需要依赖GBase 8a的orato8a 工具将Oracle
中的源数据导出到磁盘上,
然后通过GBase 8a 集群数据库的数据加载功能将全
量数据导入到GBase 8a 集群数据库中。
由于在全量同步过程中,源端业务不停,所以同时会有增量数据产生并进
入到目标库中。因此,在全量同步完成并且将全量过程中的增量同步到目标库
中后,需要清洗掉重复的数据。
注意:数据去重操作严格依赖于源表的主键,如果源表的主键列为逻辑主
键且其中有null 值,
则会导致去重操作的执行时间加长,
且执行时间无法预估。
全量转增量自动同步功能的主要处理流程为:
1.
检查kafka consumer 服务是否存在。
如果不存在则根据配置文件创建
kafka consumer;如果存在则停止kafka consumer 服务;
2.
开始进行全量同步;
3.
全量同步完成;
4.
启动kafka consumer 服务,消费Kafka 中的数据;
5.
判断全量过程中产生的增量数据是否已经全部发送到Kafka,如果是
则暂停同步工具源端;
6.
判断8a consumer 是否消费完产生的增量数据,通过查看8a 集群的
information_schema.KAFKA_CONSUMER_STATUS 信息;
7.
进行数据去重;
8.
数据去重完成后通知同步工具进行后续增量同步;
执行全量转增量的主要操作步骤如下:
1.
手动清空目标库中的数据(非必须步骤,建议操作,这样可以加快最
终去重速度);

GBase RTSync 同步工具手册
南大通用数据技术股份有限公司
- 33 -
2.
修改kafka 配置文件,将topic.name 换成新的topic 名;
3.
启动同步工具进行增量同步;
4.
等待增量同步发送数据成功后,启动全量转增量功能;
5.
全量转增量执行完成后,验证数据正确后,手动删除临时表。

gcluster_rebalancing_concurrent_count
含义:允许的并发执行rebalance 的表的个数
GLOBAL 参数: Y
SESSION 参数:N
默认值:5
最小值:0
最大值:无
gcluster_rebalancing_random_table_quick_mode
含义:对随机分布表执行rebalance 操作时使用快速模式
GLOBAL 参数: Y
SESSION 参数:N
默认值:1
最小值:0
最大值:1
gcluster_rebalancing_step
含义:指定rebalance 操作时每一批重分布数据条数。值为0 时,rebalance 操作不
分批。
gcluster_rebalancing_step 参数值事实上是原表的每个分片每一批向中间表重分布的
数据行数。gcluster_rebalancing_step 值越大,从原表向中间表重分布数据的速度越
快。
gcluster_rebalancing_step 值越大,
rebalance 过程中暂停时等待的时间上就越长。

如果rebalance 过程中基本不需要暂停任务,
那么可以设置gcluster_rebalancing_step
为较大的值。如果rebalance 过程中需要多次暂停任务,那么可以设置
gcluster_rebalancing_step 为较小值。
gcluster_rebalancing_step 预期方法:原表单个分片的行数 / 预计分批数。
GLOBAL 参数: Y
SESSION 参数:N
默认值:10000000

GBase UP 产品手册 4 管理员指南

文档版本04(2021-04-21) 南大通用数据技术股份有限公司 133
最小值:0
最大值:无

使用 STOP_APPLY 配置参数来停止 RS 辅助服务器应用从主服务器收到的日志文件。
onconfig.std 值
STOP_APPLY 0
缺省值
0

0 = 应用日志
1 = 立即停止应用日志
"YYYY:MM:DD-hh:mm:ss" = 在指定的时间停止日志应用,此处:

GBase 8s 管理员参考
南大通用数据技术股份有限公司 - 159 -
 YYYY = 年
 MM = 月
 DD = 日
 hh = 时
 mm = 分
 ss = 秒
生效
编辑 onconfig 文件并重启数据库服务器之后。
当您通过运行 onmode -wf 命令在 onconfig 文件中动态地重置该值时。
当您通过运行 onmode -wm 命令重置内存中的该值时。
参考
GBase 8s 管理员指南 中的 RS 辅助服务器灾难恢复的延迟
用法
停止日志文件的应用允许您通过从 RS 辅助服务器恢复数据快速地从错误的数据库修改恢
复。您可配置服务器或立即或在指定的时间点停止日志的应用。当设置 STOP_APPLY 值时,
您还必须设置 LOG_STAGING_DIR。
如果配置 STOP_APPLY 而未将 LOG_STAGING_DIR 设置为
一个有效且安全的目录,则不可初始化服务器。
日志文件以二进制格式存储在 LOG_STAGING_DIR 配置参数指定的目录中。
您必须为日志文
件指定一个有效和安全的位置。
要查看关于发送到为 RS 辅助服务器设置的日志 GBase_8s staging 目录的数据信息,请
在 RS 辅助服务器上运行 onstat -g rss verbose 命令。
如果向 staging 文件写失败,则 RS 辅助服务器发起事件报警 40007。
假定为 STOP_APPLY 配置参数指定的时间值与 RS 辅助服务器在同一个时区中。
dbexport 实用程序不可支持在可更新的辅助服务器上的写操作,
除非设置 STOP_APPLY 参
数。(除 STOP_APPLY之外,UPDATABLE_SECONDARY 和 USELASTCOMMITTED 配置参数还必须
通过在辅助数据复制服务器上的 dbexport 设置为启用写操作。)
如果远程独立辅助(RSS)服务器将其 STOP_APPLY 配置参数设置为一个非零的值,则那台
服务器不可使用群组事务协调。