gbase数据、南大通用产品文档：gbase,数据,gbase数据,南大通用 GBase8a

同步工具全量转增量自动同步功能
同步工具全量转增量自动同步功能目前仅支持将Oracle 数据库的数据同

GBase RTSync 同步工具手册
- 32 -
南大通用数据技术股份有限公司
步到GBase 8a 集群数据库。
使用全量转增量自动同步功能需要依赖GBase 8a的orato8a 工具将Oracle
中的源数据导出到磁盘上，
然后通过GBase 8a 集群数据库的数据加载功能将全
量数据导入到GBase 8a 集群数据库中。
由于在全量同步过程中，源端业务不停，所以同时会有增量数据产生并进
入到目标库中。因此，在全量同步完成并且将全量过程中的增量同步到目标库
中后，需要清洗掉重复的数据。
注意：数据去重操作严格依赖于源表的主键，如果源表的主键列为逻辑主
键且其中有null 值，
则会导致去重操作的执行时间加长，
且执行时间无法预估。
全量转增量自动同步功能的主要处理流程为：
1.
检查kafka consumer 服务是否存在。
如果不存在则根据配置文件创建
kafka consumer；如果存在则停止kafka consumer 服务；
2.
开始进行全量同步；
3.
全量同步完成；
4.
启动kafka consumer 服务，消费Kafka 中的数据；
5.
判断全量过程中产生的增量数据是否已经全部发送到Kafka，如果是
则暂停同步工具源端；
6.
判断8a consumer 是否消费完产生的增量数据，通过查看8a 集群的
information_schema.KAFKA_CONSUMER_STATUS 信息；
7.
进行数据去重；
8.
数据去重完成后通知同步工具进行后续增量同步；
执行全量转增量的主要操作步骤如下：
1.
手动清空目标库中的数据（非必须步骤，建议操作，这样可以加快最
终去重速度）；

GBase RTSync 同步工具手册
南大通用数据技术股份有限公司
- 33 -
2.
修改kafka 配置文件，将topic.name 换成新的topic 名；
3.
启动同步工具进行增量同步；
4.
等待增量同步发送数据成功后，启动全量转增量功能；
5.
全量转增量执行完成后，验证数据正确后，手动删除临时表。

gcluster_rebalancing_concurrent_count
含义：允许的并发执行rebalance 的表的个数
GLOBAL 参数： Y
SESSION 参数：N
默认值：5
最小值：0
最大值：无
gcluster_rebalancing_random_table_quick_mode
含义：对随机分布表执行rebalance 操作时使用快速模式
GLOBAL 参数： Y
SESSION 参数：N
默认值：1
最小值：0
最大值：1
gcluster_rebalancing_step
含义：指定rebalance 操作时每一批重分布数据条数。值为0 时，rebalance 操作不
分批。
gcluster_rebalancing_step 参数值事实上是原表的每个分片每一批向中间表重分布的
数据行数。gcluster_rebalancing_step 值越大，从原表向中间表重分布数据的速度越
快。
gcluster_rebalancing_step 值越大，
rebalance 过程中暂停时等待的时间上就越长。

如果rebalance 过程中基本不需要暂停任务，
那么可以设置gcluster_rebalancing_step
为较大的值。如果rebalance 过程中需要多次暂停任务，那么可以设置
gcluster_rebalancing_step 为较小值。
gcluster_rebalancing_step 预期方法：原表单个分片的行数 / 预计分批数。
GLOBAL 参数： Y
SESSION 参数：N
默认值：10000000

GBase UP 产品手册 4 管理员指南

文档版本04（2021-04-21）南大通用数据技术股份有限公司 133
最小值：0
最大值：无

使用 STOP_APPLY 配置参数来停止 RS 辅助服务器应用从主服务器收到的日志文件。
onconfig.std 值
STOP_APPLY 0
缺省值
0
值
0 = 应用日志
1 = 立即停止应用日志
"YYYY:MM:DD-hh:mm:ss" = 在指定的时间停止日志应用，此处：

GBase 8s 管理员参考
南大通用数据技术股份有限公司 - 159 -
 YYYY = 年
 MM = 月
 DD = 日
 hh = 时
 mm = 分
 ss = 秒
生效
编辑 onconfig 文件并重启数据库服务器之后。
当您通过运行 onmode -wf 命令在 onconfig 文件中动态地重置该值时。
当您通过运行 onmode -wm 命令重置内存中的该值时。
参考
GBase 8s 管理员指南中的 RS 辅助服务器灾难恢复的延迟
用法
停止日志文件的应用允许您通过从 RS 辅助服务器恢复数据快速地从错误的数据库修改恢
复。您可配置服务器或立即或在指定的时间点停止日志的应用。当设置 STOP_APPLY 值时，
您还必须设置 LOG_STAGING_DIR。
如果配置 STOP_APPLY 而未将 LOG_STAGING_DIR 设置为
一个有效且安全的目录，则不可初始化服务器。
日志文件以二进制格式存储在 LOG_STAGING_DIR 配置参数指定的目录中。
您必须为日志文
件指定一个有效和安全的位置。
要查看关于发送到为 RS 辅助服务器设置的日志 GBase_8s staging 目录的数据信息，请
在 RS 辅助服务器上运行 onstat -g rss verbose 命令。
如果向 staging 文件写失败，则 RS 辅助服务器发起事件报警 40007。
假定为 STOP_APPLY 配置参数指定的时间值与 RS 辅助服务器在同一个时区中。
dbexport 实用程序不可支持在可更新的辅助服务器上的写操作，
除非设置 STOP_APPLY 参
数。（除 STOP_APPLY之外，UPDATABLE_SECONDARY 和 USELASTCOMMITTED 配置参数还必须
通过在辅助数据复制服务器上的 dbexport 设置为启用写操作。）
如果远程独立辅助（RSS）服务器将其 STOP_APPLY 配置参数设置为一个非零的值，则那台
服务器不可使用群组事务协调。

gbase数据、南大通用产品文档：GBase8a