gbase数据、南大通用产品文档：gbase,数据,gbase数据,南大通用 GBase8a

同步工具全量转增量自动同步功能
同步工具全量转增量自动同步功能目前仅支持将Oracle 数据库的数据同

GBase RTSync 同步工具手册
- 32 -
南大通用数据技术股份有限公司
步到GBase 8a 集群数据库。
使用全量转增量自动同步功能需要依赖GBase 8a的orato8a 工具将Oracle
中的源数据导出到磁盘上，
然后通过GBase 8a 集群数据库的数据加载功能将全
量数据导入到GBase 8a 集群数据库中。
由于在全量同步过程中，源端业务不停，所以同时会有增量数据产生并进
入到目标库中。因此，在全量同步完成并且将全量过程中的增量同步到目标库
中后，需要清洗掉重复的数据。
注意：数据去重操作严格依赖于源表的主键，如果源表的主键列为逻辑主
键且其中有null 值，
则会导致去重操作的执行时间加长，
且执行时间无法预估。
全量转增量自动同步功能的主要处理流程为：
1.
检查kafka consumer 服务是否存在。
如果不存在则根据配置文件创建
kafka consumer；如果存在则停止kafka consumer 服务；
2.
开始进行全量同步；
3.
全量同步完成；
4.
启动kafka consumer 服务，消费Kafka 中的数据；
5.
判断全量过程中产生的增量数据是否已经全部发送到Kafka，如果是
则暂停同步工具源端；
6.
判断8a consumer 是否消费完产生的增量数据，通过查看8a 集群的
information_schema.KAFKA_CONSUMER_STATUS 信息；
7.
进行数据去重；
8.
数据去重完成后通知同步工具进行后续增量同步；
执行全量转增量的主要操作步骤如下：
1.
手动清空目标库中的数据（非必须步骤，建议操作，这样可以加快最
终去重速度）；

GBase RTSync 同步工具手册
南大通用数据技术股份有限公司
- 33 -
2.
修改kafka 配置文件，将topic.name 换成新的topic 名；
3.
启动同步工具进行增量同步；
4.
等待增量同步发送数据成功后，启动全量转增量功能；
5.
全量转增量执行完成后，验证数据正确后，手动删除临时表。

SHLIB_PATH 环境变量告诉 HP-UX 系统上的 shell 要在哪些目录中搜索动态链接库。
例如：它可与 INTERSOLV DataDirect ODBC Driver 配合使用。必须对安装该产品的目录
指定全路径名。

GBase 8s SQL 指南：参考
南大通用数据技术股份有限公司 - 194 -

pathname 指定库的搜索路径。
在 Solaris 系统上，设置 LD_LIBRARY_PATH。在 AIX® 系统上，设置 LIBPATH。

使用 DS_POOLSIZE 参数来指定在数据分布高速缓存和其他高速缓存中条目的最大数目。
数
据库服务器存储和访问列统计信息，在数据分布高速缓存中由 UPDATE
STATISTICS 语句在
MEDIUM 或 HIGH 模式下生成。
onconfig.std 值
DS_POOLSIZE 127
值
正值 127 或更大的表示高速缓存中条目初始的最大数目的一半。
最大值依赖于共享内存配
置和可用的服务器实例的共享内存。
生效
编辑 onconfig 文件并重启数据库服务器之后。
当您通过运行 onmode -wm 命令增加内存中的该值时。
当您通过运行 onmode -wm 命令重置内存中的该值时。
用法
使用 DS_HASHSIZE 和 DS_POOLSIZE 配置参数来提高在多用户环境中频繁地运行查询的性
能。
高速缓存中的最初条目数是 DS_POOLSIZE 配置参数值的两倍。
例如，
如果 DS_POOLSIZE 配
置参数设置为 127，则在高速缓存中允许 254 个条目。如果高速缓存中所有条目都满，
则高速缓存的大小自动地增长 10%。要减小高速缓存的大小，请降低 onconfig 文件中
DS_POOLSIZE 配置参数的值并重启服务器。
DS_POOLSIZE 配置参数设置在下列高速缓存中的条目数：

GBase 8s 管理员参考
南大通用数据技术股份有限公司 - 71 -

l 数据分布高速缓存
l 扩展类型名称高速缓存
l 扩展类型 ID 高速缓存
l GBase_85 cast 高速缓存
l 运算符类实例高速缓存
l 例程解析高速缓存
l 合计高速缓存
l 辅助瞬态高速缓存

gbase数据、南大通用产品文档：GBase8a