返回首页

gbase数据、南大通用产品文档:GBase8a

更新日期:2024年09月11日

同步工具全量转增量自动同步功能
同步工具全量转增量自动同步功能目前仅支持将Oracle 数据库的数据同

GBase RTSync 同步工具手册
- 32 -
南大通用数据技术股份有限公司
步到GBase 8a 集群数据库。
使用全量转增量自动同步功能需要依赖GBase 8a的orato8a 工具将Oracle
中的源数据导出到磁盘上,
然后通过GBase 8a 集群数据库的数据加载功能将全
量数据导入到GBase 8a 集群数据库中。
由于在全量同步过程中,源端业务不停,所以同时会有增量数据产生并进
入到目标库中。因此,在全量同步完成并且将全量过程中的增量同步到目标库
中后,需要清洗掉重复的数据。
注意:数据去重操作严格依赖于源表的主键,如果源表的主键列为逻辑主
键且其中有null 值,
则会导致去重操作的执行时间加长,
且执行时间无法预估。
全量转增量自动同步功能的主要处理流程为:
1.
检查kafka consumer 服务是否存在。
如果不存在则根据配置文件创建
kafka consumer;如果存在则停止kafka consumer 服务;
2.
开始进行全量同步;
3.
全量同步完成;
4.
启动kafka consumer 服务,消费Kafka 中的数据;
5.
判断全量过程中产生的增量数据是否已经全部发送到Kafka,如果是
则暂停同步工具源端;
6.
判断8a consumer 是否消费完产生的增量数据,通过查看8a 集群的
information_schema.KAFKA_CONSUMER_STATUS 信息;
7.
进行数据去重;
8.
数据去重完成后通知同步工具进行后续增量同步;
执行全量转增量的主要操作步骤如下:
1.
手动清空目标库中的数据(非必须步骤,建议操作,这样可以加快最
终去重速度);

GBase RTSync 同步工具手册
南大通用数据技术股份有限公司
- 33 -
2.
修改kafka 配置文件,将topic.name 换成新的topic 名;
3.
启动同步工具进行增量同步;
4.
等待增量同步发送数据成功后,启动全量转增量功能;
5.
全量转增量执行完成后,验证数据正确后,手动删除临时表。

SHLIB_PATH 环境变量告诉 HP-UX 系统上的 shell 要在哪些目录中搜索动态链接库。
例如:它可与 INTERSOLV DataDirect ODBC Driver 配合使用。必须对安装该产品的目录
指定全路径名。

GBase 8s SQL 指南:参考
南大通用数据技术股份有限公司 - 194 -


pathname 指定库的搜索路径。
在 Solaris 系统上,设置 LD_LIBRARY_PATH。在 AIX® 系统上,设置 LIBPATH。

使用 DS_POOLSIZE 参数来指定在数据分布高速缓存和其他高速缓存中条目的最大数目。

据库服务器存储和访问列统计信息,在数据分布高速缓存中由 UPDATE
STATISTICS 语句在
MEDIUM 或 HIGH 模式下生成。
onconfig.std 值
DS_POOLSIZE 127

正值 127 或更大的表示高速缓存中条目初始的最大数目的一半。
最大值依赖于共享内存配
置和可用的服务器实例的共享内存。
生效
编辑 onconfig 文件并重启数据库服务器之后。
当您通过运行 onmode -wm 命令增加内存中的该值时。
当您通过运行 onmode -wm 命令重置内存中的该值时。
用法
使用 DS_HASHSIZE 和 DS_POOLSIZE 配置参数来提高在多用户环境中频繁地运行查询的性
能。
高速缓存中的最初条目数是 DS_POOLSIZE 配置参数值的两倍。
例如,
如果 DS_POOLSIZE 配
置参数设置为 127,则在高速缓存中允许 254 个条目。 如果高速缓存中所有条目都满,
则高速缓存的大小自动地增长 10%。要减小高速缓存的大小,请降低 onconfig 文件中
DS_POOLSIZE 配置参数的值并重启服务器。
DS_POOLSIZE 配置参数设置在下列高速缓存中的条目数:

GBase 8s 管理员参考
南大通用数据技术股份有限公司 - 71 -

l 数据分布高速缓存
l 扩展类型名称高速缓存
l 扩展类型 ID 高速缓存
l GBase_85 cast 高速缓存
l 运算符类实例高速缓存
l 例程解析高速缓存
l 合计高速缓存
l 辅助瞬态高速缓存