返回首页

gbase数据、南大通用产品文档:GBase8a全文检索

更新日期:2024年09月11日

GBase 8a MPP Cluster 数据库支持全文检索,采用全单字索引方式,支持几乎所有
的语种,
并且可以保证100%的查询召回率。
结合GBase 8a MPP Cluster 独特的列存
储、压缩和智能索引技术,适合面向海量数据的检索查询应用。
主要功能包括:
建立索引与搜索

在GBase 8a MPP Cluster 中内嵌全文检索引擎,支持表中所有文本类型字段的
索引与查询;

支持参数化管理,索引建立、分词配置管理、索引维护、搜索等过程均可以通
过GBase 8a MPP Cluster 的标准配置文件来配置;

在GBase 8a MPP Cluster 中内嵌分词工具功能,以实现对文本列和搜索串的单
字切分,并能保证两者的切分规则和切分结果的一致性,防止由上下文语境导致的
切分不一致;

支持全文索引同步查询,在更新索引过程中可实现查询功能。新追加数据可分
批创建索引,当索引数据缓冲区中数据处理完成写到索引文件后,用户可立即搜索
到这些已创建索引的内容,而不是等所有新数据都建好索引之后才能查询;

支持数据库表中已建立全文索引列的词句逻辑表达式查询
(AND、
OR、
NOT)

NEAR 查询,并支持与非全文索引字段之间的逻辑组合查询。
支持DML

支持数据库表中字符数据类型列已建立的全文索引在线删除;

支持列数据UPDATE 后全文索引的同步更新。

GBase 8a MPP Cluster 产品手册
2 产品概述
文档版本953(2022-09-15)
南大通用数据技术股份有限公司
38
支持DDL

支持数据库表在建立全文索引列被删除后,索引自动失效;

支持数据库表重新命名后,索引不失效。

USRC_POOLSIZE 配置参数指定在 LBAC 凭证内存高速缓存的每一散列存储区中条目的最大
数。这个内存高速缓存持有关于用户 LBAC 凭证的信息。
onconfig.std 值
USRC_POOLSIZE 127

正值 127 或更大,表示高速缓存中条目的初始最大数目的一半。该最大值依赖于共享内存
配置和服务器实例的可用共享内存。
生效
编辑 onconfig 文件并重启数据库服务器之后。
当您通过运行 onmode -wm 命令增加内存中的该值时。

GBase 8s 管理员参考
南大通用数据技术股份有限公司 - 170 -

当您通过运行 onmode -wm 命令重置内存中的该值时。
高速缓存中条目的初始数目是 USRC_POOLSIZE 配置参数值的两倍。例如,如果
USRC_POOLSIZE 配置参数设置为 127,则该高速缓存中允许 254 个条目。 如果高速缓存
中的所有条目填满,则高速缓存大小自动地增长 10%。要减小高速缓存的大小,请降低
onconfig 文件中 USRC_POOLSIZE 配置参数的值并重启服务器。

dbload -e 选项使您可以指定在 dbload 终止前允许的坏行数。
如果将错误数设置为正整数,
那么当 dbload 读取
(错误数 + 1)
个坏行时
将终止。
如果将错误数设置为 0,
那么当 dbload 读取第一个坏行时就将终止。
如果 dbload 超过了坏行限制,并且指定了 -p 选项,dbload 在终止前将
提示您输入指令。提示将询问您是想回滚还是想落实自上一事务以后插入的所
有行。
如果 dbload 超过了坏行限制,但未指定 -p 选项,dbload 将落实自上一
事务以后插入的所有行。