返回首页

gbase数据、南大通用产品文档:GBase8a全文检索

更新日期:2024年09月11日

GBase 8a MPP Cluster 数据库支持全文检索,采用全单字索引方式,支持几乎所有
的语种,
并且可以保证100%的查询召回率。
结合GBase 8a MPP Cluster 独特的列存
储、压缩和智能索引技术,适合面向海量数据的检索查询应用。
主要功能包括:
建立索引与搜索

在GBase 8a MPP Cluster 中内嵌全文检索引擎,支持表中所有文本类型字段的
索引与查询;

支持参数化管理,索引建立、分词配置管理、索引维护、搜索等过程均可以通
过GBase 8a MPP Cluster 的标准配置文件来配置;

在GBase 8a MPP Cluster 中内嵌分词工具功能,以实现对文本列和搜索串的单
字切分,并能保证两者的切分规则和切分结果的一致性,防止由上下文语境导致的
切分不一致;

支持全文索引同步查询,在更新索引过程中可实现查询功能。新追加数据可分
批创建索引,当索引数据缓冲区中数据处理完成写到索引文件后,用户可立即搜索
到这些已创建索引的内容,而不是等所有新数据都建好索引之后才能查询;

支持数据库表中已建立全文索引列的词句逻辑表达式查询
(AND、
OR、
NOT)

NEAR 查询,并支持与非全文索引字段之间的逻辑组合查询。
支持DML

支持数据库表中字符数据类型列已建立的全文索引在线删除;

支持列数据UPDATE 后全文索引的同步更新。

GBase 8a MPP Cluster 产品手册
2 产品概述
文档版本953(2022-09-15)
南大通用数据技术股份有限公司
38
支持DDL

支持数据库表在建立全文索引列被删除后,索引自动失效;

支持数据库表重新命名后,索引不失效。

函数说明
返回字符串str 中在第count 个分隔符delim 之前的子串。
如果count 是一个正数,
返回从最后的(从左边开始计数)分隔符到左边所有字符;如果count 是负数,
返回从最后的(从右边开始计数)分隔符到右边所有字符。
示例
示例1:count 是正数,返回从分隔符“.”到左边的所有字符。
gbase> SELECT SUBSTRING_INDEX('www.gbase8a.com', '.', 2) FROM
dual;
+--------------------------------------------+
| SUBSTRING_INDEX('www.gbase8a.com', '.', 2) |
+--------------------------------------------+
| www.gbase8a
|
+--------------------------------------------+
1 row in set
示例2:count 是负数,返回从分隔符“.”到右边的所有字符。
gbase> SELECT SUBSTRING_INDEX('www.gbase8a.com', '.', -2) FROM
dual;
+---------------------------------------------+
| SUBSTRING_INDEX('www.gbase8a.com', '.', -2) |
+---------------------------------------------+
| gbase8a.com
|
+---------------------------------------------+
1 row in set

GBase 8a MPP Cluster 产品手册
5 数据库管理指南
文档版本953(2022-09-15)
南大通用数据技术股份有限公司
709

节点替换在执行过程可以通过执行replaceStop.py 来停止节点替换。若被停止的节
点替换同时替换多个节点,则会停止所有被替换节点的替换过程。
注意
节点替换过程中,由于一些软硬件异常、长时间不能完成节点替换操作等异常情况下,
才需要运行replaceStop.py 脚本停止替换节点操作。注意不能手动kill 节点替换相关的
进程停止节点替换。
命令格式
replaceStop.py --host=192.168.1.1 --type=data --dbaUser=gbase --dbaUserPwd=gbase
参数说明

--host:指定将要替换的节点ip 列表,用逗号分隔。

--type:被替换的节点类型,若替换数据节点,--type=data;若替换管理节点,
--type=coor;若替换同时存在coordinator 和data 服务的复合节点,则需要分别
替换管理节点服务和数据节点服务。

--dbaUser: 集群运行时使用的操作系统用户名。

--dbaUserPwd:操作系统DBA 用户的密码, 要求所有节点DBA 密码一致。
运行前提

集群有节点替换操作正在运行。

在正常可用的coordinator 节点上使用DBA 用户执行replaceStop.py 脚本。
运行结果
恢复集群模式为NORMAL ,节点状态不能回滚,所以节点状态可能为
UNAVAILABLE 或REPLACE。
示例
coordinator 节点替换过程停止:

在执行替换命令的节点上用DBA 用户执行下面命令,开始进行coordinator 节
点的替换;
./replace.py --host=192.168.6.108 --type=coor --dbaUser=gbase --dbaUserPwd=gba
se –overwrite --vcname=vc1

当打印出
“build data packet start”信息后表示正在进行打包,
此时在该节点上执
行命令,停止coordinator 节点的替换。

GBase UP 产品手册 4 管理员指南

文档版本04(2021-04-21) 南大通用数据技术股份有限公司 144
$ ./replaceStop.py --host=192.168.6.108 --type=data --dbaUser=gbase --dbaUserP
wd=gbase
Checking environment…
Stop python replace.py on host 192.168.6.186.
Stop install python scripts on host 192.168.6.108.
Stop gcadmin replacenodes on host 192.168.6.186.
Stop metadata sync on host 192.168.6.186, 192.168.6.193, 192.168.6.194, 192.16