返回首页

gbase数据、南大通用产品文档:GBase8a全文检索支持分词类型

更新日期:2024年09月11日

概述
索引的内容即文本字符串,是由一系列单词序列构成,包括中文、英文字母和数
字。
全文内置了两种分词方式:自然分词和多元分词。
同时对于英文字母可以设置是否区分大小写。
这些都通过配置文件设定,coordinator 和data 节点上的配置文件路径分别如下:
$GCLUSTER_HOME/lib/gbase/plugin/gbfti/cfg/GbaseCharExt.xml

GBase 8a MPP Cluster 产品手册
5 数据库管理指南
文档版本953(2022-04-10)
南大通用数据技术股份有限公司
929
$GBASE_HOME/lib/gbase/plugin/gbfti/cfg/GbaseCharExt.xml

同化HASHMAP:镜像表所属的两个VC 创建相同的hashmap:
1.
两个集群创建相同的distribution;
2.
初始化时创建相同的HASHMAP:
语法:
INITNODEDATAMAP FROM VC1;
示例:
INITNODEDATAMAP FROM VC1;
比如有两个VC,VC1 已经使用INITNODEDATAMAP 命令初始化过HASHMAP,
VC2 就可以使用INITNODEDATAMAP FROM VC1 来初始化HASHMAP,
这样VC1
和VC2 的HASHMAP 就会相同。

消息 Archive detects that page is corrupt 指示页面验证失败。如果收到该消息,您可以确定
具有毁坏页面的表。
在归档期间,数据库服务器将每页写入归档设备之前将对其进行验证。该验证将检查页上
的元素是否与期望值一致。对某页的这种验证失败时,与以下类似的消息将写
入 online.log 文件:
16:27:49 提出警告:归档检测到页面 1:10164 已毁坏。
16:27:49 人员:会话(5、gbasedbt@cronus、23467、10a921048)
线程(40、arcbackup1、10a8e8ae8、1)
文件:rsarcbu.c 行:2915
16:27:49 pid 23358 的堆栈跟踪已写入 /tmp/af.41043f4
16:27:49 另请参阅:/tmp/af.41043f4
16:27:49 归档检测到页面 1:10164 已毁坏。
16:27:50 rootdbs 的归档已完成,同时检测到 1 个受损页面。
检测到 10 个毁坏的页面后,归档停止。online.log 文件将显示详尽的错误消息,其中包括
前 10 个错误的页地址。随后,只将毁坏页的计数放入online.log 中。

GBase 8s 备份与恢复指南
南大通用数据技术股份有限公司 - 243 -

您接收到此消息后,通过检查 oncheck –pe 命令的输出来确定毁坏页属于哪个表。要确定
毁坏的范围,对该表执行 oncheck –cID 命令。
毁坏页被保存到备份介质上。在恢复期间,毁坏页以其毁坏的格式返回。毁坏页恢复时不
会向 online.log 写入错误消息,只有当归档时才写入。