返回首页

gbase数据、南大通用产品文档:GBase8c

更新日期:2024年09月11日

设置默认权限
GBase 8c 允许设置应用于将来创建的对象的权限,请参考ALTER DEFAULT
PRIVILEGES。

警,或恢复告警。

1.
词(Item):
也称为最小检索单位。在西文中,单词跟单词之间以空格分隔,检索的最小
单位就是一个单词。例如:“cat and mouse”,就是3 个词。对于多字节编
码的文字,
像中文,
因为词跟词之间没有明显的分隔符进行区分,
所以GBase
8a MPP Cluster 默认是以单个字为一个检索单位。例如“上海”,在全文检
索中默认是两个词,分别是“上”和“海”,搜索(上&海),此时上海和海上
都会命中,并且不保证两字紧邻,如需紧邻则需要显式的设置“上海”。分
析文本时,对于西文单词之间的空格、换行符会直接被过滤掉,不作为索引
词也不计算占用的位置。对于中文字符之间的空格,以及其他符号(像全角
的标点符号例如“”,。!;¥【】等符号,特殊字符例如#,*,$等)也进
行过滤,不作为索引词,但是建立索引时会记录这些符号所占用的位置,这
会影响词距。
2.
词序:
指两个词之间的前后顺序。在进行多个词查询的时候,需要指定查询的多个
词之间是有序查询还是无序查询,通过指定词序来过滤相关条件。例如要查
询无词序要求的“上海”,不仅能查出“上海”,还可查出“海上”。
3.
词距:
指两个词之间间隔单词数,
也包含被查询的首尾词。
例如:
“the black cat catch
white mouse”这段文字中要查询“cat mouse”,则词距就是4。对于中文来
说,则词距为两个汉字之间间隔的字符数(字符包含汉字、标点、空格、符
号等等,回车符略去不算)。例如“上周,我去海洋局开会...”这段文字要
查询“上海”,则词距为6,例如查询“售卖制作假文*#凭、发*票”的垃
圾短信中“文凭”,则词距为4。
4.
空格的特殊性:
计算词距时,中英文之间的空格处理不同,英文之间的空格作为分隔符会被
过滤掉而且不占位置,例如搜索“the great” 时这两个词的词距为2,而中
文之间的空格则会占位,例如搜索“天津”时,天津这两个字的词距为3,
跟无空格的“天津”是不同的。